2023-06-14
近日,ICDAR 2023多项赛事落下帷幕,来自CVTE中央研究院的文档图像分析与识别团队喜提多项任务冠亚军!
ICDAR(International Conference on Document Analysis and Recognition,国际文档分析与识别会议)是文档图像分析领域最重要的国际会议之一。今年ICDAR设立了十余项竞赛,吸引了来自谷歌、亚马逊、百度、阿里、腾讯、北京大学、清华大学等诸多国内外顶级科技公司和知名高校参加。此次大赛中,CVTE团队在BDVT-QA的端到端视频文字识别任务中获得第一名(V-DA),在CROHME手写公式识别赛事的三项任务——在线公式识别(On-line recognition)、离线公式识别(Off-line recognition)、双模态公式识别(Bimodal recognition)均获得第二名(YP_OCR)。
·全国知识图谱与语义计算大会 评测任务:面向音乐领域的命令理解任务(第3名,2018)
·阿里天池:“数智教育”数据可视化创新大赛(第1名,2019)
·ACM MM Challenge AI Meets Beauty(第3名,2019)
·阿里天池:第二届海南大数据创新应用大赛-智能算法-简历解析赛(第5名,2020)
·2021 年讯飞 AI 开发者大赛-试题标签预测挑战赛(第2名,2021)
·CCL 2022汉语学习者文本纠错竞赛(赛道一第3名、赛道四第2名,2022)……
此外,中央研究院也会通过参赛对未来技术进行储备和验证,今年中央研究院数据挖掘团队(CVTEDMer)参与了华为因果推理挑战赛(PCIC),经过线上筛选和决赛答辩最终取得线上第1名、决赛答辩总成绩第2名的好成绩。本次参赛的模型可基于当前业务进行未来规划,根据产品的使用情况预测故障、做好解决预案。
近些年来手势控制依靠自然、高效、便捷的优势不断出现在各类操作应用中,消费者们尤其赞赏手势隔空操作、不直接接触物体的安全特性。中央研究院依靠研究优势对手势交互进行深度研发,力求应用在更多场景、领域、设备中,刷新人们对于多模态的交互体验。视觉是人类的重要知觉——可以感知环境、识别手势、辨别面部表情,进行眼动追踪等,CVTE中央研究院视觉研究以“看清世界 看懂世界”为愿景,在医学影像、3D场景感知、虚拟人、情感智能等垂直领域进行深度探索,致力打造更加多元化的视觉研究和应用。
在语音交互赛道,我们结合业务场景对拾音模块进行深入研究,显著提升课堂和会议场景下的音频拾音质量;通过对语音识别和语义理解方向的研究实现了技术方案平台化,可为各类智能终端设备提供更便捷且睿智的语音交互。
依托于中央研究院对于基础技术及应用技术的深层次研究和实践经验,当前已在多个新兴领域进行战略孵化。我们寄望中央研究院的研究成果和创新思维在未来孵化出更多新兴业务,培养新一代科学家、企业家。更广的布局下我们也期待更多富有想象力和研究实力的小伙伴加入,壮大中央研究院,
通过科技孵化出更多业务,将梦想变成现实。
CVTE始终在积极营造进取、包容和开放的科研环境,紧跟前沿技术的趋势,大力推进研究成果在未来教育、企业服务、智能硬件、健康医疗等领域的落地转化,期待充分实现技术的产业价值和社会价值,CVTE也将继续秉持科技创新赋能的信念,让因我们的存在让更多人事业有成,生活幸福的使命愈发鲜活。