综合《科技日报》等消息,北京中科凡语科技有限公司牵头的“高鲁棒性飞译翻译平台”项目、中科凡语(武汉)科技有限公司参与的“大规模多模态预训练模型的研发与行业应用”入围工信部“2021年人工智能产业创新任务揭榜挂帅项目”立项名单。
高鲁棒性飞译翻译平台
优胜揭榜单位为:
北京中科凡语科技有限公司
中国科学院自动化研究所
由北京中科凡语科技有限公司牵头、中国科学院自动化研究所参与的“高鲁棒性飞译翻译平台”项目,围绕“如何实现跨语言跨领域的知识迁移、如何构建鲁棒性训练与解码模型以及如何打造多语言通用翻译引擎等核心技术”等业界难题,进行创新研究,打造了多语种、多模态、多领域的飞译翻译平台。
针对低资源小语种场景,飞译平台发展多语言预训练技术,利用海量多语言数据构建超大规模通用机器翻译引擎,探索跨领域跨场景知识迁移和多类型、多粒度抗噪方法,复杂文档翻译方法,提升机器翻译鲁棒性,并最终实现至少10家国防、政府相关单位应用落地,在2套国产化平台上进行系统适配。
大规模多模态预训练模型的研发与行业应用
优胜揭榜单位为:
中国科学院自动化研究所
中移系统集成有限公司
中科凡语(武汉)科技有限公司
由中国科学院自动化研究所牵头,中科凡语(武汉)科技有限公司等参与的“大规模多模态预训练模型的研发与行业应用”项目,聚焦大规模多模态预训练模型的研发与行业应用,以自主可控基础软硬件平台为基础,突破不同领域的共性平台技术,实现万亿级参数量规模的大模型分布式训练,构建覆盖多语种文本、语音、图像、视频的多模态预训练大模型,通过在工业、医疗、城市、金融、物流、科学研究等行业领域开展典型应用示范,改变当前单一模型对应单一任务的人工智能研发范式,推动我国人工智能研发规则产生重大变革。
此前,中国科学院自动化研究所等已经以昇腾AI基础软硬件平台为基础,与武汉市东湖高新区深度合作,依托武汉人工智能计算中心,研发了面向超大规模模型的高效分布式训练架构,在图、文、音三个基础模型上加入跨模态编码和解码网络,利用昇思MindSpore AI框架打造了全球首个千亿参数三模态大模型“紫东太初”。
“紫东太初”大模型开拓性地实现了图-文-音语义统一表达,首次实现了“语音生成视频”的功能,迈出朝向人工智能通用化的关键一步。并依托紫东太初大模型研发了跨模态通用人工智能平台,打造了多模态人机对话机器人“小初”,兼具图文音的理解、推理和生成能力,具有图像生成、智能问答、语音识别、文字识别、视频生成、视频描述、智能翻译等 30多项功能。目前,“紫东太初”已经与浙江移动、长安汽车、魏桥创业、爱奇艺、新华社技术局和美亚大千等行业领军企业合作,共同探索了丰富的应用落地场景。
此次由工业和信息化部举办的“人工智能产业创新任务揭榜挂帅项目”旨在面向全社会遴选掌握关键核心技术、具备较强创新能力的企业和科研机构,发掘培育一批人工智能领域的优势单位,突破一批标志性技术产品,加速新技术、新产品落地应用。
中科凡语凭借深厚的技术积累与强大的创新能力,对目前机器翻译、大规模预训练所面临的难题提出多项解决策略,突破了国外企业在机器翻译领域的技术垄断、探索了丰富的应用落地场景,推动我国人工智能研发规则产生重大变革。