(资料图片)

让计算机“以文搜图”“以文生视频”,甚至根据唐诗宋词“以文生音”。在武汉,多模态大模型就能帮助人工智能像人类大脑一样发动所有“感官”去“感受”并输出。

近期,武汉人工智能研究院宣布,联合中科院自动化所、华为正在打造“紫东太初”2.0全模态大模型。该大模型是在全球首个千亿参数三模态大模型“紫东太初”1.0基础上升级打造的2.0版本,未来可实现文本、图片、音频、视频、3D等不同模态的统一表征和学习。这为武汉发展人工智能应用,提供了无限的想象空间。

去年,武汉获国家支持创建“国家人工智能创新应用先导区”。今年年初,《武汉建设国家人工智能创新应用先导区实施方案(2023—2025年)(征求意见稿)中,就提出,武汉要“构筑大模型应用创新高地”,并提出“形成全球领先的跨模态理解与生成能力”。

据不完全统计,截至目前,中国已有超过40家公司、机构发布了大模型产品或公布了大模型计划。武汉在这一版图上也占有一席。获得2022世界人工智能大会最高奖“卓越人工智能引领者奖”的全球首个三模态大模型“紫东太初”,就是中国科学院自动化研究所和华为在汉联合开发的,这一大模型应用了武汉人工智能计算中心的算力,并在汉孕育武汉人工智能研究院。

中科院自动化所“紫东太初”大模型研究中心常务副主任、武汉人工智能研究院院长王金桥介绍,武汉提出,基于大模型支持工业质检、影视创作、智慧医疗、互联网推荐、智能驾驶等场景应用,构建产业创新生态,而这正是“紫东太初”大模型擅长的。

例如在工业检测领域,利用AI检测算法可增强检测的客观性、提高检测效率,实时检测促使实时纠正。在智慧交通领域,利用多模态感知数据以及各个路口控制的信号,可以实现路网三模态数据的优化和决策,使道路通用率提升30%,助力武汉智慧交通再升级。

王金桥介绍,产业应用层面,围绕多模态大模型技术及应用,武智院联合中科院自动化所打造的多模态人工智能产业联合体已陆续吸纳产学研各界近70家成员单位,共同探索通用人工智能产业化路径。

编辑:赖俊

【来源:武汉市人民政府网_武汉要闻】

版权归原作者所有,向原创致敬

推荐内容