阿里巴巴、智源研究院、清华大学、中国科学院等联合发布国内最大预训练AI模型“文汇”
近日,阿里巴巴、智源研究院、清华大学、中国科学院等联合研究团队发布面向认知的超大规模新型预训练模型“文汇”,旨在探索解决当前大规模自监督预训练模型不具有认知能力的问题。该模型不仅能提升AI的理解能力,还可基于常识实现AI创作,未来将应用于文本理解、人机交互、视觉问答等场景。(36氪,01/12)
_智源研究院院长、北京大学计算机科学技术系主任*铁*表示,此次发布的是“文汇”(面向认知的超大规模新型预训练模型)的一期研发成果,用于自动生成图片、文字以及视频,可具有初级认知能力。“文汇”模型针对性地设计了多任务预训练的方法,可以同时学习文→文、图→文以及图文→文等多项任务,实现对多个不同模态的概念理解。经过预训练的“文汇”模型不需要进行微调就可以完成“用图生文”等任务,对模型进行微调则可以灵活地接入如视觉问答、视觉推理等任务。(刊载于智源研究院