百度吴甜:今年是AI大模型落地关键年

来源:TechWeb 2022-05-27 17:59:57  阅读量:15355   

最近几天,百度飞桨文心全景升级,模型层一次性发布10个大模型让这一步成为热门AI大模型话题成为业界焦点

文新发布的十大模型包括两大行业模型:文新联合国内电网开发的知识增强的能源行业NLP大模型,国家电网—百度middot心Ldquo,由联合上海浦东发展银行开发的具有增强知识的金融行业NLP模型,浦发—百度middot心,并且有八大文学基础和任务模型,包括:整合任务相关知识的千亿模型ERNIE 3.0 Zeus,多任务视觉表征学习的VIMER—UFO 2.0,商品图形搜索表征学习的VIMER—UMS,文档图像表征学习的VIMER—StrucTexT 2.0ERNIE—SAT,ERNIE—GeoL,语音和语言的跨模态模型,生物计算领域蛋白质结构分析的HELIX—GEM和HELIX—Fold

百度集团副总裁,深度学习技术与应用国家工程研究中心副主任吴添表示,AI大模型经历了前几年的探索期和突破期,现在某种程度上已经到了推广期今年是大模式落地的关键一年

AI大模型落地的关键

吴添认为,从应用落地的角度来看,大模型落地最关键要解决的问题是前沿技术用真实应用场景之间的差距如何匹配应用落地的全方位要求这是今年AI大模型需要解决的核心问题

从百度多年来对大模型技术的推动来看,我们认为需要在这三个方面做好工作,吴添说,第一,大模型本身需要系统化,这个大模型系统可以和应用场景对接,第二,平台和工具可以适应落地应用所需的工作和方法论能够全流程,端到端的支持整个落地应用,在场景中发挥大模型的能力,第三,需要有一个生态的支撑,包括应用生态,硬件生态的建设等等总的来说,在lsquo构建更适合场景需求的大模型体系,提供全流程支持应用的工具和方法,构建激发创新的开放生态rsquo这三个方面都需要拓展和开展

不是大型号全拿走吧

百度的想法并不是一个大的AI模型就能包揽所有的问题飞桨模型包括三类模型:基础模型,任务模型和行业模型

其中以厄尼为代表的基础大模型基本模型具有学习数据量大,参数规模大的特点,通用性最高但直接使用基础模型,往往与场景中苛刻的应用需求有一定差距

因此,在通用基础模型中增加了两类模型:任务模型和行业模型。

大任务模型主要面向具体任务,如NLP领域的信息抽取,对话与搜索,视觉领域的商品图形搜索,多任务统一表示等。

与行业结合,推出行业大模型,以通用大模型为基础,从海量,广泛的数据中挖掘行业领域数据,与行业头部企业或机构合作,引入行业特色数据和知识,让通用大模型充分学习,进一步提升大模型的行业应用能力,为行业头部企业构建更适合行业场景的AI基础设施,共同推动大模型的深度应用。

吴添道:这三层模型的结合,使得文心大模型不仅拥有强大的基础大模型,任务问题的专有大模型,更适合行业场景的行业大模型,具备可与场景结合的综合模型能力。

同时,为了充分发挥大模型在应用场景中的价值,以更低的门槛支持用户,文心大模型搭建了配套工具和平台,包括对抗学习,小样本学习等多种微调方法和高性能部署方案,全面提供大模型使用中所需的各种数据预处理工具,降低数据处理门槛。

吴添介绍,一方面,文新已经广泛应用于百度内部的各种产品比如搜索场景已经充分利用了基于文心厄尼的模型,为文心收获了很多反馈,另一方面,通过生态百度AI云的业务,文心持续与大量行业客户和合作伙伴合作,并得到反馈和优化未来,文心大模型将继续降低应用门槛,推动行业智能化升级,让人工智能技术惠及每一个人

声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。

猜你喜欢

300

热门文章