当前位置:首页 > 新闻动态 > 大模型训练 >

百度CTO王海峰:以飞桨为基攀登大模型技术高地

  • 发布时间:2024-05-18
  • 来源:科记说

人工智能已经成为新一轮科技革命和产业变革的重要驱动力量。在近日举办的中国自动化大会上,百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰受邀做了《AI大生产平台》主题报告,阐述了百度飞桨及文心大模型在AI大生产阶段如何大幅降低应用门槛、助力AI普惠。

深度学习平台作为AI基础设施平台,下接芯片、上承应用,被视为“智能时代的操作系统”。百度飞桨是我国首个自主研发的产业级深度学习开源开放平台。

王海峰介绍,飞桨在开发核心框架、端到端自适应分布式训练技术、训推一体工具链、硬件适配统一方案、模块化的产业级模型库等方面持续创新,大幅降低开发、训练和部署成本,提升全链条效率。

基于飞桨,深度学习技术研发的全流程具备了显著的标准化、自动化和模块化的工业大生产特征,持续降低应用门槛,让人工智能技术可以高效便捷地应用于各行各业。目前,飞桨已凝聚477万名开发者,服务了18万企事业单位,创建了56万个模型,得到社会各界广泛认可,AI生态日渐繁荣。

除了在产业端积极释放平台价值之外,飞桨还与高校、科研院所等通力合作,助力复合型的AI人才培养;在硬件生态方面,飞桨与硬件伙伴的合作也在不断深化,目前飞桨已经适配了国内外的各类主流芯片/IP超过30种,还推出了厂商版飞桨框架、建设模型库、开发课程,更好地服务开发者,促进生态繁荣共赢。

基于飞桨,百度进一步攀登预训练大模型的技术高地,打造了文心产业级知识增强大模型,能从大规模知识和海量数据中融合学习,持续降低AI开发与应用门槛。

如果按传统方法,针对不同的任务,比如信息抽取、情感分析、问答等,需要训练不同的模型,这是一种分散化的模型开发模式;而大模型是集约化的模型开发模式,具有很好的通用性和泛化性。

具体来看,大模型是人工智能预训练大模型的简称,包含了预训练和大模型两层含义,二者结合产生了一种新的人工智能模式,即模型在大规模数据集上完成了预训练后无需微调,或仅需要少量数据的微调,就能直接支撑各类应用。大模型作为人工智能新基建领域新兴并快速发展的热点方向之一,近年来参数规模和模型性能不断创出新高,逐步夯实了人工智能技术底座。

王海峰介绍,在飞桨训练推理一体技术的有力支撑下,目前百度文心家族已经发布了20多个大模型,除了以鹏城-百度·文心为代表的基础通用大模型外,还包括联合国网、浦发研制的国网-百度·文心和浦发-百度·文心,以及联合中国航天研制的航天-百度·文心大模型等行业大模型。目前文心大模型已在能源、航天、农业、银行等多个行业落地,实现了高效生产并真正为产业所用。

王海峰表示,在未来广阔的AI工业大生产图景中,基于飞桨平台和文心大模型,AI开发和应用门槛不断降低,人人都可以成为智能应用的开发者。AI大生产平台正在赋能千行百业,惠及千家万户。