近期大火的罗永浩数字人受到行业热议,其神形音容与真人无异,直播首秀创1300万人次观看、GMV5500万元的行业纪录。这背后的技术支持,与百度文心大模型密不可分。今年文心大模型动作不断,昨日正式开源了文心大模型4.5系列。但此次开源其实并不突然,早在今年2月,百度就已预告了文心大模型4.5系列的推出计划,并明确将于6月30日起正式开源。
据介绍,此次文心大模型4.5开源系列,涵盖47B、3B激活参数的混合专家(MoE)模型,与0.3B参数的稠密型模型等10款模型,预训练权重和推理代码完全开源。开发者可在飞桨星河社区、HuggingFace等平台下载部署使用,也可在百度智能云千帆大模型平台使用开源模型API服务。
评测显示,文心大模型4.5开源系列在多个文本和多模态基准评测中实现SOTA。文心大模型4.5开源系列在视觉常识、多模态推理、视觉感知等多个多模态大模型评测中优于闭源的OpenAI o1;轻量级模型也能以小搏大,文心4.5-VL-28B-A3B多模态模型是目前同量级最好的多模态开源模型,甚至与更大参数模型Qwen2.5-VL-32B不相上下。
AI数字人在今年成为爆发式增长的AI应用,离不开多模态大模型的快速发展。以百度为例,上半年连发4款文心大模型,包括首个多模态基础大模型文心4.5和效果更好、成本更低的多模态大模型文心4.5T。基于多模态大模型,百度发布了高说服力数字人,其形神音超拟真、内容更专业,效果媲美真人。IDC报告显示,目前百度居中国AI数字人市场份额第一。
百度多个AI应用产品基于今年持续迭代的文心大模型大幅提升功能与使用量。近期,百度智能代码助手文心快码发布独立IDE,为行业首个多模态交互、多智能体协同AI IDE;文小言升级多模型调度、图片问答等能力;百度文库、网盘今年已连续推出具备全模态内容输入输出的内容领域操作系统、AI相机等应用产品。最新财报显示,百度文库AI MAU已达9700万,为国内月活用户规模最大的AI应用产品之一;一季度,智能体为客户创造的收入同比增长30倍。
而伴随着文心大模型开源,百度AI应用规模化落地和大模型生态构建无疑将获得更大助推。近期李彦宏表示,开源有助于扩大新技术的采用率,他强调无论开源、闭源,基础模型只有解决现实问题,才具备真实价值。他今年提出的多个预判“数字人将成2025突破性应用”、“2025会是智能体爆发元年”也将因开源加速变成现实。
免责声明:投资有风险,本文并非投资建议,以上内容不应被视为任何金融产品的购买或出售要约、建议或邀请,作者或其他用户的任何相关讨论、评论或帖子也不应被视为此类内容。本文仅供一般参考,不考虑您的个人投资目标、财务状况或需求。TTM对信息的准确性和完整性不承担任何责任或保证,投资者应自行研究并在投资前寻求专业建议。