百度文心大模型4.5系列模型正式开源:10款模型涵盖更多应用场景

标题:百度文心大模型4.5系列模型正式开源:10款模型涵盖更多应用场景

随着人工智能技术的飞速发展,百度文心大模型4.5系列模型正式开源的消息引起了业界的广泛关注。该系列模型涵盖了47B、3B激活参数的混合专家(MoE)模型,以及0.3B参数的稠密型模型等10款模型,实现了预训练权重和推理代码的完全开源。这一举措不仅彰显了百度在人工智能领域的实力,也为广大开发者提供了更多的应用场景和选择。

首先,让我们来了解一下文心大模型4.5系列开源模型的特点。据介绍,该系列针对MoE架构提出了一种创新性的多模态异构模型结构,适用于从大语言模型向多模态模型的持续预训练范式。这种结构在保持甚至提升文本任务性能的基础上,显著增强了多模态理解能力。此外,文心大模型4.5系列均使用飞桨深度学习框架进行高效训练、推理和部署,在大语言模型的预训练中,模型FLOPs利用率(MFU)达到47%。这一系列模型的优异性能主要得益于多模态混合专家模型预训练、高效训练推理框架和针对模态的后训练等关键技术点。

在文本模型方面,文心大模型4.5开源系列基础能力强、事实准确性高、指令遵循能力强、推理和编程能力出色。这使得该系列模型在多个主流基准评测中超越了DeepSeek-V3、Qwen3等模型。而在多模态模型方面,文心大模型4.5开源系列拥有卓越的视觉感知能力,同时精通丰富视觉常识,并实现了思考与非思考的统一。这使得该系列模型在视觉常识、多模态推理、视觉感知等主流的多模态大模型评测中优于闭源的OpenAI o1。尤其值得一提的是,在轻量模型上,文心4.5-21B-A3B-Base文本模型效果与同量级的Qwen3相当,而文心4.5-VL-28B-A3B多模态模型更是目前同量级最好的多模态开源模型,甚至与更大参数模型Qwen2.5-VL-32B不相上下。

此次百度一次性推出10款文心大模型4.5系列开源模型,在独立自研模型数量占比、模型类型数量、参数丰富度、开源宽松度与可靠性等关键维度上,均处于行业领先位置。这得益于百度在算力、框架、模型到应用的四层布局构建了明显的AI全栈技术优势。作为国内最早投入AI研发的企业之一,百度在深度学习框架、预训练大模型、多模态融合建模等方面拥有深厚的技术积累和丰富的实践经验。

值得一提的是,百度文心大模型4.5系列模型的权重按照Apache 2.0协议开源,这为开展学术研究和产业应用提供了广阔的空间。同时,基于飞桨提供开源的产业级开发套件,该系列模型广泛兼容多种芯片,降低了模型的后训练和部署门槛。飞桨是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台,其开源的产业级开发套件为开发者提供了开箱即用的工具和全流程支持。

总的来说,百度文心大模型4.5系列模型的正式开源,无疑将为开发者们带来更多的选择和可能性。该系列模型的优异性能和广泛的应用场景,将推动人工智能技术在各个领域的发展和应用。我们有理由相信,随着百度在人工智能领域的不断深耕细作,我们将迎来更加智能、便捷、美好的未来。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2025-06-30
百度文心大模型4.5系列模型正式开源:10款模型涵盖更多应用场景
标题:百度文心大模型4.5系列模型正式开源:10款模型涵盖更多应用场景 随着人工智能技术的飞速发展,百度文心大模型4.5系列模型正式开源的...

长按扫码 阅读全文