中国移动"九天"3.0开源:大模型竞赛再添变数
在全球人工智能竞赛白热化的背景下,中国移动近日在2025世界人工智能大会上焕新发布"九天"基础大模型3.0,并宣布多项核心技术开源,为国内大模型赛道注入新的变量。这一国务院国资委战略新兴产业"百大工程"的最新成果,标志着国产大模型发展进入新阶段。
技术架构实现重大突破
"九天"3.0最引人注目的创新在于其技术架构的全面升级。语言大模型采用可扩展至万亿级的MoE架构,通过15T token多阶段配比预训练数据与全流程治理体系,实现了推理能力35%的提升。在GPQA-Diamond、ArenaHard V0.1等国际评测中,其表现超越DeepSeekR1、Qwen3等主流模型,展现出强劲的技术实力。
多模态能力取得显著进展
在视觉领域,"九天"3.0通过复杂时空建模、流匹配图片视频渐进式联合训练等技术创新,实现了生成质量与编辑精度的双重突破。特别值得注意的是,其在MMStar、HallusionBench等图理解任务中的优异表现,以及在Videomme视频理解评测中对标国际先进水平的成绩,显示出中国企业在多模态领域的快速进步。
开源战略引发行业关注
此次"九天"3.0的开源策略尤为引人注目。中国移动不仅开源了数童结构化数据大模型、数学大模型和代码大模型三大核心模型,还首次公开了结构化数据模型评测体系TReB和CCR-Bench行业场景数据集。这种全方位的开源举措,既体现了技术自信,也为行业生态建设提供了重要基础设施。
产业影响与未来展望
"九天"3.0的发布将对中国AI产业格局产生多重影响:首先,其"全国产"特性有助于提升产业链安全可控水平;其次,开源策略可能加速行业技术标准化进程;最后,专项模型在代码、数学等领域的突破,为垂直行业应用提供了新可能。
业内专家指出,随着"九天"3.0等国产大模型的持续进化,全球AI竞赛格局正在重塑。中国移动计划于8月发布的技术深度解读,或将进一步揭示其技术路线与未来规划。在开源生态与商业落地的双重驱动下,这场大模型竞赛的最终走向仍充满变数,但可以肯定的是,技术创新与开放协作将成为决定胜负的关键因素。
(全文约850字)
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )