中国联通发布全球最长距离大模型异构混训成果

7月19日,在2025中国联通合作伙伴大会期间,中国联通研究院联合上海人工智能实验室等合作伙伴,正式发布了全球最长距离大模型异构混训试验成果,向业界展现了中国联通在智算网络关键技术领域的里程碑,为智算产业的高质量发展注入新范式。

随着人工智能技术的高速发展和大模型时代的加速来临,模型训练对算力基础设施的高吞吐、低时延、高性能提出了更高要求。然而,当前算力资源呈现出异构化和多中心化的格局,面临着跨域资源互联互通机制不健全、长距离传输存在带宽与时延瓶颈、异构资源统一调度与高效融合能力有限等挑战。

在此背景下,中国联通联合上海人工智能实验室,阿里云、浪潮、基流科技、加佳科技等行业合作伙伴,面向国产异构GPU环境,针对超大模型跨域训练和碎片化算力整合需求,依托“算力智联网AINet长距无损传输技术优势结合上海人工智能实验室“DeepLink” 超大规模跨域混训技术方案,在上海临港和山东济南鲍山数据中心间构建长度超1500公里的跨域异构混训系统;通过自动调整多种并行策略和跨域收敛比下MoE模型和Dense模型的参数配置,完成了1500公里跨域的千亿参数AI大模型异构混训试验经验证等效算力可达单芯片单集群等效算力的95%以上在算力互联层面,采用联通自研内置长距RDMA协议栈的RoCE交换机,兼顾DC内和DC间高性能网络需求;在算力调度与资源管理层面,通过联通“智驭”平台实现对跨域网络和集群的统一管控及任务调度;在算力协同层面,基于DeepLink在训练加速、异构通信、并行策略等核心技术,实现千亿参数大模型在超长距离异构GPU环境下的高效训练。

上述成果标志着中国联通在算力基础设施跨域协同调度、异构资源融合与高性能分布式训练等关键领域实现了实质性技术突破,为下一代互联网产业发展奠定坚实基础。面向未来,中国联通将锚定“世界一流科技服务企业”战略目标,持续深耕智算基础设施和下一代互联网领域关键技术,携手产学研用各界合作伙伴,从组网、协议、管控等方面,共同推动智算网络核心技术突破、前沿应用场景落地与生态体系建设。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2025-07-19
中国联通发布全球最长距离大模型异构混训成果
中国联通发布全球最长距离大模型异构混训成果,7月19日,在2025中国联通合作伙伴大会期间,中国联通研究院联合上海人工智能实验室等合作伙伴,正式

长按扫码 阅读全文