华为云新一代昇腾AI云服务:打破AI算力限制,全对等互联引领云端AI新时代

打破AI算力限制,全对等互联引领云端AI新时代

在今日的华为开发者大会2025(HDC 2025)上,华为云新一代昇腾AI云服务无疑成为了焦点。基于CloudMatrix384超节点的新一代昇腾AI云服务全面上线,为大模型应用提供了“澎湃算力”,标志着AI算力限制的打破,全对等互联引领云端AI新时代。

随着大模型训练和推理对算力需求的爆炸式增长,传统计算架构已难以支撑AI技术的代际跃迁。华为云新一代昇腾AI云服务基于CloudMatrix384超节点,首创将384颗昇腾NPU和192颗鲲鹏CPU通过全新高速网络MatrixLink全对等互联,形成一台超级“AI服务器”。这一创新性的架构,实现了单卡推理吞吐量跃升到2300Tokens/s的惊人成绩。

CloudMatrix384超节点架构的优势在于其强大的性能和灵活性。它能够更好地支持混合专家MoE大模型的推理,实现“一卡一专家”,一个超节点可以支持384个专家并行推理,提升效率。同时,超节点还可以支持“一卡一算力任务”,灵活分配资源,提升任务并行处理,减少等待,将算力有效使用率(MFU)提升50%以上。

与新浪的合作,基于CloudMatrix384昇腾AI云服务,为“智慧小浪”智能服务体系构建了统一的推理平台。通过软硬协同调优,NPU利用率提升超过40%,使得新浪能够为数百万用户高效提供推理服务,模型上线速度成倍加快。

在科研领域,中国科学院基于CloudMatrix384超节点打造了自己的模型训练框架,快速构建了中国科学院AI forScience科研大模型,这是对摆脱国外高性能AI算力平台依赖的重要一步。这一创新性的尝试,无疑将推动我国科研领域的发展。

在互联网领域,360打造的纳米AI搜索,为用户提供超级AI搜索服务,也已开启了CloudMatrix384超节点的测试。随着云计算和AI技术的融合,未来纳米AI搜索将为用户带来更加智能、高效的搜索体验。

总的来说,华为云新一代昇腾AI云服务无疑为AI开发者们提供了一个全新的平台。它打破了AI算力的限制,引领了云端AI的新时代。通过全对等互联的架构,昇腾AI云服务能够更高效地处理大规模模型训练和推理任务,提升资源利用率和交付效率。这种创新的云服务模式,将为华为云带来更多的市场份额,也将为整个AI生态带来巨大的推动力。

我们期待着华为云新一代昇腾AI云服务在未来的表现,相信在不断的创新和发展中,它将为全球的AI开发者提供更强大、更灵活、更高效的云端AI算力,推动人工智能技术的进一步发展。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

赞助商
2025-06-20
华为云新一代昇腾AI云服务:打破AI算力限制,全对等互联引领云端AI新时代
打破AI算力限制,全对等互联引领云端AI新时代 在今日的华为开发者大会2025(HDC 2025)上,华为云新一代昇腾AI云服务无疑成为了焦点。基...

长按扫码 阅读全文