华为王庆文：打造坚实算力底座，加速AI赋能千行万业

5月20日消息（九九）5月17日，2025世界电信和信息社会日“智算产业创新发展论坛”在南昌举办，华为昇腾计算业务副总裁王庆文在演讲中指出，大模型的性能在很多方面已经可以与人类媲美，并且在快速收敛，从原来的千模百态收敛到十来家，随着推理成本的大幅下降开始在很多行业获得应用，为医疗诊断、工业质检、AI教学等方面带来卓有成效的提升。

Gartner预测，未来两年80%中国企业将部署生成式AI，60%会将AI融入产品服务，标志着企业AI应用从通用场景向核心生产场景渗透的“奇点时刻”到来，企业AI部署已进入全面深化阶段。

王庆文进一步指出，运营商凭借领先的泛在多级训推资源，既能满足中小企业的灵活需求，也能支撑大型企业核心业务及海量用户场景，并通过多租户部署技术，保障大租户资源独立、中小租户性能提升的同时全方位确保数据安全。

王庆文介绍，昇腾从基础硬件、算子到推理系统全面创新，面向不同的推理场景需求，为包含运营商在内的客户及伙伴提供集高性能、高可靠、易部署、开源开放于一体的推理解决方案。

面向大型企业、C端超级应用等需要大规模推理算力资源的场景，高并发、低时延下的吞吐性能是关键。昇腾国内首创大规模专家并行集群推理方案：通过将MoE模型的多专家权重数据分散部署到更多的卡上，降低单卡权重加载时延，让模型解码输出更快；单卡内存容量占用的降低，也能够支持更大用户并发所需的KV缓存，实现系统的更大吞吐性能，平均单卡吞吐性能提升3倍以上，大幅降低每Token推理成本，帮助运营商构筑高性能的AI算力基础设施，为行业客户带来更优的业务体验。

面向中小企业、学校和医院等机构需要快速部署、快速落地AI应用的需求，昇腾使能运营商打造大模型应用一体机。打包量化、调优等工具链显著提升50%部署效率，通过MLA（Multi-Head Latent Attention）亲和等特性，提升吞吐性能90%，从模型部署到应用上线实现“即开即用”，降低AI部署门槛，帮助运营商赋能千行万业智能化转型。目前已有超140家合作伙伴基于昇腾发布大模型应用一体机产品，为各行业场景提供广泛的智能应用。

演讲的最后，王庆文表示，昇腾将致力于打造坚实的算力底座，携手运营商及ISV等产业伙伴破解算力供给与场景落地的关键挑战，加速AI在千行万业的落地应用，为产业融合升级注入强劲动能。

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，应及时向本网站提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后，将会依法尽快联系相关文章源头核实，沟通删除相关内容或断开相关链接。

华为王庆文：打造坚实算力底座，加速AI赋能千行万业

下一篇