英伟达禁令之后,中国AI计算何去何从?

10月17日,美国加强了面向中国市场的AI芯片禁令。其中明确将性能、密度作为出口管制标准,将单芯片超过300teraflops算力,以及性能密度超过每平方毫米370 gigaflops的芯片都纳入了禁止出口行列。

虽然在这一禁令下,AMD、英特尔等公司提供的高端AI芯片也受到影响。但由于英伟达在全球AI芯片领域一家独大,本次禁令涉及A100、H100等主流AI训练用英伟达GPU,因此这次的芯片禁令也被称为“英伟达禁令”。

消息一出,立刻引起了AI产业的热议。但讨论大多集中在禁令何时施行,是否有缓冲地带,具体涉及哪些GPU型号,禁令期限是多久等。这就导致一个显而易见的宏观背景被忽略了:自贸易摩擦发生以来,中美经贸关系虽然时有波动,但面向中国的芯片管控却始终有增无减。尤其是高端AI芯片禁令,在诸多争议中依旧被坚定推行。

至此,AI行业似乎已经必须形成一个基本的共识:抛弃幻想,准备斗争。

与其斤斤计较哪些GPU被禁,是否有解禁可能。不如重新审视在芯片铁幕时代下,中国AI计算究竟何去何从?

本文希望从目前的产业局面出发,和大家一起思考AI计算的前行之路。

目前的局面

首先我们必须了解一个问题,那就是为什么这次英伟达禁令出台之后,大众舆论与AI行业的反应都没有18、19年芯片封锁刚开始时严重。似乎只有在消费级显卡RTX 4090是否被禁问题上,引发了游戏玩家和相关商家的一些争论。

这背后的宏观逻辑在于,行业是非常不愿意看到高端AI芯片被禁售的,但其实也对这种局面早有预料。一方面是美国对华芯片封锁推动多年,此前英伟达部分高端GPU已经被禁,产业界的反馈早就从惊愕调整为了泰然处之。加上ChatGPT爆火之后今年全球高端GPU行情陡然看涨,随之而来的是美国方面屡次表态要推动对华整体性的高端AI芯片禁售。虚虚实实几个月之后,最终落下一锤也不外如是。

为了应对这次可预见的禁令,同时也有大模型发展的客观推动,去年年底到今年上半年大量中国科技、金融、汽车等领域的企业集中囤货英伟达高端GPU,已经造成了市面上一卡难求的局面。换句话说,对于很多中国中小型科技企业、AI创业公司来说,高端GPU本就买不到,禁售之后并没有太多改变。

另外一个真实情况是,高端AI芯片并非无法国产化。早在18、19年贸易摩擦开始之后,国内AI芯片产业加速发展。这就导致在AI训练需求上,英伟达高端GPU虽然很难被替代,但并非不可替代。

加上AI芯片并不像手机芯片那样事关大众消费者,且华为已经在手机芯片上完成了突破。种种迹象合在一起,导致无论是大众还是行业,都对这次禁令产生了一种坦然,甚至有点见怪不怪的心态。

但必须客观看到的是,这次禁令绝非对中国AI行业没有伤害。一方面短期内更换英伟达GPU,无论在芯片产能、生态兼容性等问题上都非常困难。并且禁令还将直接在AI服务器等领域,给大规模使用英伟达产品的厂商造成伤害。

而更关键的问题在于未来,如果禁令长期存在,中国AI计算将逐渐与全球高端芯片脱钩,那么可能带来的长期负面影响是非常复杂的,比如说:

1.英伟达高端GPU代表的AI芯片在更新迭代之后,是否会造成中国AI算力的发展脱节?

2.底层算力出现发展分歧后,中国AI产业是否会在大模型等软件技术发展中掉队?

3.本次AI芯片禁令,已经呈现出大规模封锁的特征。这种科技封锁真的只会停留在AI芯片领域吗?通用算力、存储、基础软件等数字化基础能力是否将成为接下来的打击目标?

总而言之,这次的AI芯片禁令,对中国来说是一次有准备的博弈,而非一场奇袭。想要成功度过这一关,也需要将手中的每一张牌都打好,打出配合,从而降低伤害烈度,提升长期发展的胜率。

而就目前来看,中国AI计算有三项必须同时发力的“突围方案”。

方案1:用好“买家”身份

有个简单的道理,商业市场的行为逻辑是由供需决定的。但在以芯片为代表的中美科技贸易中,我们经常会陷入一个思维误区:认为绝大部分游戏规则是由美国政府和企业制定的,他们想卖我们就买,他们不想买我们就无奈。

作为全球芯片市场的最大“买家”,中国企业却没有话语权,这是非常荒谬的。

事实上,针对中国市场的AI芯片禁令,最直接伤害的就是以英伟达为代表的美国科技巨头。目前,英伟达AI芯片方面最大市场需求来自中国。此前英伟达CEO黄仁勋就明确表示,“如果被剥夺了中国市场,我们是没有应急措施的,世界上没有另一个中国”。

在这种情况下,我们能看到追求商业利益的美国科技公司,与追求政治利益的美国政府之间有着鲜明的矛盾。美国科技企业总是想方设法寻求反对禁令和绕过禁令,比如英伟达就从去年开始推出了应对禁运政策的中国特供版GPU。

中国市场,消化了美国科技企业约三分之一的产能,二者之间的供需纽带是无法长期割裂的。面对美国愈发明显的整体性科技封禁,中国市场也应该积极用好“买家”身份,让自身的行为更具鲜明立场与可预测性。

避免造成一种“卖了就欢迎,不卖只能无奈”的表现和印象。

“买家身份”应该是一种有立场、有力量且会愤怒的身份。

方案2:以云代卡,算力集中

在可见的较长时间里,美国对中国的AI芯片封禁恐怕都只会加强,而这个时机恰好对应上AI大模型发展的关键阶段。很多业内人士认为,大模型发展虽快,但没有呈现出此前其他科技风口的迅猛局面,投资缺钱,计算缺卡是主要原因。

那么如何解决中国AI产业在禁令之下的算力缺口问题呢?首先的应急方案就是企业加大云端AI算力的配置和投入,推进以云代卡。

事实上,在高端AI芯片可能被禁的大趋势下,中国几大公有云厂商都做出了加强囤积英伟达高端GPU的动作。这一方面是因为云厂商自身要加大大模型投入,打开MaaS市场,所以对AI算力有直接需求。另一方面也是因为GPU转化为云资源池之后可以长期复用,对于云厂商来说是一个进可攻,退可守的局面。因此,今年上半年一度出现了市面上高端AI芯片全都流向云厂商,中小企业一卡难求的局面。

客观来看,这种高端AI芯片集中向云的举动,对整个中国市场统筹应对AI芯片禁令是有利的,并且也符合东数西算的战略思路。

另一个利好云端AI算力的趋势在于,随着大模型参数和使用数据量的不断加大。本地化的卡池训练已经愈发吃紧。必须在云端发生的千卡、万卡训练成为未来主要的发展方向,因此企业用户天然会更积极走向云端。

同时,云端AI算力也不会仅仅停留在囤积英伟达GPU的层面。接下来,国产的自主AI算力驶入云端是大势所趋。在相关政策的推动下,云厂商正在加大自主AI芯片的采购力度。根据IDC数据,2023年上半年中国AI服务器已经使用了50万块自主开发的AI加速器芯片。在自主AI算力的服务化方面,华为云已经推出了昇腾AI云服务。云端化与自主化结合的AI算力,将在AI芯片禁令背景下得到极大发展。

加上近些年在东数西算大背景下,各地陆续建立了大量采用自主AI算力的AI计算中心,整体来看中国的云端AI算力是供给稳定、保障可靠的。

而很多企业依旧倾向于采购本地AI算力。这一方面是因为英伟达GPU市场紧缺,保值性特别好,甚至能作为企业的核心资产。另一方面是因为云端AI算力往往会有排队、宕机、软件服务缺失等问题。

如何进一步提高开发者的云端AI算力使用体验,是公有云厂商接下来需要发力的方向。

方案3:让国产AI算力爆发式成长

面对新一轮AI芯片禁令,中国AI产业最大的底气是什么?是多年之后的习以为常,还是大量屯卡之后的家有余粮?都不是。最关键的节点在于经过多年发展,中国AI芯片产业已经得到了巨大发展。英伟达的高端GPU确实依旧重要,但已经不是毫无替代选项可言。

根据IDC此前发布的数据,2022年中国AI加速卡出货量约为109万张,其中英伟达市场份额达到了85%,华为昇腾实市场占有率10%,百度昆仑为2%,寒武纪和燧原科技均为1%。

从中可以看出,国产AI算力已经实现了一定程度的市场占比,而不仅仅是概念与理论中的“纸上谈兵”。同时也应该看到,国产AI芯片在核心性能、软件生态以及出货能力上依旧不理想,还有很长的路要走。在英伟达禁令的客观条件倒逼下,国产AI算力必须在短期内跨越这些困难,加速自身的成长与成熟周期。

为了实现这个目标,有几件事非常重要:

1.形成产业共识,避免概念混淆。

提起AI芯片,我们经常会说它有非常多的实现方式,有很多自主品牌参与这个市场,看上去一片繁荣。比如AI芯片有GPU、FPGA、ASIC、存算一体和类脑芯片等,国产AI加速芯片厂商有阿里、百度、华为、寒武纪、海光信息、燧原科技、天数智芯、壁仞科技、摩尔线程、龙芯中科等。

这种“繁荣”的表述,不仅在大众舆论和投资市场上具有迷惑性,还经常出现在一些行业报告与政策分析当中。但其中蕴藏的问题在于,普遍过分拓展了AI芯片的定义。比如说,类脑芯片在可见的未来中都仅仅是技术畅想,如果每次讨论国产AI芯片都把类脑加上,那只会浪费时间,分散精力。再比如,有些AI芯片厂商只能做自用芯片,无法面向市场出货。有些厂商目前还不具备商业化能力,处在早期建设阶段,他们短期内对于AI计算自主化的贡献也就非常之小。

为了应对英伟达高端GPU禁售问题,我们需要把目光集中在可行、有效的GPU替代品上,而不是进行过多联想和发散。只有形成了这一产业共识,才能聚集力量解决问题。

2.走向规模化商用,避免PPT造芯。

事实上,无论从AI加速芯片还是服务器整机来看,国内目前能够出货的AI芯片厂商都寥寥无几。主要集中在华为、百度两家,燧原科技、海光信息也有一定的出货。而大量半导体厂商与AI企业,更多还停留在打造芯片的计划与愿景上。这就导致大量受到政策支持与投资市场期待的国产AI芯片停滞不前,甚至有停留在这一阶段享受金融市场红利的嫌疑。

接下来的产业导向,应该从AI芯片的立项走向出货,帮助AI芯片厂商获得直接的商业回馈,产品与产能接受市场检验,逐步塑造正向的现金流。

3.加强软件生态,强化迁移能力。

英伟达GPU之所以重要,不仅在于硬件性能,更在以CUDA、PyTorch为核心的软件生态能力,因此发展国产AI芯片绝不能低估软件的能力。在强化自主软件生态建设的同时,也要重视基于英伟达生态打造AI模型的迁移能力与迁移成本。

为此,已经有大量厂商进行了探索,比如海光信息的DCU,就在生态、编程环境等方面与CUDA高度相似,CUDA用户可以以较低代价快速迁移至海光的ROCm平台。而在此前,PyTorch2.1 版本宣布支持华为昇腾。可见国产AI芯片已经具备了一定的规模化影响力,可以更多融入全球软件生态当中。

未来想要实现国产AI计算的爆发,是无法离开国产AI基础软件生态爆发的。

4、加大对“主品牌”支持,形成规模化效应。

对于美国AI芯片,除了英伟达GPU,你还知道哪些?这个问题即使是问一些AI开发者,答案也很大程度是不清楚,或者没试过。从中可见,AI计算就像通用计算、图形计算一样,极大概率是会最终出现一到两个“主品牌”的。这属于客观的市场规律,没有必要以揠苗助长的方式实现“百花齐放”的局面。

甚至就目前中国AI计算必须加速成熟,完成自主化替代的目标来说,尽快实现一超多强的局面是件好事。这可以避免生态割裂,避免产业在摇摆形成大量IT投资浪费。这个过程理应交给市场选择,慢慢成型。但在芯片禁令的大背景下,国产AI计算崛起已经时不我待,与其让100种AI芯片慢慢成熟,慢慢洗牌,比如加速形成“主品牌”快速替代的局面。

而从目前局面看,昇腾是最有可能成为国产AI算力主品牌的一支力量。科大讯飞创始人、董事长刘庆峰此前表示,华为GPU已经对标英伟达A100。根据数据显示,昇腾310整数精度算力达到了16TOPS,昇腾910整数精度算力达到640TOPS。这意味着昇腾910性能已经接近英伟达A100。

同时,昇腾也是目前唯一稳定占据市场份额的国产AI算力,并且在软件上孵化了类似英伟达CUDA的异构计算架构CANN和AI计算框架MindSpore。在核心性能、软件生态与市场占有率三项指标来看,昇腾都已经具备了可以加快成长,实现AI算力大规模国产化替代的可行性。

规范行业标准,强化软件建设,提高自主品牌支持,是短期内推动国产AI算力快速成长的主要途径。

英伟达禁令,是一个中国AI行业普遍不愿意看到,尽量避免,甚至到今天也有些讳莫如深的问题。但形势比人强,在不断加速的逆全球化进程与AI竞赛中,类似禁令未来大概率只多不少。

逃避、迂回、噤若寒蝉,都无法解决问题,只有坦然应对,奋力自强,才能从根本上解决受制于人的问题。

禁令之下,中国AI计算何去何从?

答案是我们已别无选择,所以要给世界第二个选择。

免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与极客网无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2023-11-03
英伟达禁令之后,中国AI计算何去何从?
英伟达禁令之后,中国AI计算何去何从?

长按扫码 阅读全文