大模型“以厘计价”,谁能扛住价格战?

科技云报道原创。

最近一周,铺天盖地都是大模型降价的消息。

字节降完,智谱降;阿里降完,百度降;腾讯降完,科大讯飞降......是不是很像蹲萝卜的游戏?

事实上,国内有头有脸的大厂几乎都加入了这场游戏。接二连三地降价,让人一瞬间有了当年共享单车和云计算价格战的感觉。

互联网时代,所有人都习惯于大规模烧钱来获得最后的胜利。但AI时代,这套玩法还行得通吗?

国产大模型“以厘计价”

降价在商业世界里并不难理解,无非是“降价促销”、“以价换量”。

大模型领域的扛把子OpenAI就已经多次降价。

从去年3月OpenAI发布GPT4到现在,其产品从GPT4升级到GPT-4o,输入价格从0.03美元/千tokens下降到0.005美元/千tokens,降幅为83%;输出价格从0.06美元/千tokens下降到0.015美元/千tokens,降幅为75%。

但惊人的是,国内大模型比OpenAI更狠,直接把价格“打骨折”。

5月11日,智谱AI大模型的个人版GLM-3Turbo模型产品的调用价格从0.005元/千tokens降低至0.001元/千tokens,直降80%;GLM-3 Turbo Batch 批处理API也便宜了50%,价格仅为0.0005元/千tokens。

紧接着,5月15日,字节宣布豆包通用模型pro-32k版、pro-128k版在企业市场的推理输入价格仅为0.0008元/千tokens、0.005元/千tokens,较行业降幅达99.3%、95.8%,并声称已经击穿了大模型行业的最底价。

但“价格屠夫”还在后面。5月21日,阿里云通义千问GPT-4级主力模型Qwen-Long的API输入价格降至0.0005元/千tokens,直降97%。

各大厂动不动就降价90%以上,已经是硝烟四起,然而还有更狠的角色——百度直接宣布文心Speed和文心Lite两款模型免费,开启了大模型API调用的“免费时代”。

5月22日,腾讯也按耐不住了,宣布主力模型之一的混元-lite 模型不仅从4k升级到256k,而且全面免费。

同日,科大讯飞首推永久免费大模型,讯飞星火API能力向全球用户开放。

有网友戏称,大模型正从“以分计价”的定价模式向“以厘计价”的时代迈进。

价格战提前来临?

其实大模型降价并不稀奇,但稀奇的是商业化还没跑通,怎么价格战就先来了?

根据此前预期,大模型大致将按照每年50%-75%幅度降本,但现在大模型的降本速度远超预期。

答案很简单:加快商业化落地。

随着大模型参数越来越大,研发成本也越来越高。在巨大的成本压力下,大模型厂商不得不加紧寻找一条商业化之路。

根据无问芯穹发起人汪玉,用公开数据做了一次针对算力成本数量级的测算,假设GPT-4 Turbo每天要为10亿活跃用户提供服务,每年的算力成本可能超过两千亿,这还不包括模型训练的投入。

华为大模型负责人田奇曾提到,大模型开发和训练一次需要约1200万美元,这表明即使技术再领先的公司,大模型的训练也是非常昂贵的。

百川智能创始人CEO王小川也曾表示,每1亿参数对应训练成本在1.5到3万人民币之间。因此,一个千亿级参数的模型单次训练成本预估在3000万至5000万人民币之间。

显然,高昂的研发价格,已经成了AI商业化的枷锁。绝大部分公司的收入仍然还在亿的级别。以这种成本去打造商业闭环,显然是不成立的,而降价就成了最直接且最快速的落地方式。

同时,价格战能掀起的另一个因素是,大模型技术已经卷得差不多了。

外卖、快递、网约车、社区团购乃至新能源车等价格战火热的行业,或多或少都是由于同质化竞争而导致的,大模型也可能是当前卷性能带来的收益越来越低。

在《LLMs正达到收益递减的证据——及其可能意味着什么》一文中,作者认为大模型在性能提升方面可能已达到收益递减的临界点。以OpenAI为例,从GPT-2到GPT-3、GPT-3到GPT-4都有巨大的飞跃,但GPT-4到GPT-4 Turbo就没有那么多了。

如果大模型的性能发展真的要迎来一面墙,那么对于大模型公司来说,如何抢下用户是现阶段最重要的一步。

目前,国内大模型先头部队大多已接近GPT-4的能力,而这一能力已具备商业化的基础。经过一年多的技术比拼,大模型显然已经到了大规模市场验证的阶段。

因此,2024年大模型开始了从“卷技术”向“卷应用”的转变,商业化、落地应用成为大模型公司的主旋律,而降价将为大模型的应用落地带来了极大推动力。

谁能扛住价格战?

虽然大家都在价格上卷起来了,但并不是所有企业都能加入价格战。

降价涉及到大模型的研发、训练、推理等一系列成本的优化,只有把大模型的研发成本尽可能的降低到最小,才有降价的空间和资本。

毋庸置疑,大厂是最扛打的一波。

在这轮价格战里,云厂商是最重要的发起方之一,先有字节的火山引擎,后来百度智能云、阿里云、腾讯云先后加入。

对云计算公司来说,大模型商业化能不能跑通,并不重要。更重要的是,如何依托于大模型新需求,打破过去云厂商的格局,重新建立自己的领先位置。

根据媒体报道,阿里云内部已经提出一个非常激进的目标,在三年之内,要占领国内大模型云计算市场的90%。这也是为什么阿里把国内5家大模型独角兽都投了一遍。

而火山引擎自2020年才对外提供服务开始,一直想以传统云计算模式去追赶大厂,始终没有太大起色。大模型出现改变了这一切。去年以来,它开始将字节跳动的AI能力作为突破口,试图打破旧有格局。这次降价也是这一逻辑下发生的。

事实上,基于大模型卖云服务并不是大厂唯一的商业模式。基于大模型重构应用,乃至打造大模型时代的超级应用,成为大厂在AI时代的新目标。

如果能够像互联网和移动互联网时代一样,诞生淘宝、微信这样的超级应用,大厂们又将迎来商业史上新的辉煌。

目前,百度已经完成了对百度文库、百度搜索、百度地图、如流等业务的AI重构。

阿里对钉钉、高德地图、闲鱼、饿了么、优酷、盒马、淘票票,天猫、淘宝等阿里集团最核心的产品进行了全面升级。

字节内部也开启了赛马机制,抖音、剪映等50多个业务线各自为营开始了AI探索。过去一年里,除了主打的豆包App外,基于豆包大模型,还推出了互动娱乐应用“猫箱”,以及星绘、即梦等AI创作工具。

腾讯则将混元大模型落地在超600个腾讯内部业务和场景中,包括企业微信、腾讯会议、腾讯文档等“一门三杰”产品,也包括腾讯乐享、腾讯电子签、腾讯问卷、腾讯云AI代码助手等协作SaaS产品。

相比大厂的高举高打,大模型创业公司就显得不那么从容了。

百川智能创始人王小川表示,百川并不会“掺和”到价格战当中,原因在于,当前To B并不是百川的主要商业模式,价格战对其影响有限,百川更多的精力,还是会放在超级应用当中。

零一万物的李开复博士认为,目前零一万物带给的性能、性价比都很高了,不打算降低YI系列模型的API价格。“就像特斯拉,他不会因为别的牌子车比他卖得很便宜,他也要来降价。”

率先掀起价格战,喊着“不做应用做研究”的DeepSeek,也没有在各家大厂密集召开降价发布会时发声,显得无心参战。

无论创业系公司如何自圆其说,和财大气粗的大厂相比,一不小心都有可能震荡出局。

更大的挑战在于,国内大厂和大模型厂商基本都走模型+应用路线,推出各自的To C App,不少AI助手也已经开始大规模的市场投放。

不管是基础大模型的价格战,还是To C应用的用户争夺战,战火都已经烧起来了。

结语

无论从哪个角度看,把大模型拉入价格竞争,都不是一个明智的做法,也不一定会让大模型厂商迎来商业闭环。但现实是,这事就这样发生了。

既然大模型未来的发展谁都看不清,那就先降价把用户拿下来再说。这是移动互联网过去10年被证明过无数次的真理。

拿到用户,不管商业化能不能跑通,至少融资、并购后面还有的聊。但没有用户,你连上谈判桌的资管都没有。

在这种情况下,大模型厂商降低开发者成本,让更多开发者参与进来,帮助他们去触碰曾经触碰不到的用户,显然就是一条必经之路。

免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与极客网无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2024-05-27
大模型“以厘计价”,谁能扛住价格战?
科技云报道原创。最近一周,铺天盖地都是大模型降价的消息。字节降完,智谱降;阿里降完,百度降;腾讯降完,科大讯飞降......是不是很像蹲...

长按扫码 阅读全文