Perplexity CEO暗捧Kimi K2:后训练是AI圈新内卷?

Perplexity CEO暗捧Kimi K2:后训练是AI圈新内卷?

美国AI初创公司Perplexity的CEO阿拉温德近日在社交媒体上发文,对中国AI公司月之暗面最新发布的Kimi K2模型给予了积极评价。这一表态不仅引发了业界对Kimi K2技术实力的关注,更折射出当前AI行业一个值得玩味的现象:后训练正在成为大模型竞争的新战场。

技术实力获国际认可

Kimi K2作为月之暗面首个万亿参数开源模型,确实展现出不俗的技术实力。该模型采用MoE架构设计,总参数达到1T,激活参数32B。在SWE Bench Verified、Tau2、AceBench等基准测试中,Kimi K2均取得了开源模型的SOTA成绩,特别是在代码能力、Agent任务和数学推理方面表现突出。

Perplexity作为专注于AI搜索的美国初创公司,其CEO的公开表态具有指标性意义。值得注意的是,这并非Perplexity首次采用中国AI公司的技术。今年1月就有报道显示,Perplexity曾使用深度求索的DeepSeek R1进行模型训练。这种跨国技术合作模式正在成为AI领域的新常态。

后训练的价值重估

阿拉温德在发文中特别提到"可能基于K2进行后训练",这一表述值得深入解读。后训练(Post-training)是指在大模型预训练完成后,针对特定任务或领域进行的二次优化过程。随着基础模型能力的普遍提升,后训练的重要性正在凸显。

在当前的AI竞赛中,头部公司的基础模型差距正在缩小。以GPT-4、Claude 3、Gemini 1.5等为代表的顶尖模型,在通用能力上已经难分伯仲。这种情况下,如何通过后训练将基础模型适配到具体应用场景,就成为决定产品成败的关键。

行业竞争的新维度

后训练的兴起也反映了AI行业竞争重心的转移。早期的大模型竞赛主要围绕参数量、训练数据规模等硬指标展开。但随着技术成熟,行业开始更关注模型的实际应用表现。后训练恰恰是连接基础模型与终端应用的桥梁。

这种现象也带来新的行业挑战。一方面,后训练需要大量领域数据和计算资源,可能加剧行业资源集中化趋势。另一方面,后训练技术的专业化也催生了新的细分市场,为中小型AI公司创造了差异化竞争的机会。

开源生态的机遇

Kimi K2选择开源策略,为后训练生态提供了新的可能性。开源基础模型降低了企业进行后训练的门槛,使更多公司能够基于先进架构开发垂直应用。Perplexity考虑采用K2进行后训练,正是这种趋势的具体体现。

从行业全局看,基础模型开源与商业公司后训练的结合,可能形成更健康的AI生态。头部公司专注于基础研究,中小企业聚焦应用创新,这种分工有助于加速AI技术的商业化进程。

冷静看待技术炒作

尽管Kimi K2获得国际认可值得肯定,但业界仍需保持理性。模型基准测试成绩只是技术实力的一个方面,真正的考验在于实际应用中的表现。后训练虽然重要,但也不能完全弥补基础模型的先天不足。

AI行业正在进入更加务实的阶段。企业不再单纯追求参数量的突破,而是更关注如何通过全流程优化提升模型的实际价值。在这种背景下,后训练的兴起不是简单的内卷,而是技术发展的必然趋势。

未来展望

随着AI技术不断演进,后训练可能会发展出更多创新形式。从提示工程到微调,从蒸馏到适配,各种技术路线将共同推动大模型应用边界的扩展。中国企业在这一领域的表现,将决定其在国际AI竞争中的地位。

Perplexity对Kimi K2的关注只是一个开始。在全球AI产业链深度融合的今天,技术交流与合作将成为常态。后训练作为连接研究与应用的纽带,其重要性只会与日俱增。对于行业参与者来说,如何在这个新赛道上建立优势,将是未来竞争的关键所在。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

赞助商
2025-07-15
Perplexity CEO暗捧Kimi K2:后训练是AI圈新内卷?
Perplexity CEO暗捧Kimi K2:后训练是AI圈新内卷? 美国AI初创公司Perplexity的CEO阿拉温德近日在社交媒体上发文,对中国AI公司月之暗面...

长按扫码 阅读全文