全球热议阿里千问3:给开源AI模型注入强行针

极客网·人工智能4月30日 近日,阿里正式推出全新开源模型Qwen3(千问3)。作为中国首个混合推理模型,其将“快思考”与“慢思考”集成于一体。面对简单需求时,它能实现秒级响应;处理复杂问题时,可通过多步深度思考抽丝剥茧。这种创新设计能有效节省算力资源,为人工智能的应用落地开辟新路径。 

从技术架构来看,千问3是混合专家模型(MoE,Mixture of experts),它将多个专业模型有机整合。在模型运行过程中,会根据任务需求智能激活相关模型,实现“按需调用”,这种灵活机制极大提升了运行效率。

数据显示,在严苛的ArenaHard评测中,千问3预训练数据量高达36T,总参数量达235B,但实际激活仅需22B。凭借强大的“硬实力”,千问3成功超越DeepSeek R1和OpenA Io1,与谷歌最新的Gemini 2.5-Pro性能处于同一梯队。

Gppj9_kbEAAkO9U.jpg

更令人惊喜的是,千问3在性能飞跃的同时大幅降低了部署成本。以往需要大量高端硬件才能实现的效果,如今仅需4张H20显卡就能部署满血版,显存占用仅为同类模型的三分之一。

此次千问3模型家族阵容强大,一次性推出8款“混合推理”模型,涵盖30B和235B两款混合专家(MoE)模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型,可满足不同场景下的多样化需求。

目前,用户可通过Hugging Face、ModelScope、Kaggle和GitHub等平台获取模型并部署安装,也能直接通过chat.qwen.ai网站或App体验千问3的强大功能。

性能与全球化特征突出,阿里千问3引起全球热议

Venturebeat评价称:“简短试用Qwen Chat网站后,发现新模型可以以相对快的速度生成图片,在遵循提示方面表现尚可,难能可贵的是模型能够直接将文本融入图像中,而且还能保持风格一致。”

全球化能力是千问3的另一张王牌,它支持119种语言及方言,极具应用潜力。其预训练数据达到36T,数据来源包括网络抓取、类PDF文档提取、前几代千问模型合成的内容(主要是数学编程内容)。

再看部署灵活性,0.6B-32B密集模型可直接在笔记本电脑运行,个人开发者与大型团队都能轻松驾驭。

横向对比,千问3性能足以对标DeepSeek、OpenAI等国内外头部模型。相较Meta开源模型,其遵循Apache 2.0协议,完全开放商业使用权限,而Meta模型有诸多限制。

这一次千问3的进步非常大,它的目标直指AGI、ASI,也就是比人类还聪明的AI。未来,千问计划进一步拓展模型规模,增加文本处理长度,拓宽对多种模式的支持范围,并借助环境反馈机制提升自身的强化学习能力,持续进化。

AI专家向CNBC透露,千问3的诞生意义重大,对阿里巴巴在中国的AI竞争对手而言是巨大威胁。同样,美国同行们也感受到更大压力。

市场咨询公司Counterpoint Research的AI分析师Wei Sun高度评价千问3,认为它是一款具有里程碑意义的突破性产品。其性能超越同类产品,在模型特性上也展现出巨大的应用潜力,混合思考模式、支持119种语言和方言,以及开源特性,都为其加分不少。

华盛顿专注于中美经济和科技竞争的分析师Ray Wang表示:“阿里巴巴千问3系列产品的推出,再次证明中国实验室具备强大的竞争力与创新力。即便美国实施出口管制,也无法阻挡中国在AI领域稳步向前,开发出媲美国际顶尖水平的开源模型。” 

数据显示,千问已成为全球最流行的开源模型之一,全球下载量超3亿次,在Hugging Face上衍生模型数量突破10万个。

分析师Ray Wang认为,千问3将延续阿里模型的热度与影响力,其性能有望问鼎全球最佳开源模型,仅略逊于OpenAI的专有模型o3和o4-mini。他还说,当前中美在人工智能领域的差距已大幅缩小,可能仅剩几个月、甚至几周的差距。(小刀)

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

赞助商
2025-04-30
全球热议阿里千问3:给开源AI模型注入强行针
为人工智能的应用落地开辟新路径

长按扫码 阅读全文