打上“业界最强”标签:阿里通义千问冲击国产大模型No.1

极客网·人工智能(海刚)每个时代都有自己的主旋律,下一个十年的主旋律就是AI

自ChatGPT横空出世以后,国内的各种大模型也如雨后春笋般涌现,能叫得上号就不下十余个,其中就包括大名鼎鼎的华为盘古大模型、百度文心一言大模型、讯飞星火大模型、抖音云雀大模型,以及今天的主角阿里通义千问大模型。

据极客网不完全统计,国内拥有10亿参数规模以上大模型的厂商及机构已接近300家,而且还在快速增加中。预计到2024年第一季度末,“百模大战”就会升级为“千模大战”!

百模大战.png 图:部分国内知名大模型

上一次出现如此“壮观”的景象,还是十年前的互联网团购。不过,这两者之间有着本质的不同。“千模大战”已由“千团大战”的资本驱动型、营销驱动型,转向了研发驱动型、技术驱动型。这与中国产业升级正在追求的高质量发展不谋而合,“千模大战”拼的不再是钱和套路,而是实打实的技术创新能力。

作为互联网时代最大的受益者和赢家之一,阿里有极强的商业嗅觉,是最早一批全面转型“硬科技”研发的互联网巨头之一,在AI大模型领域也成功跻身第一梯队。2023年,阿里通义千问大模型在技术、商业、生态三方面,都取得了突破性时展,国产AI大模型之王,很可能就是阿里!

首次打上“业界最强”标签

12月1日,阿里云在北京召开发布会,发布通义千问闭源模型2.1版,升级通义千问视觉理解模型Qwen-VL,并开源通义千问720亿参数模型Qwen-72B。从18亿、70亿、140亿到720亿参数规模,通义千问成为业界首个“全尺寸开源”的大模型。这预示着,阿里通义千问自4月发布以来,终于迎来了一次史诗级大升级。

图片1.jpg

图:阿里通义千问发布会现场

通过横向对比不难发现,Qwen-72B是目前业界最强的开源中文大模型,在10个权威基准测评中,都创下开源模型最优成绩。尤其在中文任务模式下,Qwen-72B霸榜C-Eval、CMMLU、GaokaoBench等基准,得分超越GPT-4;数学推理方面,Qwen-72B在GSM8K、MATH测评中断层式领先其他开源模型;代码理解方面,Qwen-72B在HumanEval、MBPP等测评中的表现大幅提升,代码能力有了质的飞跃。

在英语任务中,Qwen-72B的MMLU基准测试也取得开源模型最高分。也就是说,Qwen-72B不仅在性能上超越了开源标杆Llama 2-70B和大部分商用闭源模型。未来,企业级、科研级的高性能应用,也有了开源大模型这一选项。图片2.jpg

图:在10大权威测评中,通义千问720亿参数模型获得开源模型最优成绩

图片3.jpg 

图:通义千问720亿开源模型部分成绩超越闭源的GPT-3.5和GPT-4

另外,通义千问2.1也有了大幅升级,在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力都有肉眼可见的提升。具体表现为:代码生成理解能力提升了30%、幻觉诱导抵抗提升了14%、数学逻辑推理能力提升了10%、中英百科知识增加了5%。

在竞争激烈的大模型领域,每一小步提升,都意味着更大的竞争优势,所以大厂们无时不刻都在向着更高的技术指标进级。在这种情况下,阿里通义千问只用了短短6个多月的时间,就从绝对落后做到了部分领先,这是极期难能可贵的。未来三到五年,如果阿里可以一直保持如此迅猛的发展态势,完全有机会冲击国产AI大模型之巅,再次成为新科技时代的No.1。

构筑坚不可摧的“技术护城河”

前文提到,AI大模型拼的不再是资本和营销,而是实打实的技术创新。没有核心优势的企业,都会随着技术的快速迭代,慢慢湮没在滚滚历史洪流中。和“千团大战”的结局类似,只有极少数大模型公司能够“笑到最后”。作为最早转型“硬科技”的互联网巨头之一,阿里经过十余年的技术积淀,已初步具备穿越周期的条件。

对于AI大模型来说,核心技术环节有三个,一是数据,二是算法,三是算力。作为中国最大的互联网巨头之一,阿里在数据方面有着天然的优势,尤其是涉及交易细节的电商数据,阿里优势更加明显。在算法方面,尽管阿里起步稍晚,但目前已经无限接近GPT-4,部分细分领域还实现了超越。站在历史角度看,中国企业在数据算法领域从来没输过,所以这部分的反超指日可待。

相比数据、算法,最关键的还是算力!现在大模型企构建算力的唯一途径,就是购买更多、更先进的算力基础设施。而算力基础设施中,最核心的部件就是AI算力芯片。目前,AI算力芯片做得最好的,非英伟达莫属。其最新发布的H200,拥有141GB的内存,处理速度高达4.8TB/秒,综合性能是上一代的两倍。这款芯片将给AI大模型企业带来极大的助力。

图片4.jpg 

图:英伟达H200性能

然而,由于众所周知的原因,英伟达H200等美国尖端AI芯片,并不能卖给中国企业。中国企业要想在新一轮产业变革中掌握主动权,自力更生成了必选项。

在国内,除了华为之外,阿里是极少数在做自研芯片,且已经做出成绩的公司之一。其重磅推荐出的含光800一度成为全球最强AI推理芯片。近几年,阿里旗下芯片平台平头哥,先后发布铁 910、无剑 SoC 平台。就在上个月,阿里玄铁RISC-V又上新了三款处理器:首次实现AI矩阵扩展的C907、满足Vector1.0标准的C920,以及实时处理器R910。截止目前,阿里平头哥已累计售出30亿颗RISC-V芯片,占据该市场全球30%的份额。其中,玄铁CPU的出货量已经超过了25亿颗,成为了国内应用规模最大的国产CPU。

图片5.jpg

图:阿里平头哥芯片产品一览

毫无疑问,平头哥已成国产芯片不容忽略的一极。而在芯片领域做出了突破,也就意味着在算力基础设施建设方面有了更大的主动权。借此,阿里不仅可以帮助自己在大模型领域,构筑一条坚不可摧的“技术护城河”,还可以打破国外垄断,为国内其它相关企业的自主创新提供强有力的支持。未来,阿里云将不断壮大自身产业生态,并发展成为整个行业的赋能者。

事实上,不只通义千问,目前中国一半大模型公司,都跑在阿里云上。阿里云CTO周靖人称,阿里云将不断开放平台能力,帮助更多企业实现大模型商业价值。

阿里这么说,也是这么做的。比如,阿里云刚刚发布的一站式大模型应用开发平台——阿里云百炼,就集成了国内外主流优质大模型,可以提供模型选型、微调训练、安全套件、模型部署等服务和全链路的应用开发工具,为用户简化了底层算力部署、模型预训练、工具开发等复杂工作。开发者可在5分钟内开发一款大模型应用,几小时即可“炼”出一个企业专属模型,开发者可把更多精力专注于应用创新。

图片6.jpg

图:阿里云百炼平台

截至2023年10月,阿里云已与60多个行业头部伙伴进行深度合作,推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。这个成绩,无疑再一次跑赢了绝大部分竞争者。总之,凭借独有的技术优势和生态布局,阿里通义千问是最有机会成为行业的领头羊的大模型。

写在最后:

生成式AI爆火,千模大战加速上演。作为最早转型“硬科技”的互联网巨头之一,阿里凭借十余年积淀下来的技术优势,在数据、算法、算力三大核心环节,构筑了一条坚不可摧的护城河,还率先推出业界最强的720亿参数开源中文大模型Qwen-72B。未来,随着阿里云生态的不断壮大,阿里通义千问将成为最有机会登顶行业之巅的大模型。站在中国产业升级的大维度来看,阿里在AI领域的持续投入,无疑再一次押对了大势。期待阿里这个庞然大物,在新一轮产业变革中成功完成转型、蜕变!(完)

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

赞助商