通义千问2.0千亿级参数规模大模型正式发布,性能超过GPT-3.5

10月31日消息(九九)2023云栖大会今天上午在杭州云栖小镇开幕,在下午举行的技术主论坛上,阿里云首席技术官周靖人公布阿里自研大模型的最新进展,发布千亿级参数规模的通义千问2.0。相比今年4月发布的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。

在MMLU、C-Eval、GSM8K、HumanEval、MATH等10个主流Benchmark测评集上,通义千问2.0的得分整体超越Meta的Llama-2-70B,相比OpenAI的GPT-3.5是九胜一负,相比GPT-4则是四胜六负,与GPT-4的差距进一步缩小。

周靖人还介绍了通义大模型“家族”的另一重要成员——AI艺术创作大模型通义万相。通义万相具有三大功能:在基础文生图功能中,可根据文字内容生成水彩、扁平插画、二次元、油画、中国画、3D卡通和素描等风格图像;在相似图片生成功能中,用户上传任意图片后,即可进行创意发散,生成内容、风格相似的AI画作;该模型还支持图像风格迁移,用户上传原图和风格图,可自动把原图处理为指定的风格图。

为推动大模型更易在千行百业集成落地,阿里云基于通义打造了8个行业大模型:通义灵码-智能编码助手、通义智文-AI阅读助手、通义听悟-工作学习AI助手、通义星尘-个性化角色创作平台、通义点金-智能投研助手、通义晓蜜-智能客服、通义仁心-个人专属健康助手、通义法睿-AI法律顾问。8大行业模型面向当下最受欢迎的多个垂直场景,使用领域数据进行专门训练。

当天,通义千问APP在各大手机应用市场正式上线,所有人都可通过APP直接体验最新模型能力。开发者可以通过网页嵌入、API/SDK调用等方式,将模型能力集成到自己的大模型应用和服务中。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2023-10-31
通义千问2.0千亿级参数规模大模型正式发布,性能超过GPT-3.5
通义千问2.0千亿级参数规模大模型正式发布,性能超过GPT-3.5,C114讯 10月31日消息(九九)2023云栖大会今天上午在杭州云栖小镇开幕,在下午举行的技术主论

长按扫码 阅读全文