2月18日消息,今日,马斯克旗下人工智能公司xAI发布了大模型Grok 3。
在大模型能力方面,在数学推理、科学逻辑推理和代码写作上,Grok-3在多项benchmark测试中均取得了比DeepSeek-v3、GPT-4o、Gemini-2 pro更优的效果。
在AIME'24数学能力测试中,Grok-3取得了52分,明显高于DeepSeek-V3的39分。
在GPQA科学知识评估中,Grok-3以75分的优异成绩领先DeepSeek-V3的65分。
此外,在LCB Oct-Feb编程能力测试中,Grok-3也以57分的成绩超越了DeepSeek-V3的36分。
据xAI官方介绍,Grok 3 在训练过程调用了 10 万个 Nvidia H100芯片,较前代产品 Grok 2 使用的 15000 个 GPU 实现了数倍的跨越式提升。(御风)
- 《黑神话:悟空》PS5国行版将于6月18日正式发售,建议零售价268元起
- 报告:2029年美国AI搜索广告支出将达260亿美元,占比13.6%
- 重塑内生安全体系 实现AI时代安全突围 ——2025北京网络安全大会(BCS)开幕
- 覆盖上百国家!启信慧眼全球供应链“风险地图”助力中企安全“出海”
- 门禁凭证技术进化简史:开启更加安全和便利的未来
- Google I/O 大会:科技盛宴,引领未来创新潮流
- 马蜂窝端午出行大数据:短途周边游是主流,非遗民俗关注度持续走高
- 微软裁员6000人原因揭晓 AI冲击首当其冲
- 腾讯音乐2025Q1业绩持续高质量增长:在线音乐服务收入达58亿元,同比增长15.9%
- 硅谷巨头庭审吐真言:未来10年Meta、谷歌搜索、iPhone或成历史
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。