您的位置: 首页 > 实时讯息 >

20万块英伟达芯片练出Grok 3:测试得分均高于竞争对手,运算能力是上代10倍

0次浏览     发布时间:2025-02-18 17:55:00    

预热许久的“地表最聪明AI”Grok 3正式亮相。

2月18日,特斯拉创始人埃隆·马斯克旗下xAI推出最新大模型Grok 3,并在直播中进行了现场演示。马斯克称,非常高兴能够推出 Grok3,它的能力将在短时间内比Grok2强大了十倍。“xAI和Grok的目的是理解宇宙的本质。”

功能完整的Grok 3将在一周后正式上线,不过用户依旧需要“钞能力”才能体验到最新版本的Grok。

直播介绍,Grok 3测试版现已面向马斯克旗下X平台的X Premium订阅用户开放,“我们今天将推出Grok3,首先从X上的Premium Plus订阅者开始,他们将是第一批获得访问权限的人。请确保更新您的X应用程序以探索所有高级功能,因为我们刚刚发布了更新。如果您有兴趣尽早使用Grok 3,请注册Premium Plus。”

xAI还针对Grok 3开发了新的订阅功能。“此外,我们还将为想要获得最先进功能和尽早使用新功能的忠实粉丝推出一项名为Super Grok的单独订阅。这项服务适用于Grok应用程序和新网站grok.com。”据报道,

马斯克表示,预计一周之后Grok 3的所有功能将正式上线。他说,“如果你想要一个更完善的版本,可能值得等待一周,但每天都会有所改进。我们还在开发语音交互功能,以便你可以拥有对话体验。我今天早些时候试过了,效果很好,尽管它仍然需要一些完善。我们的目标是让你可以像和人交谈一样和它交谈。我认为这将是Grok3最好的体验之一,但这应该还要一周左右的时间。”

马斯克说,计划在每次发布新版本时,对上一版本进行开源,也就是说,几个月后Grok 2即将开源。

xAI工程师介绍,虽然Grok起步较晚,但在MMLU(大规模多任务语言理解基准测试)得分上以超快地速度追上了ChatGPT,Grok 3和轻量化的Grok 3 mini在多方面性能上都超过或媲美Gemini、DeepSeek和GPT-4o等对手。

据介绍,Grok 3在数学推理、科学逻辑推理和代码写作等项目的Benchmark测试(基准测试)中均取得了比DeepSeek-v3、GPT-4o、Gemini-2 Pro更优的效果。Grok 3分别得分为52、75和57。Grok 3 mini分别得分为40、65和41。这两个模型的得分都高于Gemini、DeepSeek、Claude和GPT。

工程师说,“大约五天前,AIME2025竞赛结束了,高中生们在一个特定的基准上竞争。然后我们让两个模型在同一场考试中在同一基准上竞争。有趣的是,更大的Grok3推理模型在这场考试中表现更好。这表明,与较小的模型相比,较大的模型具有更强的泛化能力。然而,在去年的考试中,较小的模型表现更好,因为它更有效地学习了以前的考试。”

在加州大学伯克利分校推出的Chatbot Arena (LMSYS)盲测中,早期版本的Grok 3化名“巧克力”打榜,一举夺魁并成为唯一一个得分超1400的模型,其在代码、指令响应等各个方面排名均为第一。

据马斯克此前介绍,Grok 3是在大量的合成数据上训练的。它会反复检查数据,试图达到逻辑一致性。如果有错误的数据,它会反思并删除错误数据。

值得一提的是,有工程师还透露了xAI旗下超算中心算力已经翻倍,英伟达GPU数量已达到20万块。

据介绍,去年4月,马斯克认为xAI若想成功打造出最佳AI,唯一途径是自建数据中心。由于想尽快推出Grok 3,时间紧迫,于是决定在四个月内建成数据中心。最终,团队耗时122天让第一批10万个GPU启动并运行。

不过要构建理想中的AI需将集群规模翻倍。发布会上透露,这也是团队首次公开谈论此事,团队仅用92天就已经实现了超算集群的算力翻倍,也就是GPU数量已达20万块。如今,xAI正利用这些强大的计算能力持续改进产品。

团队还透露,xAI已经开始研究下一个集群,为了能够带动更为强大的AI,其功率将提高约五倍,达到大约1.2千兆瓦。

现场,马斯克和工程师们演示了Grok 3的多种能力。在演示中,Grok 3为太空发射生成动画3D,以及开发了一款将俄罗斯方块和宝石迷阵结合的游戏。

Grok 3为太空发射生成动画3D

Grok 3开发的游戏

此外,xAI的游戏工作室也正式得到官宣。马斯克表示,“我们将在xAI推出一个人工智能游戏工作室。如果你有兴趣加入我们并开发人工智能驱动的游戏,请加入我们。”

澎湃新闻记者 吴遇利

(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)

相关文章

万家瑞丰财报解读:份额骤降80%,净资产缩水88%,净利润亏损144万,管理费降至15.59万

来源:新浪基金∞工作室2025年3月29日,万家基金管理有限公司发布万家瑞丰灵活配置混合型证券投资基金2024年年度报告。报告显示,万家瑞丰在2024年面临诸多挑战,基金份额、净资产规模显著下降,净利润亏损,不过管理费也有所降低。这些变化反映了基金在过去一年的运作状况,也为投资者提供了重要的决策参考
2025-04-04 15:00:00

特朗普:将在未来几周发放“金卡”签证

当地时间4月3日,美国总统特朗普表示,预计未来几周将发放“金卡”签证。当地时间2月25日,美国总统特朗普在白宫对媒体称,他打算两周后开始出售定价500万美元一张的美国“金卡”,目标人群是富有的移民。据他称,这种“金卡”不会直接给予购买者美国公民身份,因此不需要通过美国国会,但将赋予同“绿卡”一样的权
2025-04-04 06:49:00

小米事故警示录:谁是吞噬生命的帮凶?

21世纪经济报道记者 郑植文 易思琳 报道“中国智驾的唯一敌人,不是技术进步本身,而是过度宣传和对用户的误导。”小米SU7致死事故发生后,一位车企人士在他的朋友圈写道。今年以来,汽车行业掀起一场全民智驾热潮。有的车企把2025年定义为“全民智驾元年”,要推动“智驾平权”;有的车企发布最新智驾系统,要
2025-04-04 00:19:00

中银证券鑫瑞6个月持有财报解读:份额降25%,净资产缩水21%,净利润扭亏为盈

来源:新浪基金∞工作室2025年3月29日,中银证券鑫瑞6个月持有期混合型证券投资基金发布2024年年度报告。报告显示,该基金在过去一年中,基金份额和净资产规模均有所下降,不过净利润实现扭亏为盈,基金经理对市场走势也有新的展望。主要财务指标:净利润扭亏,资产规模缩水本期利润实现扭亏为盈2024年,中
2025-04-03 15:51:00

马斯克:很快将辞去政府效率部职务是“假新闻”

美国企业家埃隆·马斯克2日在社交媒体上说,有关他很快将辞去美国政府效率部职务的报道是“假新闻”。美国白宫新闻秘书莱维特当天在社交媒体上转发有关马斯克辞职的报道时称:“这个‘独家新闻’是垃圾。”马斯克随后转发莱维特的帖文说:“是的,假新闻。”莱维特在帖文中转发的是美国《政治报》当天早些时候发布的报道。
2025-04-03 15:05:00

《新华每日电讯》关注青岛:人工智能赋能千行百业

新华每日电讯2025年4月3日5版新华社青岛4月1日电(记者 张武岳)在位于山东青岛崂山区人工智能产业园的自然语义(青岛)科技有限公司,工作人员向记者展示了最新研发的语言类大模型“欧拉”:在一台笔记本电脑上,未接入互联网的状态下,该大模型就可以进行与DeepSeek、ChatGPT等相似的“思考”过
2025-04-03 14:35:00

网站内容来自网络,如有侵权请联系我们,立即删除!
站长邮箱 admin@99-bm.com Copyright © 99便民 鲁ICP备19046937号-5