您的位置: 首页 > 实时讯息 >

9.11比9.9大?马斯克声称“天下最聪明”的Grok3“翻车了”

0次浏览     发布时间:2025-02-19 14:08:00    

近日,马斯克与xAI团队,在直播中正式发布了最新版本Grok3。

此前,马斯克将Grok-3描述为“地球上最聪明的AI”。他在X平台上表示:“自己整个周末都在和团队打磨产品。”

然而据媒体报道,有人测试了最新的Beta版Grok3,并提出了那个经典的用来刁难大模型的问题:“9.11与9.9哪个大?”遗憾的是,在不加任何定语以及标注的情况下,号称目前最聪明的Grok3,仍然无法正确回答这个问题。

值得一提的是,用同样的问题询问DeepSeek时,无论是否开启深度思考(R1)模式,对方都给出了正确的答案:9.9大于9.11。

“9.11和9.9哪个大”是AI领域的一个经典问题。

艾伦研究机构(Allen Institute)成员林禹臣曾在社交媒体平台上发布的截图显示,ChatGPT-4o在回答中认为13.11比13.8更大。“一方面AI越来越擅长做数学奥赛题,但另一方面常识依旧很难。”他表示。

随后Scale AI的提示工程师莱利·古德赛德(Riley Goodside)基于此灵感变换了问法,拷问了可能是当时最强的大模型ChatGPT-4o、谷歌Gemini Advanced以及Claude 3.5 Sonnet——9.11和9.9哪个更大?这几家主流大模型通通答错,他也成功将此话题传播开来。

海外主流大模型答题。图源:第一财经

Grok-3发布会的背景板上,写着"our mission is to understand universe(我们的使命是了解宇宙)"。马斯克曾表示,xAI公司的目标就是“了解宇宙”。

在一周前,马斯克在直播中评论DeepSeek R1时,曾信心满满地表示“xAI即将推出更优秀的AI模型”。从现场展示的数据来看,Grok3在数学、科学与编程的基准测试上已经超越了目前所有的主流模型,马斯克甚至宣称Grok 3未来将用于SpaceX火星任务计算,并预测“三年内将实现诺贝尔奖级别突破”。

xAI在X平台直播,马斯克到场。图源:中国新闻周刊

马斯克强调,Grok-3可以减少AI幻觉,方法是通过来回检查数据并尝试实现逻辑一致性。他还透露,训练Grok-3所使用的算力远多于此前的版本,并使用了大量合成数据。

不同于DeepSeek的算法优化路径(DeepSeek-V3用2048个H800 GPU,训练2788千小时),xAI透露,Grok-3的开发的得益于用8个月时间建成的Colossus超级计算机,它由10万个英伟达的H100 GPU驱动,为训练提供了2亿个GPU小时,比Grok-2多十多倍。

此外,xAI宣布推出名为Deepsearch的Grok-3智能搜索引擎,名字和Deepseek颇有几分相似。

来源:九派新闻综合东方财经、第一财经、中国新闻周刊等

相关文章

逛展有话说⑨丨我遇到了一群“问题青年”

湖南日报·新湖南客户端记者 刘瀚潞在湖南美术馆,我遇到了一群“问题青年”。王麟,青年策展人,也是这群“问题青年”的头。他搜集了一批没有答案的问题,用艺术家的作品呈现出来,策划了一个展览——“总有些问题刺破时间”。汤杰的问题在这个水缸里,他用清水和细沙制造《云卷云舒》,当观者靠近时,水带动沙子运动,微
2025-04-04 14:53:00

没有一株麦子不爱春天

来源:【河北经济日报】□米丽宏每每春近,人们就会说,春江水暖鸭先知;其实,北方的田野里,对春最敏感的,当属经冬的麦苗了。风气稍一变暖,苍绿的麦田便像浮起一层春水,质地水灵了,颜色也悄悄换新。也许历尽酷寒,才懂春天的可贵。麦苗子一接收到春讯,便速速掀开残冰,努力拱起身子,向着阳光舒展开了第一枚蜷缩的叶
2025-04-04 12:16:00

法律惩戒+正确引导,唤醒粉丝的理性与边界感

图源北京日报据媒体报道,首都机场公安局北京首都国际机场分局针对粉丝在登机口聚集追拍、进入隔离区后追逐逗留拍照等扰序行为,依法打击多名违法行为人,今年以来已对31名违法行为人进行了行政处罚。公安部门也对侵犯公民个人信息的多名犯罪行为人依法追究了刑事责任。近期,网信部门也会同体育主管部门持续加大对网上体
2025-04-04 10:04:00

马斯克:很快将辞去政府效率部职务是“假新闻”

美国企业家埃隆·马斯克2日在社交媒体上说,有关他很快将辞去美国政府效率部职务的报道是“假新闻”。美国白宫新闻秘书莱维特当天在社交媒体上转发有关马斯克辞职的报道时称:“这个‘独家新闻’是垃圾。”马斯克随后转发莱维特的帖文说:“是的,假新闻。”莱维特在帖文中转发的是美国《政治报》当天早些时候发布的报道。
2025-04-03 15:05:00

《新华每日电讯》关注青岛:人工智能赋能千行百业

新华每日电讯2025年4月3日5版新华社青岛4月1日电(记者 张武岳)在位于山东青岛崂山区人工智能产业园的自然语义(青岛)科技有限公司,工作人员向记者展示了最新研发的语言类大模型“欧拉”:在一台笔记本电脑上,未接入互联网的状态下,该大模型就可以进行与DeepSeek、ChatGPT等相似的“思考”过
2025-04-03 14:35:00

Adobe PR视频编辑软件将支持尼康N-RAW格式

IT之家 4 月 3 日消息,尼康今日官宣,Adobe 视频编辑软件 Premiere Pro 将支持尼康 N-RAW 视频格式。N-RAW 是尼康的高质量 RAW 视频格式,可提供大量影像数据,为用户在后期制作中带来更大的自由度与灵活性。Premiere Pro 对 N-RAW 格式的支持,是通过
2025-04-03 12:44:00

网站内容来自网络,如有侵权请联系我们,立即删除!
站长邮箱 admin@99-bm.com Copyright © 99便民 鲁ICP备19046937号-5