您的位置: 首页 > 实时讯息 >

“大力出奇迹”,20万卡练出马斯克口中“最聪明的AI”

0次浏览     发布时间:2025-02-18 16:47:00    

Grok 3,马斯克口中“最聪明的AI”来了! 2月18日中午12时许,马斯克(Elon Musk)的AI公司xAI研发的新一代AI基座大模型Grok 3正式发布。耗费了20万张GPU的Grok 3显示,“卷算力”目前仍是核心。

Grok 3的三个亮点

据马斯克团队介绍,Grok 3模型和Grok 3 mini(Reasoning,精简版)在数学推理、科学逻辑推理和代码写作等能力表现方面超越了所有主流模型,包括GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3和Gemini-2 Pro等。

同时,具备推理能力的Grok-3 Reasoning Beta和Grok-3 mini Reasoning则是超越了类似的推理模型,包括DeepSeek-R1和OpenAI的o3 mini等。

发布会上,马斯克提及,Grok 3的推理模型还支持一项名为DeepSearch搜索引擎新功能的应用。Deep Search通过扫描互联网和X平台上的信息进行分析,并生成摘要以回答用户提出的问题,在这一过程中还可以“推测用户的真正意图”,在经过交叉比对不同信息来源后,确保能向用户返回正确的信息。

快思慢想研究院院长、原商汤智能产业研究院创始院长田丰在接受澎湃科技采访时表示,从发布会上的内容看,Grok3有三个亮点:一是通过缩放定律Scaling Law显著提升模型性能,二是数学与编程等逻辑推理能力大幅增强,三是融入智能体产品化设计。

澎湃科技注意到,曾担任OpenAI创始团队、斯坦福博士,训练大型深度神经网络的工程师Andrej Karpathy,分享了其用户体验。

Andrej 称,在今天早上大约使用了两个小时的过程中,他感受到,Grok3加上深度思考(Thinking)模式的能力略好于DeepSeek-R1和Gemini2.0 Flash Thinking。这是相当令人难以相信的,不过,现在模型给出的答案是随机的,每次可能会给出略有不同的答案,现在还处于早期阶段,在接下来的时间,还需要更多的评估。

模型将进入“神仙打架”

“不过这场大语言模型(LLM)模型领域的竞赛令人非常兴奋!”Andrej 说。

伴随人工智能快速迭代,模型的领先优势的“保质期”越来越短,此前有业内人士向澎湃科技表示,“不超过100天,就会有新的模型出现,并超越。”

快思慢想研究院院长、原商汤智能产业研究院创始院长田丰在接受澎湃科技采访时也表示,接下来将进入神仙打架阶段,“Grok3‘PK’DeepSeek V3,马上就会有人来‘PK’Grok 3,也许是GPT4.5”。根据此前OpenAI对外公布的信息,GPT4.5的发布日期已经列入日程。

另有观点认为,目前的大模型行业,训练还未卷完,范式已经统一。

目前Grok3并未开放给普通用户使用,实际推理效果还要使用产品后看,目前看起来基准测试是达到GPT-o1水平的模型,但还不确定实际效果,推理能力的最佳呈现是数学和代码。马斯克在这次直播中主要展现了Grok3的数学计算和代码的能力。

卷算力目前是核心

值得一提的是,在DeepSeek开启了低成本训练模型的风潮后,Grok 3却是花了重金。Groks 3短时间内反超之前的SOTA模型(state-of-the-art model指在该项研究任务中,目前最好/最先进的模型),说明“卷算力”目前仍是核心。

在此次发布会上,马斯克透露,Grok 3的计算能力是Grok 2的10倍以上,Grok 3训练过程累计消耗20万张英伟达GPU,计算资源的显著提升帮助Grok 3能更高效地处理大型数据集,缩短了模型训练时间也提高了准确性。有分析称,Grok 3算力消耗是Deepseek V3的263倍。

据xAI团队透露,Grok 2模型使用了2400亿参数规模,性能媲美GPT-4,为了训练Grok 3,xAI团队也将数据中心容量翻倍。

马斯克团队在发布会上表示,“早在去年4月,马斯克就决定创建我们自己的数据中心。我们大约在四个月内建立了数据中心,并花了122天时间,让10万个GPU启动并运行,这是一项艰巨的工作。我们相信这是同类中最大的全连接的H100集群。但我们并没有止步于此。”

“我们每天都在不断改进模型。”马斯克称,目前,Grok 3测试版现已面向马斯克的社交媒体平台X Premium用户推出。

田丰认为,Grok 3采用的还是“大力出奇迹”的模式,因其使用了20万块英伟达GPU卡训练而成,是典型的“又好又贵”。从数据来看,Grok 3的推理能力远远超过前一代的Grok 2模型。“xAI基础设施的建设能力全球领先,相比于10万块卡用了120多天,最新的20万块GPU集群只用了92天完成施工搭建,且利用率应该很高,值得中国算力供应链借鉴。”田丰补充说。

商业化布局更进一步

与DeepSeek相比,Grok 3最大的短板在于它并非开源模型,且需要付费。针对是否开源的问题,马斯克也在直播中回应,Grok 3并未开源,但“按照惯例,我们会在新模型发布时,将上一代模型进行开源。因此,可以预见的是,在几个月后,Grok-3也将迎来其开源时刻。”

此次推出的Grok 3测试版本已面向社交平台X上的付费用户开放,此外,xAI还推出了更高阶的Super Grok订阅服务。

“发布会只提到X用户能选择付费版的Grok 3与Super Grok服务,但没有提toB企业客户如何使用目前闭源的Grok 3大模型,相信今年马斯克会发布美国政企客户使用Grok的价格,因为发布会展示了游戏创意、航天科研等产业场景。”田丰预测。

单从xAI的资本投入角度,也确实存在进一步扩大商业化的需求。成立于2023年的xAI,日前正加速其资本布局,在2024年的11月,xAI告知投资者,该公司在最新一轮融资中筹集了50亿美元,估值达到500亿美元。2024年12月24日,xAI在其官网宣布已完成60亿美元(约合人民币438亿元)C轮融资,目前xAI公司的市值已超过400亿美元。据美国媒体报道,xAI正寻求新一轮约100亿美元的融资,此轮融资将使公司估值达到约750亿美元。

澎湃新闻记者 喻琰

(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)

相关文章

每一个奋斗者心中都有一条“红旗渠”

面对困难,您选择苦熬还是苦干?1959年,太行山有一群人面对河流干涸,水库见底,吃水困难他们摔杯为号,大吼一声:“苦熬熬不到头,苦干才有出路! ”不等不靠、自力更生他们心中暗暗下定“重新安排林县河山”的决心历时10年用双手在太行绝壁上“抠”出一条1500公里长的“人工天河”世代缺水的问题成为了历史4
2025-04-05 14:33:00

滴滴将在巴西重启外卖业务

来源:格隆汇APP格隆汇4月5日|滴滴宣布近期将以“99 Food”的品牌,重启巴西外卖业务,通过协同巴西本地出行和支付等多元化服务,持续提升用户“一站式“体验,为用户提供更多选择。据悉, 滴滴于2018年通过收购出行平台99进入巴西市场,经过7年的发展,滴滴目前在巴西拥有5000万活跃用户、约70
2025-04-05 10:00:00

发耳玛瑙红樱桃即将上市 4月12日开园采摘

【来源:六盘水市人民政府_今日凉都】4月2日,记者从水城区召开的2025早春农特品牌推介暨樱桃旅游节新闻发布会上获悉,具有北纬26度“早春第一果”之美誉的水城区发耳玛瑙红樱桃即将“抢鲜”上市,预计于4月12日开园采摘,采摘时间可持续到5月中旬。发耳地处北盘江低热河谷,日照充足、土壤肥沃、水汽充足,给
2025-04-04 15:19:00

小米事故警示录:谁是吞噬生命的帮凶?

21世纪经济报道记者 郑植文 易思琳 报道“中国智驾的唯一敌人,不是技术进步本身,而是过度宣传和对用户的误导。”小米SU7致死事故发生后,一位车企人士在他的朋友圈写道。今年以来,汽车行业掀起一场全民智驾热潮。有的车企把2025年定义为“全民智驾元年”,要推动“智驾平权”;有的车企发布最新智驾系统,要
2025-04-04 00:19:00

苹果iPhone新专利曝光 一部手机六面屏

近日,patently apple曝光了苹果一系列令人瞩目的专利,其中六面屏iPhone专利尤为吸睛。众所周知,传统触摸设备正面通常采用玻璃盖板,而苹果这项新专利描述的六面屏iPhone却大胆突破,其外壳,包括侧面和背面,全部采用玻璃材质,彻底颠覆了现有的iPhone形态。全玻璃机身设计为六面屏iP
2025-04-03 18:26:00

马斯克:很快将辞去政府效率部职务是“假新闻”

美国企业家埃隆·马斯克2日在社交媒体上说,有关他很快将辞去美国政府效率部职务的报道是“假新闻”。美国白宫新闻秘书莱维特当天在社交媒体上转发有关马斯克辞职的报道时称:“这个‘独家新闻’是垃圾。”马斯克随后转发莱维特的帖文说:“是的,假新闻。”莱维特在帖文中转发的是美国《政治报》当天早些时候发布的报道。
2025-04-03 15:05:00

网站内容来自网络,如有侵权请联系我们,立即删除!
站长邮箱 admin@99-bm.com Copyright © 99便民 鲁ICP备19046937号-5