您的位置: 首页 > 实时讯息 >

阿里发布最新开源推理模型,“性能比肩DeepSeek-R1”

0次浏览     发布时间:2025-03-07 00:20:00    

澎湃新闻记者 胡含嫣

阿里通义发布最新开源推理模型,称其性能比肩DeepSeek-R1。

3月6日凌晨,阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B。据介绍,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1,同时大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。QwQ-32B采用了Apache 2.0开源协议,目前,所有人都可免费下载及商用QwQ-32B模型,或通过网页版Qwen Chat进行体验,该模型也将免费上架通义APP。

阿里通义团队表示,QwQ-32B模型拥有320亿参数,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。在冷启动的基础上,模型针对数学和编程任务、通用能力分别进行了两轮大规模强化学习,在32B的模型尺寸上获得了令人惊喜的推理能力提升,印证了大规模强化学习可显著提高模型性能。

此外,QwQ-32B模型中还集成了与智能体(Agent)相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。

千问QwQ-32B既能提供极强的推理能力,又能满足更低的资源消耗需求,这背后的奥秘便在于强化学习(Reinforcement Learning)。阿里通义团队表示:“我们希望,我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能(AGI)的可行之路。”

在一系列权威基准测试中,千问QwQ-32B模型都表现出色,几乎完全超越了OpenAI去年9月发布的尺寸相近的o1-mini模型,比肩最强开源推理模型DeepSeek-R1:在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型。

QwQ-32B模型和R1、OpenAI-o1-mini等知名模型的评分比较。来源:阿里通义

阿里通义团队表示,未来将继续探索将智能体与强化学习的集成,以实现长时推理,探索更高智能进而最终实现AGI的目标。

3月6日早盘,阿里巴巴集团(09988.HK)港股大幅高开涨超6%,截至午盘涨超7%。

此前,2月25日,阿里通义Qwen发布基于旗舰模型Qwen2.5-Max构建的推理模型QwQ-Max-Preview预览版,支持联网搜索,会和DeepSeek以及Kimi的推理模型一样展现思考过程,目前用户可在通义千问网页版进行体验。



本期编辑 邢潭


图片

相关文章

下一代iPad mini或搭载三星OLED屏,计划于 2026 年推出

据知名苹果供应链爆料人“数码闲聊站”透露,苹果正评估为下一代iPad mini配备由三星制造的小尺寸OLED显示屏。这一升级或将成为iPad mini系列自2021年换代以来的最大革新,但屏幕刷新率是否突破现有60Hz LCD上限仍是未知数。OLED屏量产时间线成焦点消息指出,三星显示已于2024年
2025-04-05 00:08:00

东方红资管总经理张锋因个人原因离任

北京商报讯(记者 李海媛)4月3日,东方红资管公告称,总经理张锋因个人原因离任,且无转任公司其他岗位的说明。4月3日起,公司党委书记、董事长杨斌代任总经理。东方红资管表示,公司经过多年积累和发展,已经形成了统一的企业文化价值观,拥有较为健全的投研体系、销售服务体系和产品创新体系,建立了科学的人才培养
2025-04-03 22:01:00

《新华每日电讯》关注青岛:人工智能赋能千行百业

新华每日电讯2025年4月3日5版新华社青岛4月1日电(记者 张武岳)在位于山东青岛崂山区人工智能产业园的自然语义(青岛)科技有限公司,工作人员向记者展示了最新研发的语言类大模型“欧拉”:在一台笔记本电脑上,未接入互联网的状态下,该大模型就可以进行与DeepSeek、ChatGPT等相似的“思考”过
2025-04-03 14:35:00

OpenAI o3模型运行成本估算从3000美元涨至3万美元

IT之家 4 月 3 日消息,上周,负责维护和管理 ARC-AGI 的 Arc Prize Foundation 对 OpenAI 的 o3 “推理”人工智能模型在 ARC-AGI 基准测试中的成本估算进行了重大修订,现在看起来 o3 的运行成本没有那么低。去年 12 月 OpenAI 推出 o3
2025-04-03 07:59:00

创新推出“算力券”机制,长沙经开区赋能“人工智能+机器人”产业发展

近日,长沙经开区在全省率先发布了《关于推动“人工智能+机器人”创新发展的若干措施》(以下简称《措施》),从人工智能产业、开源技术、机器人三个领域提出10项具体举措,通过一系列奖补措施,支持这些领域的企业加速技术创新和应用开发。作为国家级经济技术开发区,长沙经开区始终紧跟国家战略步伐,积极响应湖南省关
2025-04-02 22:42:00

医育融合护航幼儿健康!高明举办“医育结合”合作签约仪式

为了深化婴幼儿照护服务与医疗健康资源协作,推进“医育结合”服务模式落地,4月2日,高明区举行医疗机构支持托育机构发展暨“医育结合”签约仪式,推进本地医疗卫生与托育服务资源深度融合。 高明区人民医院妇幼院区设有儿童保健检查区。高明融媒记者陈嘉懿摄活动中,高明区人民医院等6家医疗机构分别和6家托育机构进
2025-04-02 20:43:00

网站内容来自网络,如有侵权请联系我们,立即删除!
站长邮箱 admin@99-bm.com Copyright © 99便民 鲁ICP备19046937号-5