您的位置: 首页 > 实时讯息 >

华泰证券:DeepSeek有望加速模型训练与CUDA解耦

0次浏览     发布时间:2025-02-21 08:00:00    

华泰证券研究认为,DeepSeek在V3中使用了相比CUDA更底层的PTX 来优化硬件算法,PTX是CUDA编译的中间代码,在CUDA和最终机器码之间起到桥梁作用。而NSA则使用了OpenAl提出的Triton编程语言高效编写GPU代码,Triton的底层可调用CUDA,也可调用其他GPU语言,包括AMD的rocm以及国产算力芯片语言,如寒武纪的思元590芯片和海光信息的深算一号(DCU)内置的HYGON ISA指令集。LLM的训练短期内虽未完全脱离CUDA 生态,但DeepSeek NSA的推出使其初步呈现出与CUDA解耦的趋势,并为后续适配更多类型的算力芯片奠定基础。以异腾为代表的国产算力已经很好的适配了DeepSeek-R1 等国产模型,并取得了高效推理的效果,华泰证券认为,伴随海外算力的受限,针对国产算力的优化或将有持续进展,值得重视。

相关文章

A股收评:创业板指涨1.36% 两市缩量超2600亿

4月11日,市场全天延续反弹,创业板指领涨,科创50指数盘中一度涨超3%,回补4月7日下跌以来的缺口。截至收盘,沪指涨0.45%,深成指涨0.82%,创业板指1.36%。盘面上,市场热点集中于芯片等科技股方向,个股涨多跌少,全市场超3200家个股上涨。从板块来看,芯片股大涨,富满微、上海贝岭等20余
2025-04-11 15:59:00

北斗大消息!加快建设自主可控、安全可信北斗系统,北斗概念股直线拉升

金融界4月11日消息 北斗系统大消息!工信部发文表示引导北斗芯片企业调整算法及产品结构,面向各行业不断加大北斗产品供给量。受此影响,午后合众思壮、北斗星通直线拉升涨停,航宇微、创远信科、华力创通、臻镭科技、振芯科技等跟涨。工业和信息化部电子信息司在《新型工业化》发布《践行新时代北斗精神 高质量发展北
2025-04-11 13:53:00

华为云公布AI基础设施架构突破性新进展 CloudMatrix 384超节点已规模上线

央广网芜湖4月10日消息(记者 万玉航)4月10日,华为公司常务董事、华为云计算CEO张平安在华为云生态大会2025上公布了AI基础设施架构突破性新进展——推出基于新型高速总线架构的CloudMatrix 384超节点集群,并宣布已在芜湖数据中心规模上线。华为公司常务董事、华为云计算CEO 张平安据
2025-04-10 22:59:00

四川乐山机场三字代码获批确定为“LSG”,预计年底前具备通航基本条件

4月10日,据乐山发布消息,近日国际航空运输协会IATA官网显示,乐山机场三字代码获批,确定为“LSG”。“LSG”取“Le Shan Gateway”首字母。机场三字代码是机场符号化的名字,具有唯一性,用于国际通用。上述消息称,此次乐山机场从申报材料上报至成功获批用时仅17天,创下国内机场代码审批
2025-04-10 19:43:00

百度官宣:将于4月25日Create开发者大会上发布文心4.5 Turbo

4月1日,据百度官方消息,百度将在4月25日举办的Create2025百度AI开发者大会上发布文心大模型4.5 Turbo。此前一个月,百度发布了文心大模型4.5及文心大模型X1两款大模型。其中,文心4.5是百度首个原生多模态大模型,在多模态理解、文本和逻辑推理等方面表现卓越,在多项测试中表现优于G
2025-04-10 13:20:00

【大力优化营商环境 加快高质量发展】河北:“多次跑”到“高效办” 政务服务再升级

【大力优化营商环境 加快高质量发展】河北:“多次跑”到“高效办” 政务服务再升级
2025-04-09 20:17:00

网站内容来自网络,如有侵权请联系我们,立即删除!
站长邮箱 admin@99-bm.com Copyright © 99便民 鲁ICP备19046937号-5