国泰君安:DEEPSEEK模型降本打开AI应用产业上升通道 腾讯、小米等有望受益
国泰君安发布研报称,DeepSeek实现模型大幅降本,价值有望从模型层转移至应用层。DeepSeek成为全球DAU增速最快的AI应用,20天达成DAU 2000万,带来巨大的推理算力需求。推荐算力方面受益的英伟达(NVDA.US)、台积电(TSM.US)以及应用方面受益的腾讯(00700)、小米(01810)、Meta(META.US)、谷歌(GOOGL.US)。
国泰君安主要观点如下:
DeepSeek通过多处工程创新,实现降低训练成本、降低推理成本、提高模型效果等进展
1)降低训练成本:DeepSeek使用较宽的MOE架构,且提出共享专家机制,每次训练只激活需要的专家(按需调用),而非激活全部专家,从而大大降低训练成本。此外,使用fp8低精度训练、双管道训练、多Token预测等方法进一步降低训练成本。
2)降低推理成本:DeepSeek提出多头潜在注意力(MLA),在不牺牲模型质量的前提下,大幅减少KV缓存的大小。此外,低精度存储和通信、推理阶段动态专家选择等方法进一步降低推理成本。
3)提高模型效果:不同于传统的SFT,DeepSeek使用强化学习做post-training,大幅提升模型推理能力。此外,DeepSeek针对中文做了大量风格对齐,大幅提升模型可用性。
DeepSeek触发模型降本,长期看,打开AI应用产业上升通道,算力需求不降反增
蒸汽机效率提升并没有导致煤炭少用,DeepSeek虽然触发模型大幅降本,但长期看将打开AI应用产业上升通道,算力需求不降反增,因算力需求具备多样性:1)模型向更高智能维度跃迁,训练需要更多算力。2)AI应用的推理需要广泛算力,更多人会去训练和推理自己的模型。3)转向对等异构计算的新主流计算形态需要更多GPU。4)目前模型仅仅停留在对话,未来从对话到任务、到多模态还需要更多算力加持。
根据AI产品榜,DeepSeek应用(APP,非网页)成为增速最快的AI产品,上线20天即达成DAU 2000万,反映出模型能力提升对于用户的巨大吸引力,带来潜在的巨大推理算力需求。
DeepSeek并没有真正绕过CUDA架构
DeepSeek没有使用CUDA的API,而是直接使用PTX,从而对计算过程进行更细粒度的控制。PTX仍然是英伟达GPU架构中的技术,是CUDA编程模型中的中间表示,用于连接CUDA高级语言代码和GPU底层硬件指令。编写PTX代码的做法,首先非常复杂且难以维护,对技术人员要求极高,其次移植性较差,较难移植到不同型号的GPU。
DeepSeek基于PTX进行优化代表他们有优化其他GPU的能力,但既不意味着完全脱离了CUDA生态,也不意味着其他团队有能力直接使用PTX,因此英伟达的CUDA护城河仍在。
风险提示:地缘政治风险;大模型迭代进展不及预期;监管风险;商业化进度不及预期。
标签: 君安
辽宁地区网站搭建程序,打造个性化企业品牌新平台,辽宁定制化企业品牌网站搭建服务,助力企业数字化转型
下一篇彭阳企业网站搭建,助力企业迈向数字化新时代,彭阳企业数字化转型升级,网站搭建新引擎,彭阳企业数字化转型升级,网站搭建新引擎助力新时代飞跃
相关文章
-
国泰君安:中医药政策大力支持产业链协同 头部药企有望率先获益详细阅读
智通财经APP获悉,国泰君安证券发布研报称,国务院办公厅发布《关于提升中药质量促进中医药产业高质量发展的意见》,文件提出要强化中药产业链协同,优化产业...
2025-03-30 44 君安
-
海通被合并,君安被“消失”详细阅读
炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 李丹Fintalk 从2024年9月5日官宣合并消息至今,正好是...
2025-03-15 65 君安
-
国泰君安期货:大A年内首次突破3400,牛随春天一同归来了?详细阅读
张驰宁 投资咨询号:Z0020302 国泰君安期货市场分析师 截至早间收盘,大A走出一根实体大阳线,在连续接近一个月的压制中,今日终于再...
2025-03-14 65 君安
-
“国泰君安+海通”大消息!朱健担任党委书记详细阅读
炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 国泰君安与海通证券合并迎来大消息! 据中国证券报记者了解,合并后...
2025-03-14 60 君安
-
国泰君安:阿里资本开支上行 带动国产算力投资详细阅读
智通财经APP获悉,国泰君安证券发布研究报告称,阿里资本开支超预期,未来3年AI基础设施资本投资年均投资额或将超过500亿元。阿里大幅增加AI基础设施...
2025-02-24 56 君安
- 详细阅读