华尔街深度研究:DeepSeek是AI末日吗?
专题:DeepSeek为何能震动全球AI圈
来源:华尔街见闻
春节期间,DeepSeek新一代开源模型以惊人的低成本和高性能引发热议,在全球投资界引发剧震。
市场上甚至出现了DeepSeek“仅用500万美元就复制OpenAI”的说法,认为这将给整个AI基础设施产业带来“末日”。
对此,华尔街知名投行伯恩斯坦在详细研究DeepSeek技术文档后发布报告称,这种市场恐慌情绪明显过度,DeepSeek用“500万美元复制OpenAI”是市场误读。
另外,该行认为,虽然DeepSeek的效率提升显著,但从技术角度看,并非奇迹。而且,即便DeepSeek确实实现了10倍的效率提升,这也仅相当于当前AI模型每年的成本增长幅度。
该行还表示,目前AI计算需求远未触及天花板,新增算力很可能会被不断增长的使用需求吸收,因此对AI板块保持乐观。
“500万美元复制OpenAI”是误读
对于“500万美元复制OpenAI”的说法,伯恩斯坦认为,实际上是对DeepSeek V3模型训练成本的片面解读,简单将GPU租用成本计算等同于了总投入:
这500万美元仅仅是基于每GPU小时2美元的租赁价格估算的V3模型训练成本,并未包括前期研发投入、数据成本以及其他相关费用。
技术创新:效率大幅提升但非颠覆性突破
接着,伯恩斯坦在报告中详细分析了DeepSeek发布的两大模型V3、R1详细技术特点。
(1)V3模型的效率革命
该行表示,V3模型采用专家混合架构,用2048块NVIDIA H800 GPU、约270万GPU小时就达到了可与主流大模型媲美的性能。
具体而言,V3模型采用了混合专家(MoE)架构,这一架构本身就旨在降低训练和运行成本。在此基础上,V3还结合了多头潜在注意力(MHLA)技术,显著降低了缓存大小和内存使用。
同时,FP8混合精度训练的运用进一步优化了性能表现。这些技术的综合运用,使得V3模型在训练时仅需同等规模开源模型约9%的算力,便能达到甚至超越其性能。
例如,V3预训练仅需约270万GPU小时,而同样规模的开源LLaMA模型则需要约3000万GPU小时。
谈及V3模型带来的效率提升,伯恩斯坦认为,与业界3-7倍的常见效率提升相比并非颠覆性突破:
MoE架构的重点是显著降低训练和运行的成本,因为在任何一次只有一部分参数集是活动的(例如,当训练V3时,只有671B个参数中的37B为任何一个令牌更新,而密集模型中所有参数都被更新)。
对其他MoE比较的调查表明,典型的效率是3-7倍,而类似大小的密度模型具有类似的性能;
V3看起来甚至比这个更好(10倍以上),可能考虑到该公司在模型中带来的其他一些创新,但认为这是完全革命性的想法似乎有点夸张,并且不值得在过去几天里席卷twitter世界的歇斯底里。
(2)R1模型的推理能力与“蒸馏”策略
DeepSeek的R1模型则在V3的基础上,通过强化学习(RL)等创新技术,显著提升了推理能力,使其能够与OpenAI的o1模型相媲美。
值得一提的是,DeepSeek还采用了“模型蒸馏”策略,利用R1模型作为“教师”,生成数据来微调更小的模型,这些小模型在性能上可以与OpenAI的o1-mini等竞争模型相媲美。这种策略不仅降低了成本,也为AI技术的普及提供了新的思路。
对AI板块保持乐观
伯恩斯坦认为,即便DeepSeek确实实现了10倍的效率提升,这也仅相当于当前AI模型每年的成本增长幅度。
事实上,在“模型规模定律”不断推动成本上升的背景下,像MoE、模型蒸馏、混合精度计算等创新对AI发展至关重要。
根据杰文斯悖论,效率提升通常会带来更大的需求,而非削减开支。该行认为,目前AI计算需求远未触及天花板,新增算力很可能会被不断增长的使用需求吸收。
基于以上分析,伯恩斯坦对AI板块保持乐观。
标签: 华尔街
辽宁咨询网站搭建优势,打造高效信息平台,助力企业腾飞,辽宁企业腾飞利器,高效咨询网站搭建,构建信息枢纽平台,辽宁企业腾飞之选,高效咨询网站搭建,构建信息枢纽平台
下一篇个人搭建云盘网站,轻松实现云端存储与分享,搭建个人云盘网站,轻松实现云端存储与分享新体验
相关文章
-
华尔街快讯 日历详细阅读
2023年10月华尔街日历:全球金融动态速览2023年10月,华尔街的金融日历再次成为全球投资者关注的焦点,从美联储的政策动向到全球主要经济体的经济数...
2025-10-18 10 华尔街
-
华尔街实时快讯,市场动态与投资机遇解析详细阅读
华尔街,作为全球金融市场的中心,每天都在上演着惊心动魄的市场博弈,实时快讯不仅反映了市场的即时动态,更蕴含着丰富的投资机会,本文将带您一起解析当前的市...
2025-10-15 12 华尔街
-
华尔街快讯app,投资新纪元的利器详细阅读
在当今快速变化的金融市场中,投资者们面临着前所未有的挑战和机遇,为了在市场中占据优势,掌握最新的市场动态和信息至关重要,而华尔街快讯app的出现,正是...
2025-10-15 12 华尔街
-
华尔街惨遭打脸!“债券义警”为何未如期出现?详细阅读
炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 来源:金十数据 过去,“债券义警”是指那些因为认为政府政策不负责...
2025-09-23 18 华尔街
-
稳定币热潮引发华尔街抢人大战 相关岗位薪资直追企业银行董事总经理详细阅读
稳定币热潮对加密钱包技术提供商Dfns可谓利好,但某种程度上,甚至有点好过头了。 联合创始人Clarisse Hagège于今年1月为其初创公...
2025-09-12 19 华尔街
-
就业数据主导市场叙事 华尔街股票交易员不再惧怕通胀详细阅读
华尔街交易员预计周四公布的消费者价格指数将显示通胀持续偏热,但鉴于就业数据主导市场叙事,他们并未预期股市会出现剧烈反应。 花旗集团美国股票交易...
2025-09-11 20 华尔街