
deep think的问世能否对英伟达起到毁灭性的打击?相信最近有不少朋友已经注意到了,曾经不可一世的英伟达近日股价却暴跌了近17%,单日市值蒸发高达5,888亿美元,创下美股有史以来单日市值蒸发的新纪录。Meta、微软、谷歌等科技巨头也纷纷大幅下挫,整个美股科技板块一度陷入恐慌情绪。而之所以会出现这样的现象,主要还是源于Deepthink的问世让整个AI领域看到了一条新路径:那就是花小钱也能办大事。
DeepSeek的核心杀手锏并非在于创新,而在于其颠覆性的成本与效率。据官方数据显示,仅用2,048块意伟达H800 GPU和557.6万美元的投入,DeepSeek就训练出规模高达6,710亿参数的DeepSeekV3。而市面上同等参数规模的GB T 4 训练花费则高达10亿美元左右。再加上后续推出的deep think R1模型推理成本甚至可以降低至OpenAI最新模型oone的1/30。也就是说,如果这些数据都是真实的,就意味着过去被硅谷视为唯有斥巨资拼算力才能做到顶尖的大模型研发模式可能并不是发展AI的唯一路径。
钱永远是最聪明的真金白银。投资者们猛然意识到这种降本增效的技术路径或许会动摇硅谷多年构筑的AI护城河,引发对现有产业估值和商业逻辑的集体反思。那既然有反思当然就会有质疑,投资者们开始质疑硅谷过去以高算力、高成本为核心的发展路径是否已经走到了尽头。华尔街投行花旗分析师阿提夫马利克就评论道:“Deepthink的成就或许极具开创性,这无疑会冲击美国公司在最先进AI模型方面的既有优势。”
而更扎心的是,就像小米以低成本造出新能源汽车一样,DeepSeek的出现也会把现有的投资人分为两派:一部分人会觉得DeepSeek不过是站在了巨人的肩膀上——因为DeepSeek并非从0开始发明新技术,而是充分利用了OpenAI、Meta等公司在大模型领域打下的基础,然后专注工程放大其贡献;更多的在从1到10的优化而非从0到1的颠覆。而另一部分投资人则会想:训练模型真的有那么花钱吗?硅谷的这帮家伙到底把钱都花到哪去了?
但是在我看来,关于是否原创方面的讨论其实对于资本市场而言没有那么重要。因为工程上很多创新就是量变到质变的过程,没有割裂的知识创新——就比如OpenAI也是基于谷歌当年的Transformer。所以拿这个说事意义不大,核心还是是否创造全新的价值体系。
为此这些天我还特意咨询了业内的一些朋友。DeepSeek的核心在于多项关键技术和工程策略:比如混合专家模型将大模型拆分为多个专家模块只在需要时激活相应模块借助自然负载均衡来避免单个专家过载;这样一来就能大幅减少无效计算实现高度稀疏化训练与推理;或者多头前注意力与传统多头注意力相比额外引入前向量动态调整注意力分配从而减少内存占用并提升训练效率;还有双重流水线把GPU计算和数据传输交替运行提高资源利用率避免GPU在等待数据或通信时出现空转;而强化学习与监督微调相结合就可以在少量SFT的数据基础上多轮强化学习策略让模型能自发学会复杂推理和自我反思最终推动模型整体质量逼近甚至超过GPT4在部分领域的表现。
总之形象地说就是硅谷的主流做法好比用5升排量的大肌肉车暴力驱动;而DeepSeek则像岛国车厂通过涡轮增压轻量化设计等精密工程让2.5升排量跑出了5升排量的性能——也就是说DeepSeek这套模式实打实能让企业花更少的成本参与到AI通用模型中去。
那这是否就意味着英伟达的股价会从此一蹶不振呢?对此我个人的看法可能跟很多主流媒体们不太一样。因为早在19世纪时杰文斯在研究蒸汽机时就发现当效率提高成本下降人们反而会使用更多煤炭——这就是所谓的杰文斯悖论。也就是说AI成本的急剧下降很可能会刺激更多企业机构部署大模型从而使得整体算力需求不降反升。
虽然短期来看英伟达和部分科技股大跌会让投资者们恐慌但长远看随着AI应用扩展到更多领域GPU及相关算力的需求量大概率还会爆发式的增长;低成本也并不意味着对硬件永远利空相反它很可能正是让AI普及走向全行业日常化的关键一步。
而在此次AI变革中我们更应该思考的是为什么我们只能去做从1到10却很少能做到从0到1?过去我们还能把原因归结于没有先发优势没有资金积累而现如今国内市场早已不再缺钱那我们缺的究竟是什么呢?我是王大器关注我看完下半段中的“文章”这个词替换为“内容”,希望我的分享能为你带来新的思考。
贷款计算器2025最新版
免责声明:文章内容不代表本站立场,本站不对其内容的真实性、完整性、准确性给予任何担保、暗示和承诺,仅供读者参考;文章版权归原作者所有!本站作为信息内容发布平台,页面展示内容的目的在于传播更多信息;本站不提供任何相关服务,阁下应知本站所提供的内容不能做为操作依据。市场有风险,投资需谨慎!如本文内容影响到您的合法权益(含文章中内容、图片等),请及时联系本站,我们会及时删除处理。
