当前位置:首页 > 暴富 > 正文

DeepSeek现象背后:算法博弈与巨头焦虑

  • 暴富
  • 2025-02-03 20:52:04
  • 6

  21世纪经济报道记者孔海丽 北京报道

  从2024年12月发布V3大模型,到最近推出R1模型和多模态模型Janus-Pro,DeepSeek持续出圈,形成了全球AI界甚至整个科技圈的“DeepSeek现象”。

  多次采访马斯克等AI企业家的知名播客主持人莱克斯·弗里德曼(Lex Fridman),用了一个词叫做“DeepSeek 时刻”,“我认为 5年后它仍将作为科技史上的关键事件被人们铭记。”

  DeepSeek出圈的原因之一是,它采用“更聪明”的算法,把AI训练成本砍掉近60%,却实现甚至超越了同类模型的性能。简单来说,同样的产品,别人花100块训练一个AI模型,它只要40元。这种“省钱打法”直接戳中了行业的痛点——过去拼的是谁能买更多高价芯片,现在比的是谁能把芯片用得更好。

  DeepSeek不仅提供了新的AI技术路线,更重要的是,它在硅谷和华尔街联合主导的AI叙事铁墙上撕开了一道口子。

  但自豪和兴奋之余,还是要保持清醒的头脑。且不说,在资金、技术、人才等方面,以DeepSeek为代表的新创AI企业,尚无法向OpenAI、Anthropic 这些巨头发起全面挑战,单单就V3、R1而言,其算法优化也有代价:处理复杂场景时,它的表现明显不如烧钱堆出来的大模型。就像用精简版PS软件修图——日常够用,专业场景会露怯。何况,短时间内我们还不足以撼动英伟达巨头们的硬件江湖。

  摆脱硬件依赖尚不现实

  在“DeepSeek现象”推动下,未来的算力图景,并非单一曲线绘就。

  一方面,像DeepSeek这样的产品,更高流量、更低开发和消费成本,可能带来AI应用的突然爆发,这是所有从业人员梦寐以求的场景。

  另一方面,当训练成本下降刺激更多公司入场,消费者应用呈指数级增加,催生AI生态链全面繁荣,芯片需求将迎来超乎预期的增长。

  硬币两面,恰好构成了算力命题的悖论。

  但是,业内人士援引腾讯之前发布的白皮书,AI Agent应用要实现跳跃式增长乃至爆发,必须闯过三关:场景渗透率大于15%、任务完成度大于80%、用户信任度大于60%。

  仅以信任度为例,此前Gartner的一项抽样调查显示,64%的人表示,不希望在客户服务中使用人工智能。

DeepSeek现象背后:算法博弈与巨头焦虑

  目前AI Agent应用的技术能力仅满足简单场景,如客服、日程管理等。而复杂决策如医疗咨询、法律建议等,仍存在难以填补的缺陷。AI最大的应用场景是教育、医疗、金融等,但是,误诊率5%的AI医生看病,依然很难被接受。就好比,无人驾驶比人类更安全,但无人驾驶每出现一次事故都会被凝视。人类对AI的信任,只是处于初始水平,此外还面临着各国隐私保护法规、用户习惯、能源约束、技术路线分歧、多智能体协作、伦理困境等方面的挑战。

  业内此前预计,要到2026年前后,才将出现AI信任度的分水岭(大于60%)。“DeepSeek现象”会不会加快这个时间表的到来?现在没有人能够断定。

  有人说,2025年将是AI Agent应用元年。而DeepSeek通过异构计算架构、CPU+FPGA+ASIC混合部署和动态负载均衡算法等创新,将单位算力产出提升2倍多,这是否意味着它探索的技术方向将打破算力垄断,导致算力过剩?

  这关系到算力现状。其特点是严重不均衡。一是地区不均衡。北美尤其是美国占据了全球算力最大份额,其次是中国,但高端算力基本集中在北美。

  二是供应不均衡。通用算力芯片厂商主要是英伟达,占据70%以上份额,2025年其GPU销量预计可达700万块;BSIC芯片的主要厂商是博通和Marvell,合计占有超60%的份额;云计算方面,谷歌、微软、亚马逊占据全球65%的市场份额。这就是大家所说的算力垄断。

  三是企业不均衡。微软、Meta、谷歌、亚马逊、xAI几大巨头目前囤积的算力总共约合355万块等效H100,这还不包括AI新贵OpenAI在内。其他经济体企业能拿到的芯片量,无法与之相比。

  算力供需还存在结构性错配的问题。从纵向看,随着多模态应用的普及,推理侧的算力需求增速已经超过训练侧,但算力还主要布局于训练侧,调整需要一点时间;从横向看,大量算力被消耗在数据清洗和模型调试等非核心环节。

  以大模型算力为例。2024年下半年以来,大模型算力已经从训练向推理转移,其中占据推理算力市场最大份额的,仍然是英伟达。

  《中国算力发展报告(2024)》援引援引IDC报告,截至2023年四季度,英伟达全球市场份额达95.9%。英伟达通过在CUDA和GPU两端同时发力,构筑了软硬协同的护城河。有人说DeepSeek通过架构革新,绕开了CUDA,冲破了它的护城河,这其实是误读。多位专家研读DeepSeek公开(开源))论文后表示,V3、R1的底层架构仍然是基于CUDA生态建构。

  在这种市场格局下,其他区域及其厂商要发起挑战,试图打破巨头垄断,摆脱以英伟达为代表的算力依赖,更多是乐观主义的展望式预期。除非量子芯片实现规模化商用,但那是5年甚至10年以后的事。

  至于算力过剩,短期内不存在,整体上仍然是供大于求。《中国算力发展报告(2024)》援引中国信通院数据,截至2023年底,全球算力规模同比增长40%,但以CPU为代表但芯片年性能提升不足15%,无法满足视频、图片等非结构化数据的处理需求。赛迪智库2024年初测算,2023年中国智能算力需求达到123.6EFLOPS,但智能算力供给规模仅为57.9EFLOPS,严重供不应求。“DeepSeek现象”目前看来是增加了而不是减少了硬件需求。比如,32G的英伟达RTX50系显卡,近半个月涨势凶猛,最高已经炒到了6万元以上。其中部分原因在于,消费者购入RTX50显卡去做DeepSeek V3、R1本地化部署。

  AI巨头为何焦虑

  既然DeepSeek尚未突破硬件限制,所做的也是巨人肩上的创新,但为什么还是引起美国AI巨头的焦虑甚至恐慌?

  从表层看,美国AI巨头嗅到了危机,不是因为技术被超越,而是实现目标的技术路径变了,新创企业有了更多选择。就像燃油车时代比拼的是发动机,电动车时代比拼的是电池管理技术。DeepSeek证明了硅谷堆硬件堆数据的路线不是唯一选择,高效用好现有资源同样能打。

  DeepSeek省钱省力的R1模型发布时,刚好是OpenAI、软银、英伟达等科技巨头宣布5000亿美元算力基建——星际之门计划的时间段,放在这个背景下对比来看,美国AI巨头的刺痛感就更强烈了。

  一位资深AI观察人士告诉21世纪经济报道记者,DeepSeek发起的这场“效率革命”,是AI发展从技术理想主义转向工程实用主义的标志性事件。它证明了,在现有硬件和物理约束条件下,通过计算拓扑结构优化获得的边际收益,远高于单纯增加芯片数量的线性增长。

  这解释了为何美国AI巨头会产生战略焦虑的深层因素——当工程创新能力开始在AI竞争中脱颖而出,硅谷长期主导的技术先发优势就面临重估,而且它也将带来AI叙事的重估,背后是资本和资本市场的重估。

  宏观趋势研究学者、经济学家David Woo近日接受访谈时表示,过去两年,人们一直在谈论美国经济的“例外主义”,而AI是推动这一论断形成的重要因素。美股市值占全球资本市场的份额达63%,其中ChatGPT出现后的两年,就增加了10个百分点,而七大科技巨头又占美股市值的25%。这些巨头正是依靠AI技术的强大优势巩固了它们的地位,从而间接巩固了美国资本市场的优势地位。

  因此,AI与美国科技巨头、资本市场其实是捆绑在一起的,也正是硅谷和华尔街联合主导了全球AI叙事。

  如今,来自东方的神秘力量DeepSeek向这套AI叙事发起了冲锋。全球科技和资本领域持续10多天的热烈反应,可以从侧面解释科技巨头的焦虑和资本市场为何如此紧张。

  前述资深AI分析人士认为,DeepSeek创造的历史性价值有两点:一是力行开源,本质上是人类资源的共享表达;二是提供了碓砌算力和数据之外的新的技术路径。记者这几天的采访发现,DeepSeek以上两点价值,基本已成为业内的共识。

  在现实层面,DeepSeek耶揭示了一个残酷的真相:当创新进入深水区,工程能力比学术突破更重要,成本控制比参数竞赛更致命,社会接受度比算法精度更关键。

  如果跳开地缘政治谁赢谁输的问题,仅仅着眼于行业本身,商业本质在于,赚钱的公司才能活下去。当资本泡沫退去,或许我们会发现,技术强大固然重要,但应用和生存才是企业当下的现实,也是所有AI企业的必答题。

  从 “谁能烧钱造最大模型”,过渡到“谁能用最少钱办最多事” ;美国依然掌握着最先进的芯片,但中国找到了更省钱的玩法——这才是DeepSeek重新书写的AI叙事。

  毕竟,不是所有新创企业都像OpenAI、xAI动不动就能融资到60亿美元。正是在这个意义上,DeepSeek的技术路线,受到全球大批AI企业的效仿,其开源策略受到全球研究机构的称赞,其价格策略引发全球消费者的热捧。

  高效率低成本的技术创新,加上全球关注的巨大流量,让DeepSeek赢得了宝贵的时间窗口。这是堆积美元也难以买到的,也是OpenAI、Anthropic等AI新创企业羡慕甚至嫉妒的。

有话要说...