近期来自中国的 AI 新创公司 DeepSeek 宣称以 600 万美元成本,开发出能媲美 OpenAI 与 Google 花费 10 亿美元的 R1 AI 模型。消息一出,随即让辉达 (Nvidia)、微软 (Microsoft) 等知名科技业者蒸发上千亿美元市值。但这个 「600 万美元」开发成本的说法很快就遭到质疑,做为川普 (Donald Trump) 钦点的 AI 加密沙皇 David Sacks 于 2/3 受访,并向大家详细剖析 DeepSeek 背后的技术、成本、资金来源,以及中国 AI 崛起对全球的影响。
Table of Contents
DeepSeek 只花 600 万美金,Sacks 直言不可能
Sacks 率先指出,600 万美金可能只是 DeepSeek 最后一次训练模型的成本,这并不代表是总研发成本。如果要真正比对,应该拿 OpenAI 或 Google 最后一次训练 GPT-4 或 Gemini 的成本来比,这样才公平。
而 Sacks 也引用知名半导体分析师 Dylan Patel 的说法。Sacks 表示,DeepSeek 及其关联的对冲基金公司共拥有 5 万颗 Nvidia Hopper 芯片,其中包括 1 万颗 H100、1 万颗 H800、3 万颗 H20。这些芯片成本加起来远远超过 10 亿美金,和「600 万美金开发成本」的说法根本对不上。
广告 - 内文未完请往下卷动
他进一步说,美国早已禁止辉达的高级 AI 芯片出口到中国。但有传闻中国企业通过「新加坡公司」来下订单,让辉达先将芯片送往新加坡,然后再间接运回中国。如果这个消息属实,那美国对中国的 AI 芯片管制恐怕是形同虚设。
蒸馏技术曝光,DeepSeek 是否偷了 OpenAI 的 AI
另一个更敏感的话题是,DeepSeek 的 AI 模型可能直接从 OpenAI 学习而来。Sacks 表示 DeepSeek 可能利用知识蒸馏技术 (Knowledge Distillation),也就是利用 OpenAI 的 API,来让小型 AI 向大型 AI 学习。举例来说,研究人员可以输入各种问题,让 OpenAI 的 GPT-4 回答,然后把这些答案用来训练自己的 AI,等于是抄袭 OpenAI 的智能。
而 Sacks 进一步说,DeepSeek 所发表的 R1 模型,其中许多的测试结果都显示语言风格、回答逻辑、推理方式与 GPT-4 极为相向。甚至有 AI 会自爆,当被问到「你是哪种 AI 模型」时,DeepSeek 的 AI 居然回复:「我是 ChatGPT-4。」不禁让人质疑,DeepSeek 是否大量使用 OpenAI 的 API 进行知识蒸馏,甚至 OpenAI 本身也发表声明,指控 DeepSeek 使用不正当方式获取 OpenAI 模型的知识。
中国 AI 技术崛起,美国还能保住领先地位吗?
对于美国是否仍旧是全球 AI 产业的领头羊,Sacks 表示美国的 AI 科技巨头们过去一直自信满满,认为中国 AI 至少落后美国约 6 到 12 个月,但 DeepSeek R1 的推出让时间缩短至 3 到 6 个月。而主持人也提出疑问,在 AI 技术未来可能全面开源的情况下,美国科技业者该如何应对:
-
AI 模型越来越便宜,真正的价值在哪里?
-
中国企业会不会绕过美国技术,自行发展?
- 美国对中国的 AI 芯片出口管制,可能迫使中国发展自己的 AI 芯片和技术生态系统。Sacks 指出,随着 AI 设计能力持续提升,中国可能不需要最先进的 2nm 芯片,也能用较旧的技术促使 AI 突破。
-
美国政府是否该出手?
AI 竞争百家争鸣,美中科技战更激烈
Sacks 最后表示,DeepSeek 的 AI 发展无论是否通过「知识蒸馏」来从 OpenAI 学习,都让全球 AI 竞争进入全新阶段。中国 AI 公司首次站上世界舞台,甚至可能带动 AI 完全开源化,这对 OpenAI、Google、微软等知名科技业者来说,都是前所未有的挑战。而未来 AI 技术竞赛,将不再只是谁的模型更强,而是谁拥有最多的数据、最好的应用场景,以及最广的市场布局。
(川普政府研拟加大限制辉达 H20 芯片销往中国,辉达:恐刺激中国芯片发展)
风险提示