近期來自中國的 AI 新創公司 DeepSeek 宣稱以 600 萬美元成本,開發出能媲美 OpenAI 與 Google 花費 10 億美元的 R1 AI 模型。訊息一出,隨即讓輝達 (Nvidia)、微軟 (Microsoft) 等知名科技業者蒸發上千億美元市值。但這個 「600 萬美元」開發成本的說法很快就遭到質疑,做為川普 (Donald Trump) 欽點的 AI 加密沙皇 David Sacks 於 2/3 受訪,並向大家詳細剖析 DeepSeek 背後的技術、成本、資金來源,以及中國 AI 崛起對全球的影響。
Table of Contents
DeepSeek 只花 600 萬美金,Sacks 直言不可能
Sacks 率先指出,600 萬美金可能只是 DeepSeek 最後一次訓練模型的成本,這並不代表是總研發成本。如果要真正比對,應該拿 OpenAI 或 Google 最後一次訓練 GPT-4 或 Gemini 的成本來比,這樣才公平。
而 Sacks 也引用知名半導體分析師 Dylan Patel 的說法。Sacks 表示,DeepSeek 及其關聯的對沖基金公司共擁有 5 萬顆 Nvidia Hopper 晶片,其中包括 1 萬顆 H100、1 萬顆 H800、3 萬顆 H20。這些晶片成本加起來遠遠超過 10 億美金,和「600 萬美金開發成本」的說法根本對不上。
廣告 - 內文未完請往下捲動
他進一步說,美國早已禁止輝達的高階 AI 晶片出口到中國。但有傳聞中國企業透過「新加坡公司」來下訂單,讓輝達先將晶片送往新加坡,然後再間接運回中國。如果這個訊息屬實,那美國對中國的 AI 晶片管制恐怕是形同虛設。
蒸餾技術曝光,DeepSeek 是否偷了 OpenAI 的 AI
另一個更敏感的話題是,DeepSeek 的 AI 模型可能直接從 OpenAI 學習而來。Sacks 表示 DeepSeek 可能利用知識蒸餾技術 (Knowledge Distillation),也就是利用 OpenAI 的 API,來讓小型 AI 向大型 AI 學習。舉例來說,研究人員可以輸入各種問題,讓 OpenAI 的 GPT-4 回答,然後把這些答案用來訓練自己的 AI,等於是抄襲 OpenAI 的智慧。
而 Sacks 進一步說,DeepSeek 所發表的 R1 模型,其中許多的測試結果都顯示語言風格、回答邏輯、推理方式與 GPT-4 極為相向。甚至有 AI 會自爆,當被問到「你是哪種 AI 模型」時,DeepSeek 的 AI 居然回覆:「我是 ChatGPT-4。」不禁讓人質疑,DeepSeek 是否大量使用 OpenAI 的 API 進行知識蒸餾,甚至 OpenAI 本身也發表聲明,指控 DeepSeek 使用不正當方式獲取 OpenAI 模型的知識。
中國 AI 技術崛起,美國還能保住領先地位嗎?
對於美國是否仍舊是全球 AI 產業的領頭羊,Sacks 表示美國的 AI 科技巨頭們過去一直自信滿滿,認為中國 AI 至少落後美國約 6 到 12 個月,但 DeepSeek R1 的推出讓時間縮短至 3 到 6 個月。而主持人也提出疑問,在 AI 技術未來可能全面開源的情況下,美國科技業者該如何應對:
-
AI 模型越來越便宜,真正的價值在哪裡?
-
中國企業會不會繞過美國技術,自行發展?
- 美國對中國的 AI 晶片出口管制,可能迫使中國發展自己的 AI 晶片和技術生態系統。Sacks 指出,隨著 AI 設計能力持續提升,中國可能不需要最先進的 2nm 晶片,也能用較舊的技術促使 AI 突破。
-
美國政府是否該出手?
AI 競爭百家爭鳴,美中科技戰更激烈
Sacks 最後表示,DeepSeek 的 AI 發展無論是否透過「知識蒸餾」來從 OpenAI 學習,都讓全球 AI 競爭進入全新階段。中國 AI 公司首次站上世界舞臺,甚至可能帶動 AI 完全開源化,這對 OpenAI、Google、微軟等知名科技業者來說,都是前所未有的挑戰。而未來 AI 技術競賽,將不再只是誰的模型更強,而是誰擁有最多的數據、最好的應用場景,以及最廣的市場佈局。
(川普政府研擬加大限制輝達 H20 晶片銷往中國,輝達:恐刺激中國晶片發展)
風險提示
加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。