外媒曝：Google 外包正在用 Claude 改善 Gemini-灰度官网

外媒表示，一般而言 AI 模型會透過產業基準測試來評估，而不會讓承包商拿模型的回覆與競爭對手的 AI 一一比對。

根據外媒《TechCrunch》取得的內部文件，為 Google Gemini 進行評級的承包商，正在將 Gemini 的答案與 Anthropic Claude 相比較，用來改進 Gemini！

承包商的工作是負責根據多種標準（例如真實性和冗長程度），對模型輸出的準確度進行評分，每個指令有 30 分鐘的時間，讓承包商決定 Gemini 或 Claude 的答案哪個較好。

會發現 Google 透過 Claude 來改善 Gemini，是因為承包商近期在工作用到的內部平台上，看到了「我是 Claude，由 Anthropic 創建」等字樣的輸出結果。

承包商還發現，Claude 的安全設定是 AI 模型中最為嚴格的，只要指令被認定為不安全 AI 就不回應，例如扮演不同的 AI 助理。外媒表示，一般而言 AI 模型會透過產業基準測試來評估，而不會讓承包商拿模型的回覆與競爭對手的 AI 一一比對。

Anthropic 的商業服務條款是禁止客戶在未經公司批准下，存取 Claude 以「建立競爭產品或服務」或用來「訓練競爭的 AI 模型」。Google 是 Anthropic 的主要投資者之一， Google 發言人目前未透露是否已取得 Anthropic 的核准。

Google 發言人指出，DeepMind 確實會比較模型的輸出以進行評估，「根據標準行業慣例，在某些情況下，我們會比較模型輸出作為評估過程的一環，」但不會透過 Anthropic 模型訓練 Gemini。

：Jocelyn
：Chris

本文初稿為 INSIDE 使用 AI 編撰；快加入 INSIDE Google News 按下追蹤，給你最新、最 IN 的科技新聞！