根據外媒《TechCrunch》取得的內部文件,為 Google Gemini 進行評級的承包商,正在將 Gemini 的答案與 Anthropic Claude 相比較,用來改進 Gemini!
承包商的工作是負責根據多種標準(例如真實性和冗長程度),對模型輸出的準確度進行評分,每個指令有 30 分鐘的時間,讓承包商決定 Gemini 或 Claude 的答案哪個較好。
會發現 Google 透過 Claude 來改善 Gemini,是因為承包商近期在工作用到的內部平台上,看到了「我是 Claude,由 Anthropic 創建」等字樣的輸出結果。
承包商還發現,Claude 的安全設定是 AI 模型中最為嚴格的,只要指令被認定為不安全 AI 就不回應,例如扮演不同的 AI 助理。外媒表示,一般而言 AI 模型會透過產業基準測試來評估,而不會讓承包商拿模型的回覆與競爭對手的 AI 一一比對。
Anthropic 的商業服務條款是禁止客戶在未經公司批准下,存取 Claude 以「建立競爭產品或服務」或用來「訓練競爭的 AI 模型 」。Google 是 Anthropic 的主要投資者之一, Google 發言人目前未透露是否已取得 Anthropic 的核准。
Google 發言人指出,DeepMind 確實會比較模型的輸出以進行評估,「根據標準行業慣例,在某些情況下,我們會比較模型輸出作為評估過程的一環,」但不會透過 Anthropic 模型訓練 Gemini。
:Jocelyn
:Chris
本文初稿為 INSIDE 使用 AI 編撰;快加入 INSIDE Google News 按下追蹤,給你最新、最 IN 的科技新聞!