Google 已透過其 ImageFX 平台向所有美國使用者提供最新的圖像生成 AI 模型「Imagen 3」,並發表了一篇研究論文。Imagen 3 最初在 5 月份 Google I/O 上亮相,於 6 月先開放給部分 Vertex AI 用戶體驗。
Google 在論文中介紹 Imagen 3 是一種潛在擴散模型(Latent Diffusion Models,LDM),且公司表示在評估時 Imagen 3,顯示它優於其他最先進的模型。
與其他 AI 圖像工具一樣,Imagen 3 可以根據使用者提示建立圖像,同時可修改圖像中的特定部分。
不過使用者對 Imagen 3 的反應褒貶不一,有些用戶稱讚其紋理和文字辨別功能有進步,但也有用戶對模型嚴格的內容過濾機制表示失望。
像 Reddit 上就有位用戶指出, Imagen 3 雖然具有令人驚嘆的紋理和文字辨識能力,但整體來說他認為新一代模型比 Imagen 2 差。
Imagen 3 的審查機制是一大受批評的焦點,許多使用者認為他們下了看似無害的指令卻還是生成不了圖像;另一位 Reddit 用戶則評論 Imagen 3 審查太嚴格了,甚至無法生成一個改造人。
Google 強調公司使用了廣泛的過濾和數據標註方法,來減少數據集中的有害內容,並降低出現有害輸出結果的可能性。Imagen 3 會拒絕生成泰勒絲等公眾人物的圖像,也不會產生武器的圖像。
但這些使用者評論也凸顯了 Google 致力於打造負責任 AI 時,有可能與用戶對創作自由的渴望之間出現衝突。
另一個極端則是馬斯克 xAI 剛推出的 Grok 2 模型,該模型對於生成圖像幾乎沒有任何限制,但有人推測隨著美國總統大選逼近,Grok 2 之後可能會開始受到管制。
:Jocelyn
:Sisley
本文初稿為 INSIDE 使用 AI 編撰;快加入 INSIDE Google News 按下追蹤,給你最新、最 IN 的科技新聞!



2024-08-16
