Sign in

Member Benefits

Get Demands

View Business Cards

Exclusive Service

Noble Identity

AS LOW AS 1.5U /DAY

迎戰 Google Gemini,OpenAI 傳即將端出 GPT-Vision 以及多模態 AI「Gobi」

Share

2023-09-22

據報導,OpenAI 正準備推出 GPT-4 的圖像理解能力,這是曾經在 GPT-4 發布時引發軒然大波的能力。目前除了少部分測試用戶之外,一般 GPT-4 用戶無法使用這項能力。

隨著 Google 即將發布多模態(multimodal)語言模型挑戰 OpenAI 的 GPT-4,OpenAI 也正摩拳擦掌準備迎擊,據報導,OpenAI 正準備推出 GPT-4 的圖像理解能力,這是曾經在 GPT-4 發布時引發軒然大波的能力——可以僅憑一張手繪網頁圖,就能產生整個網頁的程式碼。目前除了少部分測試用戶之外,一般 GPT-4 用戶無法使用這項能力。

現在 GPT-4 最大競爭對手之一,就是秋季即將發表的 Google AI 模型 Gemini。為了對抗 Gemini,OpenAI 可能會以「GPT-Vision」這個名字,正式向公眾推出 GPT-4 圖像理解能力。在 OpenAI 剛發布的 DALL-E 3 中整合了 ChatGPT,讓使用者可以用聊天機器人來產生提示詞,而不用親自輸入複雜詳細的提示。GPT-Vision 也有可能與 DALL-E 3 相互整合。

GPT-4 這些新功能可能會在 OpenAI 將於 11 月首次舉辦的開發者大會上公布。先前,OpenAI CEO Sam Altman 曾暗示他將在那天宣布一個「很棒的東西」,但預計應該不會是 GPT-4.5 或者 GPT-5。

此外,根據 The Information 報導,OpenAI 內部還有一個全新的 AI 模型,代號為 Gobi,該模型從一開始就被設計為多模態,未來有可能成為 GPT-5。

:Chris

快加入 INSIDE Google News 按下追蹤,給你最新、最 IN 的科技新聞!

  • OpenAI 推出 DALL-E 3,直接請 ChatGPT 幫你下提示
  • Google Gemini 模型將打敗 OpenAI 的 GPT-4?Sam Altman 狠酸:不敢相信!

 

 

Disclaimer:
Details
HUIDU.io

GROWTH DRIVEN GLOBAL PTE. LTD. 202618650K

101 THOMSON ROAD, #28-03A, UNITED SQUARE, SINGAPORE 307591

Copyright 2026 HuiDu