Sign in

Member Benefits

Get Demands

View Business Cards

Exclusive Service

Noble Identity

AS LOW AS 1.5U /DAY

外媒曝:OpenAI 開發出新多模態 AI 模型了!明嘲暗諷都可辨識 

Share

2024-05-13

新模型能幫助客服更好地理解來電者的語氣,以及是否在諷刺,且「理論上」能夠協助學生解決更多數學問題。

OpenAI 已開始向部分客戶展示一款新的多模態 AI 模型,該模型能夠進行對話並辨識物品。根據外媒《The Information》,OpenAI 預計在週一活動上展現新功能。

據報導,新的多模態模型在辨識圖像和聲音方面,比 OpenAI 現有的模型表現更快、更準確。新模型能幫助客服更好地理解來電者的語氣,以及是否在諷刺,且「理論上」能夠協助學生解決數學問題或翻譯現實世界中的標誌。

消息人士指出,新模型在回答特定類型的問題時,表現甚至可能勝過當前的 GPT-4 Turbo,但也仍有可能會生成錯誤的回應。

除了多模態 AI 功能外,OpenAI 也傳聞正準備對 ChatGPT 進行更新,增加電話通話功能,有開發者貼出與通話相關的程式碼,並表示 OpenAI 在準備用於即時聲音和視訊通話的伺服器。

OpenAI seems to be working on having phone calls inside of chatGPT. This is probably going to be a small part of the event announced on Monday.
(1/n) pic.twitter.com/KT8Hb54DwA

— Ananay (@ananayarora) May 11, 2024

Sam Altman 先前也暗示,即將發布的是 ChatGPT 和 GPT-4「魔法般」的新功能,但他明確否認會會發表備受期待的 GPT-5 模型,其計劃將於年底發布。同時 Altman 也證實,這周並不會推出新 AI 驅動的搜索引擎

如果 OpenAI 本週一真的揭曉了據報的多模態 AI 功能,這消息有可能會蓋過Google 即將在 I/O 大會上展示的相似 AI 技術,有消息透露 Google 也在測試 AI 通話功能,以及鏡頭辨識物體能力。

隨著 AI 模型越來越擅長將文字、視覺和聲音等不同模態融合到一個系統中,OpenAI 即將展示的成果似乎準備將多模態 AI 助理帶往新高度。OpenAI 預計於台灣時間 5/14 凌晨一點進行直播。 

:Jocelyn
:Chris

快加入 INSIDE Google News 按下追蹤,給你最新、最 IN 的科技新聞!

    Disclaimer:
    Details

    Please Play Responsibly:

    Casino Games Disclosure: Select casinos are licensed by the Malta Gaming Authority. 18+