Google 在今(14)日的 Made By Google 2024 活動上宣布,推出 Gemini 新語音聊天模式「Gemini Live」,該功能今天已開始針對 Android 裝置推出,只有英文版,且僅供 Gemini Advanced 訂閱戶使用,未來幾週內將來到 iOS 並提供更多語言。
Gemini Live 很類似於 ChatGPT 的語音功能,同樣有多種聲音可選擇,Google 共提供 10 個新的 Gemini 聲音供選擇,名字包括 Ursa 和 Dipper。
另外,Gemini Live 對話很自然,過程中無需點擊按鈕就可打斷,或先暫停對話之後再回來。Gemini Live 在使用者手機鎖定時仍能在背景運行,因此可免持操作。
Gemini Live 相較 ChatGPT 進階語音模式,具備的優勢之一是有更好的記憶力。Gemini Live、 Gemini 1.5 Pro 和 Gemini 1.5 Flash 所採用的 AI 模型架構具有比平均更長的上下文視窗長度,可吸收和推理更大量的資訊。
Google 之前在 I/O 上展示過 Gemini Live 的多模態輸入功能,此功能將在「今年稍後」推出。
除了 Gemini Live 之外,Google 還宣布 Gemini 將與 Google 服務有新的整合,稱之為「Gemini 擴充功能」。AI 將能夠透過 Google 日曆、Keep、任務、YouTube 音樂等應用程式進行更多操作,舉例來說,可拍下一張演唱會宣傳海報,詢問 Gemini 當天是否有空,AI 就會進到日曆查詢,且可加以設定買票提醒。
Gemini 也獲得看懂使用者裝置螢幕的能力,當用戶點擊「詢問此畫面」或「詢問此影片」後,Gemini 就可提供相關訊息,包括從旅遊影片中提取目的地等詳細資訊,並添加到 Google 地圖中。
:Jocelyn
:Chris
本文初稿為 INSIDE 使用 AI 編撰;快加入 INSIDE Google News 按下追蹤,給你最新、最 IN 的科技新聞!



2024-08-14
