Google 在本次開發者大會 I/O 上宣布在 Google Photos 推出 AI 功能「Ask Photos」!這項功能由 Google 的 Gemini AI 模型所賦能,可以讓使用者能夠使用自然語言進行更直觀、更智慧的照片搜尋。
過去雖然 Google Photos 已經支援搜尋特定的人、地點或事物,但在「Ask Photos」功能下尋找正確內容的過程將變得更加直觀,不再需要繁瑣的手動搜索,例如「找到我在每個國家公園拍攝的最佳照片」。AI 會結合光線、模糊程度、背景失真缺乏等各種資訊,來確定照片在特定集合中的「最佳」程度,並根據照片的地理位置或拍攝日期,只檢索在國家公園拍攝的照片。
除了尋找特定主題或場合的最佳照片外,「Ask Photos」功能還允許使用者提出需要對照片內容有近乎人類般理解的問題。例如,一位家長可以詢問 Google Photos 他們孩子最近四次生日派對的主題,AI 就能返回一個簡單的答案,並附上美人魚、公主和獨角獸主題的相關照片和影片。
這種查詢之所以成為可能,是因為Google Photos不僅理解使用者輸入的關鍵字,還能理解「主題生日派對」等自然語言概念。它還可以利用AI的多模態能力來理解照片中的文字是否與查詢相關。得力於每天有超過 60 億張圖像上傳到Google Photos,Google 具備巨大的資料量得以訓練模型。
另一項新功能允許使用者透過搜尋照片中的文字來尋找答案。例如,使用者可以拍下車牌號碼或護照號碼,然後在需要時請AI檢索該資訊。
如果 AI 搞錯了,使用者可以進行糾正,例如標記不是生日派對的照片,或是不想突出顯示的度假照片,AI 會記住這些回應以不斷改進。這也意味著使用者與AI互動的時間越長,AI 就會變得更加個人化。
Ask Photos 功能最初將在美國以英語提供,之後計畫推廣到更多市場。目前它只支持文字介面,類似於詢問 AI 聊天機器人的問題。但隨著時間的推移,它可能會與 Android 設備上運行的 Gemini 進行更深入整合。
快加入 INSIDE Google News 按下追蹤,給你最新、最 IN 的科技新聞!



2024-05-14
