Google 在今(14)日的 Made By Google 2024 活动上宣布,推出 Gemini 新语音聊天模式「Gemini Live」,该功能今天已开始针对 Android 设备推出,只有英文版,且仅供 Gemini Advanced 订阅户使用,未来几周内将来到 iOS 并提供更多语言。
Gemini Live 很类似于 ChatGPT 的语音功能,同样有多种声音可选择,Google 共提供 10 个新的 Gemini 声音供选择,名字包括 Ursa 和 Dipper。
另外,Gemini Live 对话很自然,过程中无需点击按钮就可打断,或先暂停对话之后再回来。Gemini Live 在用户手机锁定时仍能在背景运行,因此可免持操作。
Gemini Live 相较 ChatGPT 进阶语音模式,具备的优势之一是有更好的记忆力。Gemini Live、 Gemini 1.5 Pro 和 Gemini 1.5 Flash 所采用的 AI 模型架构具有比平均更长的上下文窗口长度,可吸收和推理更大量的信息。
Google 之前在 I/O 上展示过 Gemini Live 的多模态输入功能,此功能将在「今年稍后」推出。
除了 Gemini Live 之外,Google 还宣布 Gemini 将与 Google 服务有新的集成,称之为「Gemini 扩充功能」。AI 将能够通过 Google 日历、Keep、任务、YouTube 音乐等应用程序进行更多操作,举例来说,可拍下一张演唱会宣传海报,询问 Gemini 当天是否有空,AI 就会进到日历查找,且可加以设置买票提醒。
Gemini 也获得看懂用户设备屏幕的能力,当用户点击「询问此画面」或「询问此视频」后,Gemini 就可提供相关消息,包括从旅游视频中提取目的地等详细信息,并添加到 Google 地图中。
:Jocelyn
:Chris
本文初稿为 INSIDE 使用 AI 编撰;快加入 INSIDE Google News 按下追踪,给你最新、最 IN 的科技新闻!



2024-08-14
