2024年8月14日凌晨,谷歌在“Made by Google 2024”大会上正式宣布发布智能语音助手——Gemini Live,直接对标OpenAI的智能语音模型GPT-4o,能识别图像、视频和语音,是一个多模态智能助手。
Gemini Live功能表现强大,例如请求它展示并讲解《清明上河图》的历史背景时,它就像一位博学多识的朋友,随时准备着与你交流。如果有任何疑问或想深入了解某个细节,你可以随时打断它,进行更深层次的对话。
更进一步,Gemini Live能够接入你的邮箱、地图和通讯录,只需一句简单的指令:“今晚8点,帮我约阿乐去有福气酒楼吃饭。”它就能帮你安排妥当,其智能程度几乎可以媲美钢铁侠的AI助手贾维斯。
尽管OpenAI的GPT-4o发布较早,但还只是小范围测试。谷歌通过发布Gemini Live,成功抢占了安卓手机市场的先机。证明了在产品性能相近的情况下,谁能更早地推向市场,谁就更有可能赢得用户的青睐。
从大型语言模型到智能语音助手的转变,谷歌的Gemini Live显然决心与OpenAI的ChatGPT展开激烈竞争。
对于一些认为Gemini Live的出现可能会促使人们转向安卓阵营的观点,谷歌已经明确表示,将iOS版本的发布只是时间问题,这无疑给广大苹果用户带来了期待。
Gemini Live的现场演示中发生了一个小插曲:主持人询问Gemini Live查看日历并确认某日是否有空时,Gemini Live起初没有任何反应。直到第三次尝试后,Gemini Live才回答说,“我发现她将于2024年11月9日来旧金山。我查看了你的日历,那段时间你没有任何活动。”这一延迟的反应虽然一度让现场气氛尴尬,但也展现了技术的真实性和可靠性。
使用Gemini Live非常简单,长按电源按钮或直接对手机说“Hey Google”即可激活。除了理解语音、图片、视频外,Gemini Live还能生成图片,例如为生日庆祝制作一张图片,并能直接用于谷歌生态内的应用中。
谷歌宣布,Gemini Live已与其邮件、云盘、相册、天气等原生应用集成,并计划未来扩展到Keep、Tasks、Utilities等应用,旨在帮助用户自动化完成更多日常任务。
目前,安卓用户通过Gemini Advanced英文版订阅已能体验Gemini Live,支持10种声音选择和45种语言。未来几周,谷歌还将扩展其服务至iOS系统及更多语言版本。
相关阅读:《重磅!OpenAI发布AI搜索引擎助手SearchGPT》
-
广告合作
-
QQ群号:707632017