不只能画图!谷歌推出Gemini Omni:只需动动嘴 AI自动帮你改大片
摘要
快科技5月20日消息,在GoogleI/O2026上,谷歌正式发布GeminiOmni模型。该模型支持文本、图像、音频、视频作为输入,实现跨模态......
快科技5月20日消息,在
其中在音频方面,目前该模型初期仅支持语音输入,但Google表示未来将很快扩展更多类型的音频输入能力。
首发产品Gemini
该模型核心卖点在于深度
得益于模型对物理规律的理解以及对历史、科学、文化知识的整合,生成的视频在角色、场景及视觉逻辑上高度连贯,甚至能推测后续情节。用户亦可创建个人数字分身,并将其植入视频中。
谷歌在安全领域同步布局,所有通过Omni生成的视频均会自动嵌入SynthID数字水印,支持通过Google搜索及Chrome验证。
GeminiOmniFlash现已面向拥有GoogleAIPlus/Pro/Ultra订阅的用户在Gemini应用和GoogleFlow中推出。此外,它还免费向希望混剪YouTubeShorts的用户以及YouTubeCreate应用用户推出。
GoogleDeepMind负责人哈萨比斯表示,该模型正推动AI从单纯的任务执行向通用人工智能(AGI)迈进。
