ITCOW牛新网 10月16日消息,谷歌今日推出新一代视频生成模型Veo 3.1,该版本在音频合成、精细化编辑及图像转视频效果上实现显著提升。作为今年5月发布的Veo 3的迭代版本,Veo 3.1能够生成更逼真的动态画面,并更精准地响应用户指令。

核心升级:音频支持与对象编辑
Veo 3.1首次为生成的视频添加了音频,使内容更加生动。此外,新模型允许用户在现有视频中动态添加新对象,并使其自然融入原始画面的光影与风格。谷歌还预告,未来将在视频编辑工具Flow中推出“对象移除”功能,进一步拓展创作自由度。
优化现有功能,提升生成质量
Veo 3.1延续了前代的核心功能,包括:
- 角色塑造:通过参考图像定制角色形象
- 片段补全:基于首尾帧生成完整视频
- 时长延长:依据末尾帧自动扩展内容
此次升级不仅优化了这些功能的生成效果,还为其加入了音频支持,使最终输出的视频更具沉浸感。
应用场景与部署计划
Veo 3.1将逐步整合至谷歌的多个平台,包括:
- Flow视频编辑工具(用户已创作超2.75亿个视频)
- Gemini应用(面向普通用户)
- Vertex AI平台与Gemini API(面向开发者)
谷歌表示,新模型在影视制作、广告创意、社交媒体内容生成等领域具有广泛应用潜力,未来将进一步优化AI视频生成的易用性和表现力。