谷歌最强视频生成AI模型Veo3亮相:背景音、人物对话都不在话下
创始人
2025-05-21 03:11:23

IT之家 5 月 21 日消息,在今年的 I/O 开发者大会上,谷歌发布新一代视频生成模型 Veo3,这也是其首个可生成视频背景音效的模型。它不仅能合成画面,还能为鸟鸣或街头交通等场景配上相应的音效,甚至还可生成人物对话。

谷歌称,Veo 3 在物理模拟与口型同步方面也表现优异。目前,该模型仅面向美国地区的 Gemini Ultra 用户,以及 Vertex AI 的企业用户开放,也已集成进谷歌的 AI 影视制作工具 Flow 中。

用户仍可为 Veo 2 提供人物、风格、场景或物体的图像参考,并通过 Flow 使用镜头控制功能进行旋转、缩放,甚至将画面从竖屏调整为横屏,或在视频中添加、删除元素。

当前用户越来越难以辨别 AI 生成内容,谷歌为此推出了 SynthID Detector。用户可上传媒体文件以检测其是否包含 SynthID 水印,这是谷歌用于识别 AI 作品的标记工具。不过,目前并非所有图像生成模型都支持这一水印。

谷歌 I/O 开发者大会仍在进行,IT之家将保持关注。

相关内容

热门资讯

全球媒体聚焦 | 美媒:“冰雪... (来源:千龙网)美国《旅行与旅游世界》网站12月12日发表文章,关注冰雪运动在中国的日益盛行是如何助...
海南自由贸易港海关特殊监管区域... 转自:新华社新华社海口12月13日电(记者刘邓、吴茂辉)记者从海口海关获悉,近日,一台船用发动机的保...
27载照顾公婆 石景山白慧霞入... 转自:北京青年报客户端12月13日,北京青年报记者从石景山区获悉,该区八角街道杨庄北区社区居民白慧霞...
张毓强父子的资本“炼金术”:振... 转自:华夏能源网文|华夏能源网一家6年前在港股市值不足22亿元的公司,如今以近400亿元的估值冲击A...
年轻人涌入高校买羽绒服! 12月12日“人大899元书记严选羽绒服卖断货”登上热搜阅读量突破两千万讨论互动量过万近日,多所高校...