谷歌AI视频模型Veo 3震撼登场:自带音效以假乱真 好莱坞“如临大敌”?

人工智能 科技 编辑精选

(《澳纽网》综合编译 )谷歌最新发布的AI视频生成模型Veo 3,正以其惊人的真实感和前所未有的功能,重新定义人工智能视频创作的边界。在近日举行的谷歌I/O 2025开发者大会上,Veo 3的亮相技惊四座,其生成的视频片段逼真度极高,多数观众难以将其与真人实景拍摄区分开来,预示着视频制作行业可能迎来巨变。

广告 | Advertisement

在澳纽网做广告 | Advertise with us

集成音频技术 Veo 3引领AI视频走出“默片时代”

Veo 3最引人注目的突破之一是其原生的音频生成能力。这是AI视频生成器首次能够自行创造完整的音景,包括音效、环境噪音乃至角色对话,并且与画面动作完美同步。谷歌DeepMind首席执行官Demis Hassabis将其描述为AI视频生成领域“走出默片时代”的标志。创作者不仅可以向Veo 3描述场景,还可以指定场景应有的声音效果。

该模型能够分析自身生成的画面帧,并自动同步匹配的音频,使得脚步声、开门声或角色说话的时机和方式都恰到好处。这一内置音频功能彻底改变了游戏规则——以往的生成模型只能产生无声片段,用户需手动添加声音。相比之下,Veo 3能直接输出带有丰富音频的完整视频片段,一人便可兼任摄像师和音效设计师的角色。

逼真音频的加入极大地增强了视频的沉浸感和实用性。对话生成尤为出色——无论是提供脚本还是让Veo 3自行创作,它都能生成与视觉效果匹配、口型同步的声音。背景噪音和音乐也能自然融入,无论是公园场景中的鸟鸣,还是高潮部分的戏剧性管弦配乐。谷歌表示,Veo 3经过训练,能够无缝融合这些元素。这意味着,一个独立创作者现在只需输入“海上雷暴,水手高喊命令”,就能得到一个包含海浪冲击、狂风呼啸以及水手在风暴中清晰可闻的声音的短片——所有这些都在一次生成中完成。

广告 | Advertisement

在澳纽网做广告 | Advertise with us

影院级画质与“以假乱真”的真实感

Veo 3生成的视频质量比以往任何时候都更接近好莱坞水准。该模型能输出更清晰、更细腻的视频(最高可达4K分辨率),并表现出对现实世界物理规律和光影效果的深刻理解。早期演示片段因其栩栩如生的外观令观众惊叹,Veo 3生成的场景往往没有明显的人工合成痕迹。画面动作流畅连贯,AI极少出现不连贯的情况,避免了抖动或角色在不同时刻发生不可预测变形的问题。

例如,汽车拐弯时,扬起的尘土和阴影都表现得非常自然;人物奔跑时,其动作也遵循动量和重力等物理定律。这种对现实的遵循甚至延伸到人手和语音等公认的难点细节。Veo 3生成的人物拥有自然的身体比例(每只手五个手指),其面部动作与口述音频准确同步,使得屏幕上的对话更具说服力。

谷歌表示,这些改进得益于更大的训练数据集和模型优化,使Veo 3能够将复杂细致的提示词转化为精美逼真的视频。其对电影感输出的专注,使其能够达到以往没有工作室就无法企及的艺术高度。

广告

Advertise with us

精准指令与“Flow”应用赋能创作者掌控全局

Veo 3的另一大亮点在于其对用户提示词(prompt)的精准理解和忠实呈现。该模型擅长解读复杂的多行提示——甚至是一个简短的故事或故事板——并将其转化为连贯的视频。谷歌报告称,Veo 3在提示词遵循方面有显著改进,能够追踪文本中指定的一系列动作或多个场景变化,并以正确的时序和细节进行渲染。

这意味着创作者可以一次性勾勒出整个概念(例如“场景1:英雄进入黑暗房间…场景2:突发爆炸引发混乱…”),Veo 3便能按顺序生成符合要求的片段。此外,谷歌还推出了配套的AI电影制作应用程序“Flow”,内置虚拟“摄像机控制”(用于设置特定角度或平滑运镜)、“场景构建器”(用于扩展或调整生成场景并保持动作与角色连贯)等功能,甚至允许对象级编辑,如添加或擦除片段中的元素,或更改宽高比,所有操作均通过简单提示或界面滑块完成,无需手动动画。

广告 | Advertisement

在澳纽网做广告 | Advertise with us

专业视频制作“大众化”及其经济影响

Veo 3的推出标志着一个新时代的到来,即更广泛的创作者和企业都有可能实现好莱坞级别的制作水准。通过自动化大部分繁重工作——如摄影、特效乃至音效设计——Veo 3大幅降低了制作精良视频所需的资源。个人YouTuber或小型初创公司现在可以创作出堪比专业团队制作的视听内容,极大地降低了广告、预告片等宣传媒体的制作门槛。

行业分析师指出,Veo 3等工具可用于更多商业营销和媒体工作,实现广告和内容的快速制作,无需庞大的团队或预算。目前,Veo 3的高级功能(如音频生成)主要通过谷歌每月249美元的AI Ultra订阅服务和企业云服务提供。虽然短期内可能限制业余爱好者的使用,但其发展趋势清晰——这些功能只会随着时间的推移变得更加普及和经济实惠。

广告 | Advertisement

在澳纽网做广告 | Advertise with us

新创作疆域:机遇、责任与行业深思

Veo 3的到来无疑为创造力和效率带来了福音,但也迫使创意产业努力应对其带来的重要影响。真实与合成内容之间的界限日益模糊,引发了关于原创性、真实性以及人类技艺角色的讨论。一些艺术家对此持谨慎态度,担心低质内容泛滥或工作岗位流失。

另一方面,支持者认为Veo 3等AI是创意技术的又一次进化,是增强人类创造力的强大新工具。谷歌已在Veo 3中内置了防护措施,包括通过DeepMind的SynthID技术在每一帧AI生成画面上添加隐形水印,以帮助检测和标记AI制作的视频。该模型还有内容防护机制,测试者发现它会拒绝生成深度伪造类政治虚假信息或有害场景的提示。

许多具有前瞻性的创作者正积极拥抱这一工具,专注于它如何增强而非取代他们的想象力。谷歌在开发过程中与电影制作人合作,旨在确保Veo 3支持而非破坏创意工作流程。理想的结果是,AI承担繁琐的制作后勤,让人类创作者专注于叙事、风格和创意。

从内容工作室到广告公司,各方都已意识到AI视频生成技术已成定局,并且能力只会越来越强。Veo 3以最高质量水平例证了这一趋势,它降低了门槛和成本,但也挑战着创作者在一个任何人都能制作出惊艳视觉效果的世界中如何实现作品的差异化。未来,善于将Veo 3等AI模型作为其艺术工具包一部分的叙事者,可能会在利用生成视频的效率和规模的同时,以独特的人类创造力和视野引领潮流。

分类: 科技新闻

(即时多来源) 最新英语科技新闻 New Zealand English News

广告 | Advertisement

在澳纽网做广告 | Advertise with us

 1,493 views