自选
我的自选
查看全部
市值 价格 24h%
  • 全部
  • 产业
  • Web 3.0
  • DAO
  • DeFi
  • 符文
  • 空投再质押
  • 以太坊
  • Meme
  • 比特币L2
  • 以太坊L2
  • 研报
  • 头条
  • 投资

免责声明:内容不构成买卖依据,投资有风险,入市需谨慎!

谷歌发布Veo 3.1对标OpenAI的Sora 2,实际表现能否匹敌?

2025-10-16 07:04:56
收藏

谷歌发布Veo 3.1视频生成模型

谷歌今日正式推出人工智能视频生成器Veo 3.1版本,该升级版实现了全功能音频支持,并新增多项编辑功能,旨在为创作者提供更精准的视频控制权。此次发布恰逢OpenAI竞品Sora 2登顶应用商店榜单,引发关于AI生成内容席卷社交媒体的广泛讨论。

专业级工具定位

谷歌显然希望将Veo 3.1打造为专业级解决方案,以区别于Sora 2主打的社交传播策略。OpenAI于9月30日推出的Sora 2采用TikTok式界面设计,强调内容分享与混剪功能,上线五天即突破百万下载量,迅速登顶苹果应用商店。Meta公司也采取了类似策略,推出基于AI视频的虚拟社交平台。

创新功能解析

新版工具"素材转视频"支持用户将多张参考图像合成为连贯场景,并添加环境音效、对白和拟音效果。"帧间动画"功能可自动生成起始与结束画面间的过渡效果,而"延长"功能则能从现有视频最后一秒延续动作,生成最长一分钟的片段。

新增编辑工具支持自动光影调节下的元素增减,支持1080p横竖屏格式输出。该模型通过Flow平台面向普通用户开放,开发者可通过Gemini API调用,企业客户则使用Vertex AI服务。

市场竞争格局

2025年AI视频生成领域竞争白热化:Runway的Gen-4模型专注影视制作,Luma Labs主打社交媒体快速生成,Adobe将Firefly Video整合至Creative Cloud,xAI、Kling、Meta和谷歌则竞相提升真实感、音效生成及提示词遵循度。

实测体验报告

测试显示,Veo 3.1相较前代在场景连贯性和环境理解方面显著提升,能驾驭从写实到风格化的多元创作需求。在无参考帧情况下,其文生视频模式甚至优于带初始图像的生成效果。但代价是运动速度受限——为保证连贯性牺牲了流畅度,快速动作生成仍是Kling的强项。

成本与限制

免费用户每月可获得100点数(约生成5段视频)。Gemini API调用下,带音频视频生成成本约0.4美元/秒,快速版为0.15美元/秒。值得注意的是,当提示词与输入图像逻辑偏差较大时,模型可能生成跳跃式不连贯片段,这些无法用于长视频剪辑。

核心优势分析

卓越的唇形同步

Veo 3.1的唇形同步技术目前业界领先。在文生视频模式下,其生成的环境音效与场景元素高度契合,对白、语调、音色和情感表达均优于同类产品。目前仅有Sora、Veo和Grok能生成真实词汇,其中Veo 3.1的成功率最高。

元素编辑特性

视频修复功能支持场景元素增删,但需注意其将上传素材视为灵感来源而非精确模板。测试案例显示,虽然生成的城市景观与人物服装参考了输入图像,但具体元素存在明显差异。建议先使用Nanobanana等工具生成连贯起始帧,再导入Veo 3.1处理以获得更稳定效果。

现存技术短板

带对白的图生视频模式仍存在参考图像失准问题。测试中生成的视频虽然质量出色,但主体人物与输入参考完全不符,导致结果不可用。对于此类需求,Sora的混剪功能或Grok的视频生成器表现更佳——后者在参考图像遵循度方面优于Veo 3.1,且不受社交平台限制。

免责声明:

本网站、超链接、相关应用程序、论坛、博客等媒体账户以及其他平台和用户发布的所有内容均来源于第三方平台及平台用户。百亿财经对于网站及其内容不作任何类型的保证,网站所有区块链相关数据以及其他内容资料仅供用户学习及研究之用,不构成任何投资、法律等其他领域的建议和依据。百亿财经用户以及其他第三方平台在本网站发布的任何内容均由其个人负责,与百亿财经无关。百亿财经不对任何因使用本网站信息而导致的任何损失负责。您需谨慎使用相关数据及内容,并自行承担所带来的一切风险。强烈建议您独自对内容进行研究、审查、分析和验证。

展开阅读全文
更多新闻