我花了很多时间测试和评测 AI,特别是图像和视频生成器。在评测过程中,我总结出了一些常用提示词,这些提示词能帮助我快速了解各平台的能力。我尝试的第一个提示词对我来说就像是一种美好愿景:我请程序想象我和朋友们在某个温暖的 海滩上,你能闻到咸咸的海风,还隐约听到 Jimmy Buffett的音乐正在附近播放。(这更多描述的是整体氛围,而非具体的提示词。)以下就是 Google最新 AI 视频模型 Veo 3 的生成效果。
我承认,在使用海滩篝火梦幻提示前,我对 Veo 3 的预期其实并不高。尽管社交媒体上有人对 Veo 3 的能力惊叹不已,但我也见识过太多糊弄和幻觉般的输出,因此我对它一直持怀疑态度。尤其是 Google 的 AI 创意产品,在我看来,总是有些像是公司为与其它科技巨头竞争而在其庞大的 Gemini 系列中临时增加的附加产品。但今年在公司的年度 I/O 开发者大会上,Google 的 Imagen 4、Veo 3 和 Flow 全部成为了焦点。所以我决定全力体验 Veo 3。
不剧透细节,我使用 Veo 3 之后整体感觉这是 Google 迈向下一阶段的自然步骤,特别是其中一项功能让公司在 AI 创意领域中获得了竞争优势,使其可能成为更有力的竞争者。不过,其中仍存在严重的限制和令人烦恼的问题,我希望这些问题能够尽早得到解决。以下是我的体验过程以及你需要了解的信息。
Veo 3 的可用性、定价与隐私
Veo 3 目前面向美国的 Gemini Ultra 用户以及企业级 Vertex 用户开放。换句话说,如果你想体验全新的 Veo,必须支付费用。Ultra 是 Gemini 最新且最昂贵的档位,定价为每月 250 美元。(目前三个月内半价,只需每月 125 美元。)Vertex 是 Google 的 AI 企业平台,如果你有使用权限,你自然会知道。
如果你不愿意为使用 Google 的 AI 视频工具支付数百美元——我完全理解这种想法——你可以通过 Google AI 的 Pro 计划试用 Veo 2。我发现一个月的免费试用期足以让你判断是否愿意继续支付每月 20 美元的费用继续使用。你可以查看我对这一模型的实测报告以获得更多信息。
Google 的 Gemini 隐私政策指出,公司可以收集你的信息以改进其技术,这也是它建议不要与 Gemini 共享任何机密信息的原因。同时,你还需要同意 Google 的禁止用途政策,该政策禁止生成任何辱骂性或非法内容。
我与 Veo 3 的疯狂体验
Veo 3 最令人印象深刻的功能是其全新的音频生成能力。你无需在提示词中向 Gemini 指明你需要声音,它会自动添加音效。这在 OpenAI的 Sora 和 Adobe的 Firefly等竞争产品中是首创的,这无疑给了 Google 巨大的优势。
虽然 AI 生成的音频是一个很棒的附加功能,但它并不完美。如果你熟悉 AI 生成音乐和对话那种有点笨拙的感觉,你很快就能分辨出来。不过在某些时刻,音频效果显得相当自然。以我那场外星人战斗场景为例,金属相撞声和吼叫声的时机配合得非常到位,是我事后难以手动调整做到的效果。但与此同时,那些类似恐龙的外星人直接说出了“咆哮”和“嘶嘶声”,而不是仅仅发出那些声音。
我那划皮艇者的桨击水声几乎和水花声完美匹配。视频中的自然环境音非常悦耳,增添了一层以往 AI 视频所缺失的深度。我构思的海滩篝火派对场景虽然听起来不像我参加过的任何派对,但仍然值得点赞,因为它是首个出现且相对没有大问题的尝试。
当然,虽然音频效果出色,但这并不能掩盖 AI 生成器持续存在的一些古怪缺陷。我遇到了一些小问题,主要是人物面部——这向来是 AI 模拟中的难点。但与我在使用 Veo 2 时遇到的明显错误相比,新一代产品似乎已经做出了实质改善,正如 Google 所宣传的那样。
在测试 AI 图像和视频生成器时,我常常会遇到幻觉现象,因此第一件事就是查看服务是否提供编辑功能。Veo 3 并未提供相关功能,这让人颇为失望。这无疑会降低其对专业创作者的吸引力,因为他们习惯于使用更精细的编辑工具,且需要对项目做细致调整。不过,你可以通过发送后续提示词来要求特定修改。例如,我曾让 Veo 改变前一个视频的角度,显示出人物面部,这一点程序处理得不错。
但在 Veo 3 中,你通常需要等待 3 到 5 分钟才能加载出一个新编辑过的视频。不过,相比之下,Veo 3 的生成时间是所有我测试过的 AI 视频生成器中最长的。但视频中添加了音频,这在我看来可以弥补等待时间过长的问题。
Veo 3 最让人恼火的地方在于每日生成数量的限制。在生成仅仅五个视频后,我就被限制使用整整 24 小时——这实在让人恼火,也使得我的评测变得更加困难。Google 的 Gemini 和 Google Labs副总裁 Josh Woodward 在 X/Twitter上的一篇帖子中提到,Ultra 订阅者(比如我)在 Gemini 应用和 Flow 中拥有每天重设生成次数的最高额度。对于我来说,Gemini 的限制就是五个视频,而根据 Woodward 的说法,Flow 的限制则是 125。
我曾联系 Google,询问 Woodward 提到的 Ultra 用户在通过 Gemini 创作时的每日限制问题。以下是回复内容:“Google AI Ultra 订阅者可以获得我们最新最先进的视频生成模型 Veo 3 的最高级别使用权限,他们可以在 Gemini 应用和 Flow——我们新推出的 AI 电影制作工具中使用该模型。”
这些限制再次证明,这款工具并非为专业创作者和需要反复迭代编辑的使用场景而设计。你需要花时间认真构思提示词,如果 Google 出现人物面部错误或其他故障,你很可能会很快用完生成次数,最终陷入困境。总体来说,Veo 3 更适合那些想尝试视频创作的 AI 爱好者,而不适合那些依赖 AI 进行精细调整的创作者。
Veo 3 值得花这个价吗?
在 Veo 2 带来不尽人意的体验后,我对 Veo 3 的实用性和精准性心存疑虑。然而,新模型确实令人印象深刻,尤其是音频表现,即使它仍然缺少一些关键功能。
我要明确一点:没有理性理由仅仅为了使用 Veo 3,而为 Gemini Ultra 计划花费数百美元。如果你只是想试着玩玩,可以用每月费用少得多的 Veo 2;如果你是一名创意专业人士,Veo 3 依然缺少像编辑这类至关重要的功能。Ultra 计划确实提供了其它功能,比如 YouTubePremium、30 TB 的存储空间以及最新的 Gemini 模型使用权限。所以如果你需要这些附加功能,那么支付费用并体验 Veo 3 也是可以理解的。但仅仅为了 Veo 3 本身,这个价格并不值得。
Veo 3 并不像社交媒体帖子所暗示的那样具有突破性的升级。它是新一代产品,比上个月的 Veo 2 更出色,并展现出 Google 在 AI 视频领域未来的巨大潜力。但如果你想体验它,就必须做好付费的准备。
上一篇:成都农商行增持两家村镇银行获批
下一篇:中通支付被罚没超1894万元