27

5 月

AI 视频生产三连击:Runway Luxo + Gemini Omni + Kling 同时跨过「能用」门槛

AI 视频生产创意工作室

如果你对 AI 视频的印象还停留在「那些有点诡异的六指人类和违反物理定律的物体运动」,今天有三个独立信号在告诉你:可以更新认知了。

Runway Luxo:跨越恐怖谷

Runway 今天发布了 Project Luxo 的研究结果,核心结论只有一句话:AI 生成视频已经跨过了恐怖谷

他们做了什么?向创意行业的从业者展示了包括 AI 短片《The Rogue》和广告样片在内的作品,然后评估观众的反应。结果是:观众开始关注故事本身,而不是技术瑕疵。

更有意思的是生产效率数据:所有作品都由单人团队制作,耗时从 3 周到 4 小时不等。用 Runway 的话说:「当技术足够好以至于『隐形』,观众沉浸于故事而非技术时,就意味着跨越。」

这个判断标准其实很聪明——它不是用 PSNR 或 FVD 这些技术指标来证明 AI 视频「变好了」,而是用观众的行为数据。当观众不再在弹幕里刷「AI 生成的吧」,AI 视频就真的成熟了。

Gemini Omni:不只是生成,而是「拍摄」

同一天,Google 官方发布了 Gemini Omni 的视频提示词指南。五条技巧,每一条都值得细读:

利用模型已有的现实世界知识。Gemini Omni 的训练数据包含了大量现实世界的视觉信息,你不需要描述「一辆红色的汽车长什么样」,直接说「一辆红色特斯拉 Model 3 在太平洋海岸公路上行驶」就行。

精确控制文本渲染。视频中的文字排版一直是 AI 视频的弱项,Gemini Omni 在这方面做了针对性优化,支持指定字体、位置和动效。

使用专业镜头指令。推拉摇移、景深、构图——用电影摄影师的术语来写提示词,而不是「拍得好看一点」。

迭代编辑而非重拍。不需要因为一个细节不满意就重新生成整个视频。可以像改代码一样在上一版基础上修改。

直接调整角色的动作节奏或情绪。对于叙事类内容,这个能力意味着你不需要重新设计角色动画,只需要告诉模型「让她走得更快一点」或「表情更紧张」。

这些技巧看起来简单,但背后反映的是 Google 对 AI 视频的产品定位:这不是一个玩具,这是一台摄像机

Kling:从 Demo 到亚马逊热播剧

Kling AI 是快手的 AI 视频模型。今天它发布了一个重量级案例:亚马逊 Prime 热播剧《大卫之家》的核心制作力量。

剧集创作者 Jon Erwin(Wonder Project 创始人兼 CCO、Innovative Dreams CEO)在分享中提到了几个具体的行业首创:

  • 在已完成的商业剧集中首次使用 AI 生成场景
  • 首个原生 4 K AI 视频模型
  • 运动控制功能可以在 AI 生成中保留演员真实的情感和感受

最后一点尤其重要。以往的 AI 视频方案在加入特效或场景后,演员的微表情和情绪传达往往被扭曲。Kling 的「运动控制」保留原始表演细节,这对影视行业来说是一个关键突破——它意味着 AI 增强而非替代演员的表演。

三重信号的交叉验证

三件事发生在不同公司、不同产品、不同场景,但底层指向同一个结论:

维度 Runway Luxo Gemini Omni Kling
定位 专业创作者单人团队 大众化视频生成 影视工业级
关键突破 恐怖谷跨越 可控性/编辑性 原生 4 K/表演保留
成熟度信号 观众无感于技术 专业级提示工程 商业剧集采用

当三个独立的信号在同一周内指向同一个方向,那就不是巧合了。

这对内容创作者意味着什么?

对于创作者来说,AI 视频现在有三个可以立刻尝试的方向:

短视频/Reels:用 Gemini Omni 从文字描述直接生成 15-30 秒的视频片段,配合迭代编辑快速调整。Prompt 门槛不高,5 条官方技巧就能入门。

产品演示:用 Runway 生成场景化产品使用画面,单人操作。一个下午的产出量,以前需要一个拍摄团队和至少一周的后期。

叙事短片:用 Kling 的 4 K 能力和表演保留特性,尝试剧情向内容。品质已经够得上专业剧集水平。

AI 视频的「iPhone 时刻」不是一台设备发布的那一天,而是普通人开始用它做「显然就该这么做」的事情的那一天。Runway Luxo、Gemini Omni 和 Kling 今天的更新,让那一天又近了一大截。

分享这篇文章

RELATED

Posts