10 月 4 日,Sora 项目负责人蒂姆布鲁克斯(Tim Brooks)在社交平台 X 上官宣离职,加入GOOGLE DeepMind。
如果搭配 Sora 正式版一直没有确切时间表的现实一起食用,这像极了某个明星项目泡沫被戳破,局中人各自打算的熟悉戏码。
而最近 AI 视频的竞赛,也开始呈现出一些白热化。
据 SimilarWeb 统计,位居全球前列的 AI 视频生成企业 Luma AI 网站在 9 月的总访问量仅为 1181 万次,环比下跌 38.49%。红极一时的 Pika 也在 9 月总访问量出现跌落。虽然其在 10 月新版本中凭借一批新的模版效果再次爆火,但产品如何持续的吸引用户兴趣的问题也逐渐浮出水面。
一些最初对 Sora 持谨慎态度的声音现在再度被拿出来重新咀嚼,比如影片制作人帕特里克·塞德伯格(Patrick Cederberg)在 4 月所说,他必须让模型生成数百个短片,才能找到一个可用的短片。换句话说,Sora 的使用非常困难。
所幸的是,Tim Brooks 并没有告别 AI 视频,他大概率加入了 DeepMind 的 AI 视频生成工具 Veo。Sora 的起落或许不是 AI 视频行业的唯一标尺,至少在能力上,开始有 Meta Movie Gen 这样的挑战者开始宣称干掉了 Sora。而国内的 AI 视频产品生态,也一直在有新的变化。
AI 视频赛道的降温,换句话说,也是下一批更好产品迭代出来之前的酝酿期。而最近似乎有了一个足够惊艳的产品走入大众视野。
The video shows a bustling train station filled with a diverse crowd of passengers eagerly waiting for their trains. The camera sweeps across the scene, capturing the lively atmosphere. Super Mario, a stout Italian character with a round face, dons his iconic red hat and blue overalls. The camera closely follows Mario as he steps confidently onto the platform, his face beaming with excitement.. The video is in a realistic style. 视频中,火车站熙熙攘攘,各色乘客焦急地等待火车。镜头扫过整个场景,捕捉到热闹的气氛。当火车缓缓驶近站台时,镜头紧跟身材魁梧、脸庞圆润的意大利人物超级马里奥,他戴着他标志性的红帽子和蓝色工作服,自信地走上站台,脸上洋溢着兴奋的笑容。视频的风格很写实。
The pistol misfires with black smoke, which makes the man's face dirty. 手枪哑火,冒出黑烟,弄脏了男子的脸。
PixVerse V3 在文生视频和图生视频能力上给人最鲜明的感受,就是它无比接近普通人日常生活中的兴趣点。事实上,除了专业的视频创作相关从业者,没有太多人有用 AI 视频App雕刻一段完美影视作品的需求。反而更多刚用上视频生成能力的人,他们的好奇心在于这个能力能不能和真实世界甚至自己玩在一起。比如把喜欢的卡通形象引入自己每天出入的场合,甚至把自己变成钢铁侠之类的动漫人物。
AI 视频产品目前遇到的困局,很多都是因为陷在技术能力的自嗨里,而用户的身影消失了。在这个文生视频技术刚刚崭露头角的阶段,可能更大多数的普通人所中意的,首先是一个足够靠近自己,又足够亲和的 AI 视频产品。
从这个角度上来看,当下的 PixVerse V3 或许是那个把用户心思猜的最准的产品。
PixVerse V3 的惊艳除了归功于 PixVerse V3 背后 AI 视频大模型的能力迭代之外,其在提示词理解能力上的优化也功不可没,相信看到上面这几个 Prompt 示例,细心的人已经看出来了。
"主体+主体描述+运动+环境"是一个让 AI 视频生成时能最大可能发挥效用的 Prompt 公式,相比 V2.5,现在你可以对 PixVerse V3 增加一个「镜头描述」的维度。
当然,除了遵循这个公式,Prompt 需要尽可能详细描述人物的动作,避免太过简单的描述。
同时,PixVerse V3 在输出视频的选择上也更加丰富,在输出视频的格式上 PixVerse V3 支撑包括 16:9、9:16、3:4、4:3、1:1 在内的多种视频比例,风格化功能也在本次版本更新后得到升级,现在文生视频和图生视频两种模式同时支撑动漫、现实、粘土和 3D 四种风格选择。
一句话来说就是,这次 PixVerse V3 不仅变强了,它甚至想要把产品说明说一行行交到你手上。
社交平台 X 上,很多 AI 产品的关注者已经开始上手 PixVerse V3,比如粉丝众多的 Pierrick Chevallier。他甚至整理了一个专门的帖子来展示自己用 PixVerse V3 生成的视频。除了强大的生成能力以外,吸引人眼球的是他在其中展示了很多非常「万圣节味儿」的视频。
02
这个万圣节,
让 PixVerse V3 来「搞效果」
一个足够有趣的 AI 视频产品的破圈,除了要有足够的技术能力支撑,也需要一个好的契机。说起来 PixVerse V3 的发布也算得上恰逢其时。
11 月 1 日就是万圣节,10 月末的此时此刻,正是年轻人一年一度的想象力巅峰期。结合万圣节主题,PixVerse V3 一并发布了一系列万圣节主题模板,让你能够用 AI 对身边的一切「施法」。
与此同时,Sora 带来的兴奋以及过于宏大的技术想象力让整个 ai 视频产品领域逐渐失焦,找不到与大众生活的连接处。所以一方面 runway 这种定位是专业工具的 AI 视频产品由于过高的使用门槛而难以破圈,而定位更偏大众的产品则陷入一种在众人尝鲜后的「阅后即焚」困境,用户在新鲜劲过了之后难以留存,产品缺乏明确而具体的发展思路,于是只好向着「滤镜化」「特效化」的简单逻辑下沉。
换句话说,AI 生成能力巨大的的开放性让 AI 视频这个领域目前几乎所有产品都像是某种半成品,生成内容的随机性和不可控被包装成一种新奇体验,也同时意味着其难以在一种具体而具有持续性的场景中被使用起来。
就像当外界被 Sora 气球人的生成能力所惊艳的时候,帕特里克·塞德伯格则被 Sra 内容生成一致性的缺乏所困扰,他抱怨气球的颜色在每次生成中都会改变,而这样的瑕疵意味着大量后期制作的工作量仍然不可避免。类似的问题很多,这也是为什么虽然好莱坞一年前已经开始为大模型对影片工业潜在的颠覆可能罢工,但一年后,sora 仍然无法真正进入影视的工作流。
眼下 AI 视频产品也都或多或少的陷入了类似的处境——虽然 AI 视频生成能力已经让所有人兴奋了很长一段时间,但 AI 视频生成产品仍然是一场看起来很美的「卖家秀」。