2024年开年,OpenAI再次以其视频生成模型Sora惊艳了全球。在OpenAI官网发布的演示视频中,Sora展示了其能够输出包含多个角色、多种场景和不同镜头的画面。尽管文生视频的概念并不新鲜,但相比竞争对手,Sora的表现简直可以用碾压来形容。与Sora清晰、精细、时长长达1分钟的视频相比,Runaway网页版产品最长仅有18秒的视频,可见差距明显。这一成就引发了全球电商行业的焦虑,因为文生视频在内容生成方面展现出了令人惊叹的能力。
一些人认为,国内在文生视频领域实力与国际仍有巨大差距,而同行们也表明自身对于文生视频领域的发展目标尚不明确。焦虑并非文生视频浪潮中的唯一情绪。不论是ChatGPT还是Sora,它们引发人们热情的原因在于它们极有可能提高全要素生产率。这种影响首先体现在影视行业,业内人士称,一些编剧的作品已经不如人工智能表现出色。
人工智能的发展并未像许多人预测的那样激进,这使得对待文生视频的态度也变得更加审慎。一些人甚至认为,人工智能的发展几乎只会助力而非挑战。国内厂商在这一浪潮中也产生了反应,最近腾讯科技对杨植麟、朱啸虎、王小川三位的访谈引发了热议。三位代表了业内不同的对AI看法,其中投资人朱啸虎的核心观点认为,应该将重点放在应用层,降低风险,增加收益。ChatGPT发布后,国内迅速展开了百模大战,但对Sora有意投入重资的厂商寥寥无几。
成本是一个重要因素。类似于ChatGPT,Sora也使用了transformer架构,将视频和图像表示为一系列较小的数据单元,称为Patch。这种架构符合AI缩尺律,随着训练计算量的增加,样本质量明显提高。要训练出类似效果的文生视频大模型成本相当昂贵。举例来说,使用1000台服务器的电力成本每月高达20万元。据OpenAI创始人山姆·奥特曼透露,ChatGPT每天消耗50万度的电。有行业人士指出,Sora之所以暂未对外开放使用,可能是因为算力是一个重要局限因素。
另一方面,尽管Sora表现出色,但其实际效果却备受质疑。一些内部使用者表示,Sora在内容生成方面经常出现幻觉,例如在东京街头漫步视频中,女主角的走路过程中出现了腿部变形、腿部交叉换位时错乱。OpenAI解释称,Sora可能难以准确模拟复杂场景的物理原理。因此,一些视频行业从业者对Sora目前的实用性表示怀疑。
与此同时,对于影视行业的需求而言,人工智能技术在文案和文生视频方面的应用更多地是为了降低成本、提高效率,而非构成威胁。例如,数字王国在视效设计和制作流程中利用人工智能技术,能够大大提升工作效率,降低人力成本。
推荐阅读:
发表评论