在ChatGPT问世一年多后,OpenAI公司近期再次出招,推出文生视频大模型Sora。根据简单的文本指令,Sora就能生成一段60秒的视频,其中包含多角度镜头切换,呈现相当丰富的细节,等等。OpenAI官网发布了多个视频示例,逼真的画面令人很难区分它们是由实拍而得,还是由AI生成。
Sora的现身一时间引发热议。部分业内人士称其“比想象中来得更快”,是“人工智能领域的一次突破”;也有一些网友紧张了起来,比如有人担心,有了Sora的加持,影视、传媒、广告等文化产业将受冲击,进而产生了“饭碗焦虑”。
不禁要问,Sora究竟是什么?如果普遍使用的话,它将给文化产业及其从业者带来什么?
Sora生成的视频图像:一杯咖啡中,两艘海盗船展开了“战斗” 图源:OpenAI官网
一
Sora并不是文生视频领域的第一个“吃螃蟹者”。此前,Runway、Pika等公司也曾推出文生视频模型。那么,“后来者”Sora为啥能“居上”?
“大片质感”。有人评价,由Sora生成的视频,无论是光影色彩的转变,还是镜头移动,甚至细微到纹理结构变化,都呈现出较高质感。它还能模拟现实世界的物理规律,像“一杯咖啡中,两艘海盗船展开了激烈的战斗”这段视频,不仅呈现了咖啡的流体动力学和逼真的光影渲染,还运用了光线追踪和移轴摄影技术等,技能强大。
“时长感人”。此前,谷歌、Runway等推出的大模型,每次生成的视频最多只能达到10多秒的时长。而Sora则将视频长度拉长到了60秒,这一突破意味着,由其生成的视频信息承载力更强、内容更丰富,达到了很多短视频平台的内容发布要求。
“匹配自如”。Sora不仅能让文字迅速成片,而且能根据情况生成与各种设备匹配的画面,宽屏视频、竖屏视频以及其他比例的视频,都能得到匹配。这也使得Sora能适应不同设备,满足各类用户的观看需求。
此外,据分析,Sora在细节处理、语言理解能力、视频扩展功能等方面的表现也较为显眼,这些也正是“后来者”Sora能够突出重围的原因。
二
需要看到,作为生成式AI模型的一颗“新星”,Sora并不算完美,仍存在一些不成熟之处,比如逻辑性还有待提升,在更精细内容的调控方面有待加强。但它的出现,已经给大众带来了一定的想象空间。
对文化产业而言,“新物种”Sora如果能够进一步被使用,或许能带来不一般的能量。比如,在内容供给端,有业内人士就认为,Sora会像当年的智能手机一样,降低内容创作者门槛,从而使内容供给更加丰富。
对影视产业来说,Sora似乎已经可以“承包”部分摄影、导演、剪辑等任务,那么当它进一步升级后,影响的或许将不只是短视频。尽管Sora发布的视频示例中,时间最长的只有60秒,但按照AI大模型等技术日新月异的迭代速度,生产出优质的AI长视频似乎指日可待。当然,这一角色,除了Sora,也可以是其他的大模型。
Sora生成的视频图像:一辆老式SUV行驶在盘山公路上 图源:OpenAI官网
这一技术也可以应用到广告业领域。像OpenAI发布的一个视频示例就呈现了这样的画面,“一辆老式SUV行驶在盘山公路上,扬起的灰尘在温暖的阳光下清晰可见,路两边的丘陵上种满了红杉树”。可以想象,未来的汽车广告、美食广告、景点宣传视频等一些不需要特别复杂情节的广告视频,或许就能够借助它来完成。
此外,于新闻传媒业而言,诸如Sora这样的视频生成器的使用,也会对目前的新闻生产方式和流程等产生一定的重构性作用。
当然,文生视频大模型的出现也令人喜忧参半。比如一些文化产业相关从业者就开始担心,Sora是否可能抢了自己的“饭碗”。目前网络上相关讨论当中,这是主要话题之一。
还有一些网友担忧,在未来,假新闻是否会因此而更泛滥?此前就有人曾利用ChatGPT将搜集到的一些素材修改编辑后,当成新闻报道发布在互联网上,编造假新闻牟利。此外,这种逼真的视频生成技术还可能被用于制作“深度伪造”视频,一旦被犯罪分子利用,将带来较大风险。
图源:视觉中国
三
技术浪潮下的文化产业,重塑与变革必然势不可当,正如蒸汽机、发电机等机器工具的发明和普及,让手工劳动被自动化机器代替。随着Sora及其他一些大模型的逐步开放和商用,文化产业中部分重复性的、缺少技术含量的劳动有较大可能会被取代。
换言之,无论是ChatGPT还是Sora,技术进步更重要的意义,在于让更多人可以不被简单重复的劳动所束缚,从而去创造更大价值。文化产业想要制胜未来,不能逃避而只能主动拥抱人工智能新浪潮。那么,如何让生成式AI技术的“洪荒之力”为我们所用?
与AI成为工作“搭子”。生成式AI所蕴含的深层次、革命性力量是不容低估的,与其揣着“饭碗焦虑”,我们不如将之视为工作的“搭子”,利用它帮助自己更高效地实现创意转化、精品打造等。
比如,真实是新闻报道的生命,生成式AI不能完成纪实性内容的采集和拍摄,但利用好这一技术,是否可以快速生成动画、图表,使得报道更生动、内容更可读?对影视产业来说,利用该技术降低影视特效生成难度,一些高风险、拍摄难度系数较大的镜头和画面可用它来生成。
把好内容安全的“方向盘”。生成式AI是基于现有数据基础的“演绎”,如果现有“训练资料”有问题,则产生的内容也容易受到影响,出现偏差。因此,进一步完善内容审核机制,确保AI生成的文字、图片和视频等内容导向正确、合法合规,还需要继续探索。同时,也有必要积极开发运用相应AI辅助工具,及时筛选存在问题的内容,有效防范虚假、违规等内容的传播风险。
让技术与文化“共舞”。文化产业要更好接驳这一波风口,既要有技术的“强支撑”,让生成式AI发挥好“聪明才智”,也要有文化的“强底座”,让数字技术与文化创新发展共融共舞,催生产业新活力。比如,运用AI技术生成虚拟数字人,在各大景区景点、文博场馆化身传统文化“导游”,与观众进行穿越时空的对话,带来沉浸式新体验。
有人说,就像宝剑从属于侠客一样,无论人工智能发展到何种程度,它始终根源于人类的创造,也始终是人类智慧的延伸。不妨对AI技术的发展寄予美好的期盼,也对未来人类与AI的和谐相处、携手共进抱有更多信心。