浙江宣传：Sora将改写什么

2024年02月21日 07:31:15

在ChatGPT问世一年多后，OpenAI公司近期再次出招，推出文生视频大模型Sora。根据简单的文本指令，Sora就能生成一段60秒的视频，其中包含多角度镜头切换，呈现相当丰富的细节，等等。OpenAI官网发布了多个视频示例，逼真的画面令人很难区分它们是由实拍而得，还是由AI生成。

Sora的现身一时间引发热议。部分业内人士称其“比想象中来得更快”，是“人工智能领域的一次突破”；也有一些网友紧张了起来，比如有人担心，有了Sora的加持，影视、传媒、广告等文化产业将受冲击，进而产生了“饭碗焦虑”。

不禁要问，Sora究竟是什么？如果普遍使用的话，它将给文化产业及其从业者带来什么？

Sora生成的视频图像：一杯咖啡中，两艘海盗船展开了“战斗” 图源：OpenAI官网

一

Sora并不是文生视频领域的第一个“吃螃蟹者”。此前，Runway、Pika等公司也曾推出文生视频模型。那么，“后来者”Sora为啥能“居上”？

“大片质感”。有人评价，由Sora生成的视频，无论是光影色彩的转变，还是镜头移动，甚至细微到纹理结构变化，都呈现出较高质感。它还能模拟现实世界的物理规律，像“一杯咖啡中，两艘海盗船展开了激烈的战斗”这段视频，不仅呈现了咖啡的流体动力学和逼真的光影渲染，还运用了光线追踪和移轴摄影技术等，技能强大。

“时长感人”。此前，谷歌、Runway等推出的大模型，每次生成的视频最多只能达到10多秒的时长。而Sora则将视频长度拉长到了60秒，这一突破意味着，由其生成的视频信息承载力更强、内容更丰富，达到了很多短视频平台的内容发布要求。

“匹配自如”。Sora不仅能让文字迅速成片，而且能根据情况生成与各种设备匹配的画面，宽屏视频、竖屏视频以及其他比例的视频，都能得到匹配。这也使得Sora能适应不同设备，满足各类用户的观看需求。

此外，据分析，Sora在细节处理、语言理解能力、视频扩展功能等方面的表现也较为显眼，这些也正是“后来者”Sora能够突出重围的原因。

二

需要看到，作为生成式AI模型的一颗“新星”，Sora并不算完美，仍存在一些不成熟之处，比如逻辑性还有待提升，在更精细内容的调控方面有待加强。但它的出现，已经给大众带来了一定的想象空间。

对文化产业而言，“新物种”Sora如果能够进一步被使用，或许能带来不一般的能量。比如，在内容供给端，有业内人士就认为，Sora会像当年的智能手机一样，降低内容创作者门槛，从而使内容供给更加丰富。

对影视产业来说，Sora似乎已经可以“承包”部分摄影、导演、剪辑等任务，那么当它进一步升级后，影响的或许将不只是短视频。尽管Sora发布的视频示例中，时间最长的只有60秒，但按照AI大模型等技术日新月异的迭代速度，生产出优质的AI长视频似乎指日可待。当然，这一角色，除了Sora，也可以是其他的大模型。

Sora生成的视频图像：一辆老式SUV行驶在盘山公路上图源：OpenAI官网

这一技术也可以应用到广告业领域。像OpenAI发布的一个视频示例就呈现了这样的画面，“一辆老式SUV行驶在盘山公路上，扬起的灰尘在温暖的阳光下清晰可见，路两边的丘陵上种满了红杉树”。可以想象，未来的汽车广告、美食广告、景点宣传视频等一些不需要特别复杂情节的广告视频，或许就能够借助它来完成。

此外，于新闻传媒业而言，诸如Sora这样的视频生成器的使用，也会对目前的新闻生产方式和流程等产生一定的重构性作用。

当然，文生视频大模型的出现也令人喜忧参半。比如一些文化产业相关从业者就开始担心，Sora是否可能抢了自己的“饭碗”。目前网络上相关讨论当中，这是主要话题之一。

还有一些网友担忧，在未来，假新闻是否会因此而更泛滥？此前就有人曾利用ChatGPT将搜集到的一些素材修改编辑后，当成新闻报道发布在互联网上，编造假新闻牟利。此外，这种逼真的视频生成技术还可能被用于制作“深度伪造”视频，一旦被犯罪分子利用，将带来较大风险。

图源：视觉中国

三

技术浪潮下的文化产业，重塑与变革必然势不可当，正如蒸汽机、发电机等机器工具的发明和普及，让手工劳动被自动化机器代替。随着Sora及其他一些大模型的逐步开放和商用，文化产业中部分重复性的、缺少技术含量的劳动有较大可能会被取代。

换言之，无论是ChatGPT还是Sora，技术进步更重要的意义，在于让更多人可以不被简单重复的劳动所束缚，从而去创造更大价值。文化产业想要制胜未来，不能逃避而只能主动拥抱人工智能新浪潮。那么，如何让生成式AI技术的“洪荒之力”为我们所用？

与AI成为工作“搭子”。生成式AI所蕴含的深层次、革命性力量是不容低估的，与其揣着“饭碗焦虑”，我们不如将之视为工作的“搭子”，利用它帮助自己更高效地实现创意转化、精品打造等。

比如，真实是新闻报道的生命，生成式AI不能完成纪实性内容的采集和拍摄，但利用好这一技术，是否可以快速生成动画、图表，使得报道更生动、内容更可读？对影视产业来说，利用该技术降低影视特效生成难度，一些高风险、拍摄难度系数较大的镜头和画面可用它来生成。

把好内容安全的“方向盘”。生成式AI是基于现有数据基础的“演绎”，如果现有“训练资料”有问题，则产生的内容也容易受到影响，出现偏差。因此，进一步完善内容审核机制，确保AI生成的文字、图片和视频等内容导向正确、合法合规，还需要继续探索。同时，也有必要积极开发运用相应AI辅助工具，及时筛选存在问题的内容，有效防范虚假、违规等内容的传播风险。

让技术与文化“共舞”。文化产业要更好接驳这一波风口，既要有技术的“强支撑”，让生成式AI发挥好“聪明才智”，也要有文化的“强底座”，让数字技术与文化创新发展共融共舞，催生产业新活力。比如，运用AI技术生成虚拟数字人，在各大景区景点、文博场馆化身传统文化“导游”，与观众进行穿越时空的对话，带来沉浸式新体验。

有人说，就像宝剑从属于侠客一样，无论人工智能发展到何种程度，它始终根源于人类的创造，也始终是人类智慧的延伸。不妨对AI技术的发展寄予美好的期盼，也对未来人类与AI的和谐相处、携手共进抱有更多信心。

浙江宣传：Sora将改写什么

亲爱的凤凰网用户:

第三方浏览器推荐: