北京商报讯(记者 杨月涵)4月27日上午的2024中关村论坛年会未来人工智能先锋论坛上,生数科技联合清华大学发布中国首个长时长、高一致性、高动态性视频大模型——Vidu。Vidu是自Sora发布之后,全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平,并在加速迭代提升中。
“Vidu是全栈自主创新的最新成果,在多个维度实现了技术突破,比如可以模拟真实的物理世界、具有想象力、可以理解多镜头语言、可以一键生成长达16秒的视频、人物场景时间具有高度一致性,还可以理解中国元素。”现场,清华大学人工智能研究院副院长、生数科技首席科学家朱军说道。
据了解,Vidu的快速突破源自于团队在贝叶斯机器学习和多模态大模型的长期积累和多项原创性成果。其核心技术U-ViT架构由团队于2022年9月提出,早于Sora采用的DiT架构,是全球首个Diffusion与Transformer融合的架构。2023年3月,团队开源了全球首个基于U-ViT融合架构的多模态扩散模型UniDiffuser,率先完成了U-ViT架构的大规模可扩展性验证。
基于对U-ViT架构的深入理解以及长期积累的工程与数据经验,团队在短短两个月里进一步突破了长视频表示与处理的多项关键技术,研发了Vidu视频大模型,显著提升视频的连贯性和动态性。
中国新闻网2024-05-12 21:01:05
中国新闻网2024-05-12 21:00:42
美消费者信心指数创六个月新低:民众担忧通胀及失业率 努力缩减开支
海外网2024-05-12 21:00:04
中国新闻网2024-05-12 20:59:37
央视网2024-05-12 20:58:56
打造百姓身边的“绿水青山”:人与自然和谐共处 激发周边消费活力
央视网2024-05-12 20:58:26
人民网2024-05-12 20:58:02
新华社2024-05-12 20:57:12
央视新闻2024-05-12 20:56:12
新华社2024-05-12 20:55:46
人民网2024-05-12 20:55:18
新华社2024-05-12 20:53:18
澎湃新闻2024-05-12 19:17:23
央视网2024-05-12 18:28:58
新华社2024-05-12 18:28:31
央视新闻2024-05-12 18:28:01
央视新闻2024-05-12 18:26:23
人民日报2024-05-12 18:25:31
新华社2024-05-12 18:25:09
央视新闻2024-05-12 18:24:39
新华网客户端2024-05-12 18:07:48
中国新闻网2024-05-12 18:07:18
中国新闻网2024-05-12 18:06:39
央视新闻2024-05-12 18:05:24
中国新闻网2024-05-12 18:04:59
新华网客户端2024-05-12 18:04:36
人民日报海外版2024-05-12 18:03:48
通讯|“授人以渔”的中国实践——写在亚吉铁路运营六年“交钥匙”之际
新华网客户端2024-05-12 18:02:29
海外网2024-05-12 18:02:02
光明网2024-05-12 18:00:29