今年6月,快手发布的视频生成大模型“可灵”,在文生视频、图生视频方面展现出了创造逼真运动场景、精确模拟物理特性的能力与潜力。
唐家渝和张鹏表示,当前中国视频生成产品的主流技术路线,采用的是深度学习模型与扩散模型相结合的架构,遵从“规模定律”,强依赖算法、算力、数据。
视频生成产品Ying(清影)用户登录界面。新华社发
当前,全球范围内文本、图片生成视频模型赛道上已有多家科技企业参与竞逐。除OpenAI的Sora之外,还有Runway的Gen系列、微软的Nuwa、Meta的Emu、谷歌的Phenaki等。中国最早的入局者有生数科技的Vidu、智谱AI的清影、快手的可灵、商汤的日日新等。
张鹏说,目前中国的视频生成技术还处于起步阶段,并不完美;接下来还有高质量数据、算法等一系列问题有待逐一破解。然而加速人工智能技术发展的最好方式就是并行加速技术的研发与应用,而不是把技术关在实验室里闭门造车。
“从今天的技术实现角度,视频大模型的迭代将颠覆影视动画制作在内的内容产业。”唐家渝预判,未来十年,影视创作生产的门槛与影视动画制作的成本将进一步降低,更好地将想象力、创造力转化为生产力。
2024-11-20 17:30:30
2024-11-18 13:42:43
2024-11-15 13:28:15
2024-11-13 14:09:21
2024-11-12 13:46:17