OpenAI再放大招,AI视频迎来史诗级更新!

发布时间:2024-03-05 13:37:49 浏览量:126次

AI界新年的第一颗重磅炸弹来了!就在昨天(2月16日)凌晨,OpenAI带来了它们全新的视频生成模型——Sora



它的重要性,完全不亚于ChatGPT的出现。换句话讲,Sora将秒杀一切目前市面上的文字生成视频模型,从现在开始,你看到的视频或者动图,全都是由这个AI生成的,而不是实际拍摄,欢迎大家来找茬,看看哪些地方暴露出了它的AI身份。


相较于Gen2的4秒,Pika的3秒,Sora直接把生成视频的时长拉长到了1分钟,比如我们下面看的这个视频,就是Sora生成的1分钟的长镜头。



,时长00:59

从上面的视频看出,整体的画面非常符合人类给出的提示词:一位时尚女性走在充满温暖霓虹灯的东京街道上,她穿着黑色皮夹克、红色长裙和黑色靴子,拎着黑色钱包,戴着太阳镜,涂着红色口红。她走路自信又随意。街道潮湿且反光,在彩色灯光的照射下形成镜面效果,许多行人走来走去。


并且如果不说,这个视频的画面绝对让百分之99的人都真假难辨!街道积水上的倒影,霓虹的灯牌等细节都十分经得起推敲。



更重要的是,它生成的视频,还少了之前AI生成视频的闪烁感,生成的帧与帧之间连接非常丝滑,看起来就像实拍一样。


不仅如此,Sora生成的1分钟视频中,还包含了不同景别的镜头,比如从全景切换到特写,而脸上的痘印等等细节,更是让人惊叹。



除了这个1分钟的长镜头,OpenAI还放出了30多个Demo,比如小熊猫在长出竹子的培养皿上嬉戏奔跑



两个海盗船在咖啡杯里面互相争斗



一个20多岁的年轻人坐在云朵上看书,它都可以搞定,要知道,这在以前可是需要专业的特效人员花费很长时间才能做出来的东西啊!



除了细节、画质和连续性,Sora在语义理解、视频风格上也非常到位。像用3D动画的形式,描写一个毛茸茸小怪物在融化蜡烛旁边



或者展示一个小而圆,有着大眼睛的生物和蘑菇上的小仙女互动



或者是跳Disco的袋鼠,它都可以正确地理解并且生成出来。可能以后真的没有迪士尼什么事儿了,人人都是动画片导演。



Sora另一个大突破,就是它懂得了现实世界的物理关系,比如提示词中的轮胎扬起的尘土,是在汽车后面



玻璃反射的倒影会根据环境的不同呈现不同的变化



金毛幼犬在雪地里被覆盖应该是什么样子的,这跟Gen2的不知道干嘛,完全不可控的画面有着天壤之别。



2023年的2月,Runway发布了文字生成视频模型Gen系列,仅仅过去一年,AI生成视频的质量,就已经从看起来十分鬼畜的样子,跨越到这样的以假乱真地步,不真实的油画感也完全消失不见。真不知道接下来AI还会进化到什么样子。


上次谷歌发布Gemini Ultra的时候,因为动用了剪辑,受到了国内外网友的一直“讨伐”,这次OpenAI变得十分小心了。在网页的最后,十分明显的标注了,大家看到的所有视频都是由Sora直接生成的,并且没有任何修改!



当然,目前的Sora还有一些不完美的地方,OpenAI也没有避讳,直接表明,目前Sora针对复杂环境中的物理效果,因果关系,空间和时间上推理上,还有些搞不清楚


比如这里输入关键词:以平面印刷的效果,展示一个跑步的场景,你会发现,这个人在跑步机上朝着相反的方向前进。



再或者考古学家在沙漠中发现了一把普通的塑料椅子,他们小心翼翼地挖掘并除尘。你会发现椅子并没有被Sora理解为一刚性物体,导致物理交互不准确。



同样的,还有影分身的小狼等等。



不过这些都难以掩饰这次Sora给AI界带来的巨大革新,当人们以为AI只能生成真假难辨的静态图片的时候,OpenAI却告诉我们,视频也可以这样玩。


因为还没有正式上线,所以我们没有办法试用到Sora,也不知道它的功能到底怎么样,是否可以直接代替现有的剪辑,拍摄等等。不过根据这些Demo,有一点可以肯定的是,靠贩卖视频素材的人,可能会被Sora波及到。


2024年,刚刚过去一个半月,英伟达发布了Chat With RTX,谷歌把Gemini更新到了1.5,OpenAI突放大招——Sora,看了今年又是AI带给我们惊喜的一年。

热门课程推荐

热门资讯

请绑定手机号

x
确定