当前位置：首页 >人工智能 >文字转视频，人工智能 ‘视频模型’即将到来

文字转视频，人工智能 ‘视频模型’即将到来

发布时间：2024-03-05 16:48:20 浏览量：201次

昨天开放的人工智能对人类释放了最新的怪物，这确实

令人兴奋，我希望你享受一场美好的生存危机，因为你将

看到的是人类的一小步和人工智能的巨大飞跃，

我们都知道更好的人工智能视频模型即将到来，但开放 AI Sora 的

表现超出了我们最疯狂的预期，它是第一个能够制作

长达一分钟的逼真视频的人工智能，在今天的视频中，我们将看看

视频模型的文本实际上可以做什么，弄清楚它是如何工作的

2024 年 2 月 16 日，当我昨天醒来时，你正在观看代码报告 Google

宣布了 Gemini 1.5，其上下文窗口高达 1000 万个代币，这是一项令人

难以置信的成就这也让人们大吃一惊，但桑达尔

很快就被山姆·奥特曼（Sam ultman）所掩盖，他刚刚向我们展示了他的新朋友

索拉（Sora），索拉（Sora）来自日语中的“ 天空”一词，它是一个文本到视频模型以及

您在该视频中看到的所有视频剪辑由 Sora 生成，这

不是第一个 AI 视频模型，我们已经有了稳定的视频扩散等开放模型

和 Pika 等私有产品，但 Sora 击败了一切，

不仅图像更真实，而且可以长达一分钟

并保持帧之间的凝聚力，它们也可以以

不同的纵横比渲染它们可以从描述您想要看到的内容的文本提示创建，也可以从

现在栩栩如生的起始图像创建我最初的想法是打开AI Cherry 挑选了所有这些例子，但情况

似乎并非如此，因为 Sam Alman 在 Twitter 上接受了人群的请求，

并在几分钟内返回了示例，就像两只金毛猎犬

在山顶上做播客一样，不错，但下一个确实令人

印象深刻将一家非营利性开源公司转变为一家盈利性

封闭源代码公司的家伙，令人印象深刻，非常好，所以现在您可能想知道如何

才能很好地掌握这件事，如果将如此

强大的模型提供给一些随机的家伙，那么您可以不那么快想象一下它

会被用来做什么的恐怖，如果我们能为我们的人工智能

影响者生成视频以获取更多提示，那就太好了，但这永远不会发生，

这个模型不太可能开源，当他们发布它时，

视频将会有 c2p 元数据，它基本上是一个监视设备，

记录内容的来源以及内容的修改方式，无论如何，

我们确实有一些关于模型如何工作的细节，这可能需要

大量的计算能力，而且只需要几个几周前，萨姆·奥尔特曼 (Sam Altman) 向

世界请求 7 万亿美元购买一堆 GPU，是的，这就是万亿美元，

甚至连 Jensen Wong 也取笑了这个数字，因为完成这项工作实际上只需要花费

2 万亿美元左右，但也许 Jensen 就是 Wong，这是

视频模型需要大量 GPU 来缩放，让我们了解它们是如何工作的 Sora

是一个像 Dolly 和稳定扩散一样的扩散模型，您从

一些随机噪声开始，然后逐渐将该噪声更新为连贯图像，请查看

此视频，如果您想要了解有关该算法的更多信息，现在

单个静态图像中包含大量数据，例如 th000 像素 x th000 像素 x 三个

颜色通道，得出 300 万个数据点，这是一个很大的数字，但

如果我们有一个 1 分钟的视频怎么办以每秒 60 帧的速度，我们现在需要生成超过 100 亿个数据点，从灵长类大脑的角度来看，100 万秒约为 11 1/2 天，而 100 亿秒约为3177 年，因此存在巨大差异规模加视频

增加了时间维度来理解这些数据，他们采用了

类似于大型语言模型的方法，该模型对代码和诗歌等文本进行标记，

但是 Sora 不是对文本进行标记，而是对视觉补丁进行标记，这些

就像小的压缩图像块捕捉它们的视觉效果

以及它们如何随时间或逐帧移动同样有趣的是，

视频模型通常会裁剪其训练数据并输出到特定的

时间和分辨率，但 Sora 可以根据其原始分辨率训练数据并输出

可变分辨率这也很酷，那么这项技术

将如何改变世界呢？去年，像 Photoshop 这样的工具得到了一整套

人工智能编辑工具，将来我们将能够在视频中做同样的事情，就像你

开车一样沿着路走，想要改变背景

风景，现在你可以在 10 秒内做到这一点，而不是聘请摄影师

和 CGI 专家，但另一个备受关注的利润丰厚的高薪职业

是 Minecraft 流 Sora 可以模拟 Minecraft 中的人工运动，

并且有可能在几秒钟内将任何想法变成 Minecraft 世界，或者

也许您想导演自己的独立皮克斯电影 AI 通过

窃取才华横溢的人类艺术作品使这成为可能，但这可能

不像这些视频那么容易，您会注意到很多如果你仔细观察的话，你会发现

它们有一些微妙但独特的人工智能外观，而且它们并

没有完美地模拟物理或人形交互，但弄清楚

这些限制只是时间问题，尽管我个人

对索拉感到威胁和恐惧目睹

一万年的人类文化被机器人吞噬，这是一种荣幸，这是

代码报告，感谢您的观看，我们将在下一篇中见到您

上一篇北师大未来设计学院在第六届中国教博会发布五项PBL大挑战项目

下一篇 LTX Studio :仅需文本，即可生成超25秒视频!比Sora还酷!

热门课程推荐

热门资讯

1. 照片变漫画效果，这4个方法操作简单有效，快来试试吧！

想将照片变成漫画效果？这篇文章分享了4个方法，包括Photoshop、聪明灵犀、VanceAI Toongineer、醒图，简单操作就能实现，快来尝试一下吧！
2. AI视频制作神器Viggle：让静态人物动起来，创意无限！

Viggle AI是一款免费制作视频的AI工具，能让静态人物图片动起来，快来了解Viggle AI的功能和优势吧！
3. 华为手机神奇“AI修图”功能，一键消除衣服！原图变身大V领深V！

最近华为手机Pura70推出的“AI修图”功能引发热议，通过简单操作可以让照片中的人物换装。想了解更多这款神奇功能的使用方法吗？点击查看！
4. AI显卡绘画排行榜:4090无悬念，最具性价比出人意料

在AI绘图领域，Stable Diffusion的显卡绘图性能备受关注。本文整理了Stable Diffusion显卡的硬件要求和性能表现，以及2023年3月显卡AI绘图效率排行榜和性价比排行榜。欢迎查看最新的AI显卡算力排行榜。
5. 四款值得推荐的AI以图生图软件，有需要的赶紧来试试!

近年来,人工智能逐渐走入公众视野,其中的AI图像生成技术尤为引人注目。只需在特定软件中输入关键词描述语以及上传参考图就能智能高效生成符合要求的...
6. 四款软件让你一键生成AI美女!

就能快速生成一幅极具艺术效果的作品,让现实中不懂绘画的人也能参与其中创作!真的超赞哒~趣趣分享几款超厉害的AI绘画软件,提供详细操作!有需要的快来...
7. 零基础10分钟生成漫画，教大家如何用AI生成自己的漫画

接下来,我将亲自引导你,使用AI工具,创作一本既有趣又能带来盈利的漫画。我们将一起探索如何利用这个工具,发挥你的创意,制作出令人惊叹的漫画作品。让...
8. 10个建筑AI工具，从设计到施工全覆盖!肯定有你从来没听过的

讲述了建筑业比较著名的AI公司小库科技做出的探索,在这儿就不多说了。今天,我们试着在规划设计、建筑方案设计、住宅设计、管道设计、出渲染图、3D扫...
9. 小说转视频AI神器，一键生成小说视频!

AI技术的快速发展为各行各业带来了许多创新应用,其中之一就是AI小说生成视频。这种技术利用人工智能算法和语言模型,将文本转化为视频剧情,加上配图、...
10. 赶紧收藏好!这4个完全免费的AI视频制作网站和工具

以下是一些免费的AI视频制作网站或工具,帮助您制作各种类型的视频。 1. Lumen5:Lumen5是一个基于AI的视频制作工具,可将文本转换为视频。用户可以使...

文字转视频，人工智能 ‘视频模型’即将到来

请绑定手机号