OpenAI推出DALL·E 3 AI绘画模型,结合ChatGPT全面提升图像生成体验

发布时间:2024-09-29 17:07:05 浏览量:107次

利用DALL·E生成的AI图像(图片来源:OpenAI)

OpenAI又带来了令人振奋的消息。

美国OpenAI公司宣布,北京时间9月21日凌晨发布了重磅消息:推出了全新的AI绘画模型DALL·E 3,相较上个版本仅过去17个月。

据OpenAI介绍,DALL·E 3比以往系统更擅长识别细微差别和细节,使用户能更轻松地将自己的构想转化为高度准确的图像。同时,DALL·E 3还融合了ChatGPT,实现了多模态输出,让Plus和企业版用户可以通过文本直接在ChatGPT中生成各种图片类型,不仅加强了提示词生成图像的体验,也提升了模型理解用户指令的能力,改善了图像效果。

OpenAI公司CEO奥特曼(Sam Altman)称,新的DALL·E 3效果惊人,即将在未来几周内向所有ChatGPT Plus付费版/企业版用户开放。他表示,“如果不亲身体验一下,很难理解其中的神奇之处。”

据悉,OpenAI成立于2015年,致力于研发和应用人工智能(AI)技术造福人类。目前,OpenAI的估值达到约270亿美元,年营收也接近10亿美元。

2021年,OpenAI推出了DALL·E 和CLIP两大神经网络,能够将文本与图像联系起来。其中,DALL·E可直接根据文本生成图像,而CLIP则负责理解并评估输出的图像质量。DALL·E生成的图像经过CLIP模型筛选,呈现出最高质量的图像。

2022年,OpenAI升级了文生图技术,发布了DALL·E 2,提供了更高分辨率、更低延迟及编辑原始图像等功能。DALL·E是基于GPT-3的多模态实现,拥有120亿个参数,训练数据包括从网络上收集的文本和图像对。该模型具备零样本学习能力,能够从描述和提示中生成输出,无需额外训练。

专家认为,类似DALL·E的模型能够存储世界信息,并以人类自然方式进行推断。DALL·E绘制的插图远超过近年来其他文本生成图像系统,展现出其协调融合概念的能力,这是人类创造力的关键要素之一。

500多天后,此次发布的DALL·E 3新增多个功能,简要总结如下:

  • DALL·E 3具备更强图像细节和差异识别能力,用户更容易将构想转化为准确图像,并解决了之前版本不会书写文字的问题。
  • DALL·E 3与ChatGPT集成,用户创建提示词更简便,输入构想时,ChatGPT会为DALL·E 3生成详细提示。
  • DALL·E 3在图像质量和提示准确性上都有提升。新版本更能理解文本上下文和长度更长的提示,处理效果更佳。
  • 在安全方面,OpenAI为DALL·E 3制定了强有力的安全措施,防止生成有害图像且不会呈现公众人物图像。艺术家可要求将自己作品加入模型,并具备版权保护。
  • DALL·E 3将首先向特定用户发布,计划在秋季推向研究实验室和API服务。OpenAI尚未明确是否会发布免费公开版本。

利用ChatGPT,新版DALL·E 3实现了更准确的图像生成、更出色的体验效果以及更安全的文图标准。

OpenAI研究员Sandhini Agarwal表示,对于DALL·E 3的安全性她“高度有信心”,模型不断完善。

目前,国内外出现多个对标DALL·E的文图模型和应用,如Stability AI的Stable Diffusion,Midjourney,英伟达的Perfusion模型,阿里巴巴的通义万象,智源研究院的AltDiffusion,HiDream智象未来的Pixeling,阿里大文娱旗下妙鸭相机,网易伏羲旗下丹青等。

尽管AI生成图像仍面临问题,但根据美国法律,没有人工输入的作品无法获得版权。OpenAI面对多起诉讼,包括遭到作家约翰·格里沙姆和乔治·马丁的指控,他们称ChatGPT违法学习其作品。

(本文首发钛媒体App,作者|林志佳)

想深入了解AI绘画、图像生成等技术?欢迎前往火星时代教育,探索更多数字艺术相关课程,开启你的创造之旅。

热门课程推荐

热门资讯

请绑定手机号

x
确定