本文来自于微信公众号 新智元(ID:AI_era),作者:新智元布。
9月21日,OpenAI上线了DALL·E3,不仅绘画能力发生极大飞跃,而且还能「听懂」人话!
全新升级后的DALL·E3,也无可争议地成为了AI绘画领域的扛把子。
凑热闹的网友们也晒出了同一个Prompt用DALL·E3和Midjourney作画的对比图。
可以看到,DALL·E3在「理解意图」上比Midjourney做得更好,它生成的图像更准确。
这也许是因为在本次更新中,OpenAI宣布DALL·E3与ChatGPT合体了。
这将意味着我们要与繁复的提示工程说拜拜了,以后我们只要跟ChatGPT描述一下自己想要的图像,就可以生成一大波精美又风格迥异的图片!
DALL·E3内测上线的消息一出来,网络上各种Midjourney被吊打的言论就尘嚣甚上。
Midjourney看着这波,反手就是一个重磅消息:
Midjourney在今年之内将会推出更加惊艳的版本6,不仅会在图像生成的质量上有巨大飞跃,还会增加社交功能。
除此之外Midjourney也将上线3D和视频生成,虽然在今年之内我们不会看到这些功能。
而在DALL·E3发布后,Midjourney CEO David Holz被问到如何看待OpenAI的DALL·E3时,Holz「傲娇」地回应道:
「Midjourney将继续提供最高质量的图像。
这次DALL·E3和 Midjourney V5之间的比较中,其实可以看到DALL·E3在图像质量方面也没有遥遥领先,虽然它确实可以更好地遵循提示并呈现文本。」
虽然现在Midjourney V6还没有正式推出,但网上已经有各种版本更新内容的小道消息了!
接下来就让我们也一睹为快。
Midjourney V6
更新内容
1. 独立网站开发
Midjourney将从Discord中独立出来,推出自己的独立网站。并且会在自己的主页上集成用户友好的社交机制。
2. 移动应用程序开发
Midjourney预计通过移动应用程序来扩大自己的影响力。已知iOS用户可以在本机上就获得应用程序,而Android用户将通过其他渠道进行下载。
对于喜爱浏览网页的用户,Midjourney网站将针对移动设备的使用网站页面进行优化。
3. 数据中心升级
Midjourney将更新自己的数据中心,提供更快、更高效的用户体验。可以带来更快的图像生成,对于专业级和SVIP用户特别有利。但是由于计算资源有限,可能无法立即供所有用户级别使用。
4. 增加Turbo模式
Midjourney提供了一项名为「Turbo Mode」的功能,目前可供各个级别的用户使用。该模式下的性能比标准模式快四倍。用户可以通过添加命令–turbo或使用/turbo激活Turbo模式。
网友预测Midjourney V6更新的功能
1. 更高的图像分辨率
Midjourney V6生成的图像将达到2048x2048的分辨率。分辨率的飞跃不仅能够增强生成图像内容的丰富性,还能实现之前无法达成的复杂设计和细微差别。
2. 进一步提升的自然语言处理
Midjourney V6能够更好地理解用户的文本输入,达到和艺术家同行一样的交流和沟通。这将带来更准确、更加详细的图像生成。
3. 视频生成功能
Midjourney V6将会把静态图像无缝转换成动态和移动的场景。视频将能够承载比图片更多的内容和情节,帮助创作者更好地讲述自己的故事。
4.3D建模功能
之前,Midjourney 开对3D功能开发的延迟是因为缺少3D物体的数据。但在之后的版本中,Midjourney将会推出3D功能,与2D相比Midjourney生成的3D将几乎不存在质量损失。
5. 更精确的生成控制
能够在不改变整个构图的情况下改变图中的特定元素,这种微调控制将为创作带来更多的灵活性,为创作者提供更多的调整空间,可以将生成的图像推向新的高度。
并且,更新的Midjourney V6可以在生成的图像中更准确地反映提示参数,让创作者对作品拥有更强的控制力。
6. 拖放控制
Midjourney正在开发的新功能,比如DragGAN,这是一种新的AI编辑工具,可以通过在图像上使用简单的拖放控制来对图像进行更改,但可能只会在V7版本中看到。