科技魔方

Midjourney V6来袭!性能对标DALL·E 3,争夺地表最强作图AI称号

大模型

2023年10月02日

  本文来自于微信公众号 新智元(ID:AI_era),作者:新智元布。

  9月21日,OpenAI上线了DALL·E3,不仅绘画能力发生极大飞跃,而且还能「听懂」人话!

  全新升级后的DALL·E3,也无可争议地成为了AI绘画领域的扛把子。

  凑热闹的网友们也晒出了同一个Prompt用DALL·E3和Midjourney作画的对比图。

  可以看到,DALL·E3在「理解意图」上比Midjourney做得更好,它生成的图像更准确。

  这也许是因为在本次更新中,OpenAI宣布DALL·E3与ChatGPT合体了。

  这将意味着我们要与繁复的提示工程说拜拜了,以后我们只要跟ChatGPT描述一下自己想要的图像,就可以生成一大波精美又风格迥异的图片!

  DALL·E3内测上线的消息一出来,网络上各种Midjourney被吊打的言论就尘嚣甚上。

  Midjourney看着这波,反手就是一个重磅消息:

  Midjourney在今年之内将会推出更加惊艳的版本6,不仅会在图像生成的质量上有巨大飞跃,还会增加社交功能。

  除此之外Midjourney也将上线3D和视频生成,虽然在今年之内我们不会看到这些功能。

  而在DALL·E3发布后,Midjourney CEO David Holz被问到如何看待OpenAI的DALL·E3时,Holz「傲娇」地回应道:

  「Midjourney将继续提供最高质量的图像。

  这次DALL·E3和 Midjourney V5之间的比较中,其实可以看到DALL·E3在图像质量方面也没有遥遥领先,虽然它确实可以更好地遵循提示并呈现文本。」

  虽然现在Midjourney V6还没有正式推出,但网上已经有各种版本更新内容的小道消息了!

  接下来就让我们也一睹为快。

  Midjourney V6

  更新内容

  1. 独立网站开发

  Midjourney将从Discord中独立出来,推出自己的独立网站。并且会在自己的主页上集成用户友好的社交机制。

  2. 移动应用程序开发

  Midjourney预计通过移动应用程序来扩大自己的影响力。已知iOS用户可以在本机上就获得应用程序,而Android用户将通过其他渠道进行下载。

  对于喜爱浏览网页的用户,Midjourney网站将针对移动设备的使用网站页面进行优化。

  3. 数据中心升级

  Midjourney将更新自己的数据中心,提供更快、更高效的用户体验。可以带来更快的图像生成,对于专业级和SVIP用户特别有利。但是由于计算资源有限,可能无法立即供所有用户级别使用。

  4. 增加Turbo模式

  Midjourney提供了一项名为「Turbo Mode」的功能,目前可供各个级别的用户使用。该模式下的性能比标准模式快四倍。用户可以通过添加命令–turbo或使用/turbo激活Turbo模式。

  网友预测Midjourney V6更新的功能

  1. 更高的图像分辨率

  Midjourney V6生成的图像将达到2048x2048的分辨率。分辨率的飞跃不仅能够增强生成图像内容的丰富性,还能实现之前无法达成的复杂设计和细微差别。

  2. 进一步提升的自然语言处理

  Midjourney V6能够更好地理解用户的文本输入,达到和艺术家同行一样的交流和沟通。这将带来更准确、更加详细的图像生成。

  3. 视频生成功能

  Midjourney V6将会把静态图像无缝转换成动态和移动的场景。视频将能够承载比图片更多的内容和情节,帮助创作者更好地讲述自己的故事。

  4.3D建模功能

  之前,Midjourney 开对3D功能开发的延迟是因为缺少3D物体的数据。但在之后的版本中,Midjourney将会推出3D功能,与2D相比Midjourney生成的3D将几乎不存在质量损失。

  5. 更精确的生成控制

  能够在不改变整个构图的情况下改变图中的特定元素,这种微调控制将为创作带来更多的灵活性,为创作者提供更多的调整空间,可以将生成的图像推向新的高度。

  并且,更新的Midjourney V6可以在生成的图像中更准确地反映提示参数,让创作者对作品拥有更强的控制力。

  6. 拖放控制

  Midjourney正在开发的新功能,比如DragGAN,这是一种新的AI编辑工具,可以通过在图像上使用简单的拖放控制来对图像进行更改,但可能只会在V7版本中看到。

+1

来源:微信公众号新智元

延展资讯