要闻

请登录登录

Midjourney能生成文字了！V6版5大升级惊艳网友

量子位 2023-12-24 20:27:50

科技

Midjourney重磅更新，V6版本问世！

更新后最大看点是图像更真实、细节处理更细腻：

和上一代对比来看更直观。

就说一道番茄炖牛腩，右边的图不仅菜看起来更自然、更有食欲，就连木勺的细节也没放过（左V5.2，右V6）：

再来看对人物的刻画，V6光影等细节拉满。相比之下，V5.2根本不是一个level（上V6，下V5.2）：

风景图的处理也是一眼就能区分哪个更真实自然（左V5.2，右V6）：

另外，新版本还有一大看头是可以对简单的文字进行处理了，只需给要绘制的文字加上"引号"，比如"Hello World!"：

终于不是乱码了！

创始人David Holz在Discord发帖公布了V6的问世，并且表示V6是团队从头开始训练的第三个模型，开发过程已持续了9个月。

总结来说，V6共有5大升级：

更精确且更长的提示响应

改进了连贯性和模型知识

图像生成和混合（remix）得到了优化

新增了基础文字绘制功能

upscale（放大器）功能得到增强，具有’subtle’和’creative’两种模式，分辨率提升两倍

此外，David Holz表示目前V6处于“alpha test”阶段，会随时变化，之后会升级到完整版。

这也就意味着，接下来几周内，V6的速度、图像质量、连贯性、提示响应和文本准确性会再次提高。

而目前V6相比于V5来说速度更慢、成本更高（大约每次imagine消耗1gpu/min，每次upscale消耗2gpu/min），但昨天已对V6做了一次更新，速度已提高2.7倍：

V6的问世，让网友们又有新东西玩了，各种测试对比都非常火爆：

不过，要想玩好V6，再用之前的提示策略恐怕是不行了。

David Holz明确表示“V6的提示与V5有很大不同，你需要重新学习如何提示”。

效果：写真真真

先来看一波网友们的测试效果。

让Midjourney V5.2（左）、V6（右）画一个酒吧，需要用灯牌标注”open late”（营业到很晚），V6画起来毫无难度：

再来体验一下更新后的Upscale，正常图片是这样婶儿的：

Subtle（上）、Creative（下）两种不同模式，家人们更中意哪张？

Creative连镜子里的细节都给处理了。

这里还有和其它AI绘图工具的比较，比如说DALL·E 3、Adobe Firefly。

Midjourney V6在不同风格的图片生成上，都表现出众：

是能够以假乱真的那种了：

甚至，V6还通过的香烟测试。不仅烟真实，手的岁月感也刻画得淋漓尽致：

但正如上面提到的，Midjourney V6更新不只是改变了效果，还有提示词。

好在David Holz给到了一些提示小妙招，其中就包括：

避免使用无关紧要的词，如award winning、photorealistic、4k、8k；

明确表达你想要的内容，表达明确，模型理解得更好；

如果你想要更具摄影感、更中立、更直接的效果，可以默认使用—style raw；

较低的—stylize值（默认100）可能会有更好的提示理解，而较高的值（最高1000）可能会有更好的美学效果。

我们也来简单上手体验一把。

开盒Midjourney V6

召唤V6的方法有三种，可以选择在Midjourney Discord服务器中键入斜杠命令“/settings”，或者在给Midjourney bot的直接消息（DM）中键入，然后使用顶部的下拉菜单选择V6，又或是在提示词后手动输入“—v 6.0”。

我们让Midjourney描绘一幅跨年夜的场景，要求要有漫天飞舞的大雪，还要有一个牌子上面写着“新年快乐”：

Please depict a New Year’s Eve scene with heavy snow falling all around, and include a sign with the words "Happy New Year" on it.

该说不说，虽然很有feel，但“字”的发挥还是不稳定。

完全相同的提示词下，V5.2版本整体偏暖色调，但这么一看V6画字还是很有水平的🤣：

紧接着，点击任意一张图Upscale：

就可以看到两个新的模式Subtle、Creative：

下面是Creative的效果，家人们如何评价？

参考链接：[1]https://twitter.com/chaseleantj/status/1737750592314040438

[2]https://twitter.com/Iamtomblake/status/1737818644388643120

[3]https://twitter.com/Mr_AllenT/status/1737829217973243990

本文来源：量子位

点击展开全文

网友评论

聚超值推荐

Western Digital 西部数据 My Passport随行SSD系列 USB 3.2 移动固态硬盘 Type-C 2TB 繁星金 WDBAGF0020BGD 月销1w+ ￥1099 ￥1179

分期免息华为mate60手机正品 ￥4899 ￥5299

机械君准系统迷你电脑（R5-5600H） 券后省10 ￥1179 ￥1189

Lenovo 联想个人云X1s NAS存储 8GB 五盘位 + 西数红盘Plus 4TB 券后省30 ￥2436 ￥2466

MI 小米 14 Pro 5G手机 16+1024 ￥4599 ￥4999

TAMRON 腾龙 A067S 50-400mm F4.5-6.3 镜头 券后省40 ￥8950 ￥8990

Apple 苹果 iPhone 15 Pro 5G手机 256GB 黑色钛金属 券后省200 ￥7899 ￥8099

QNAP 威联通 TS-464C 4盘位NAS 券后省100 ￥2499 ￥2599

Apple 苹果 Watch Series 9 智能手表 GPS款 45mm 风暴蓝色橡胶表带 S/M 券后省450 ￥2749 ￥3199

相关推荐

传音CFO被留置，“非洲手机之王”腹背受敌 科技要闻应用

传音CFO被留置，“非洲手机之王”腹背受敌

苹果发布会上没说的这个细节，会让国行iPhone 16和新手表体验受影响 科技要闻应用

苹果发布会上没说的这个细节，会让国行iPhone 16和新手表体验受影响

离地700多公里的“太空漫步”！美国亿万富翁实现人类首次商业太空行走 科技要闻应用

离地700多公里的“太空漫步”！美国亿万富翁实现人类首次商业太空行走

微信抖音搜索框新增电商入口，再造新引擎？ 科技要闻应用

微信抖音搜索框新增电商入口，再造新引擎？

库克跳不出乔布斯画的圈 科技要闻应用

库克跳不出乔布斯画的圈

共享充电宝「老大垂危」：直营业务只剩运维，代理模式滋生严重乱收费 科技要闻应用

共享充电宝「老大垂危」：直营业务只剩运维，代理模式滋生严重乱收费

OpenAI发布最强模型o1：博士物理92.8分，IOI金牌水平 科技要闻应用

OpenAI发布最强模型o1：博士物理92.8分，IOI金牌水平

陶哲轩力荐，哈佛反向学习法火了：教会AI就是教会自己 科技要闻应用

陶哲轩力荐，哈佛反向学习法火了：教会AI就是教会自己

OpenAI 发布最强模型 o1 ！打破 AI 瓶颈开启新时代，GPT-5 可能永远不会来了 科技要闻应用

OpenAI 发布最强模型 o1 ！打破 AI 瓶颈开启新时代，GPT-5 可能永远不会来了

索尼发布PS5 Pro，价格比性能飞更高 科技要闻应用

索尼发布PS5 Pro，价格比性能飞更高

相关产品