文图转换三种模型:Stable Diffusion、Midjourney、DALL·E 2
在人工智能的生成风暴中,文图转换三种模型脱颖而出:Stable Diffusion、Midjourney、DALL·E 2.
简而言之,本文将帮助您确定哪一个最适合您的工作流程。
稳定扩散
如果您正在寻找开源图像生成器,稳定扩散是目前这三个选项中的唯一选择。您可以在计算机上本地运行 Stable Diffusion,这意味着您拥有更多控制权、更好的自定义功能,甚至可以使用其文本到图像深度学习模型构建自己的 AI 工具。
因为它是开源的,所以许多工具/公司如雨后春笋般涌现,允许您直接从网络浏览器访问稳定扩散。我们将在本文中使用 Lexica,因为它有一个内置的搜索聚合器和生成器!
- 生成步骤
- 如果您还没有账户,请前往lexica.art创建一个账户。
- 在“描述您的图像”框中,输入有关您要创建的内容的提示。
3。 (可选)输入关于您不希望在图像中看到的内容的负面注释。
- 单击“生成”按钮创建图像。

看看这有多容易!
- 稳定扩散有什么好处
稳定扩散是开源的并且高度可定制,您可以使用自己的模型对其进行训练并突破您的想象力的极限。Lexica通过他自己的“光圈”模型做到了这一点。
如果您的预算非常紧张,稳定扩散也非常有用。有很多方法可以免费访问稳定扩散(搜索“SD Replicate”以获取即时选项)。
像 Aperture 这样的一些专有模型也击败了其他一代人工智能工具,因为它们专门针对人和图像进行训练。例如,查看以下内容:
Manju Warier,春日花园里的宇航员,作者:Martin Johanna、Simon stalenhag、chie yoshii、caseyweldon 和 wlop::华丽、动感、独特、色彩丰富、复杂、优雅,高度详细,来自 harper's bazaar 时尚杂志的艺术平滑锐焦点 8k 辛烷渲染
Midjourney
Midjourney 不像稳定扩散那样开源,但它仍然很棒,特别是对于更具艺术性的图像。它擅长创建与艺术家创作的图像相似的图像。
- 生成步骤
- 加入MJ Discord:https://discord.gg/midjourney
- 加入Discord后,系统会询问您几个问题来验证自己。
- 如果您想直接从 Midjourney 中了解有关其功能的更多信息,请阅读#getting-started 模块。
- 访问任何#newbies 频道。
- 在底部的聊天文本框中,输入
/imagine
,然后输入您的小费。 - 按键盘上的回车键,系统会提示您!
这相当于“免费版本”。您可以用它来测试中途风格是否适合您的口味。您还可以查看社区中其他人创建的精彩图像。
中途挑战需要一些与稳定扩散不同的工程。学习这一点的最佳方法是通过反复试验来了解如何调整图像以获得所需的效果。让我们尝试一下之前的相同提示:
Manju Warier,春日花园里的宇航员,作者:Martin Johanna、Simon stalenhag、chie yoshii、caseyweldon 和 wlop::华丽、动态、独特、色彩丰富、错综复杂,优雅、高度详细的 harpers bazaar 艺术时尚杂志 平滑锐利焦点 8k 辛烷值渲染
与上面的稳定扩散相比,这可能看起来不太好,但您可以尝试其他方法,随着时间的推移进行变化和更改,直到找到适合您需求的图像。
总的来说,Midjourney 非常适合初学者,因为即使它最先进的功能也非常易于使用。 Discord 服务器附带大量易于访问和理解的说明、支持和设置。多代定价也非常实惠(8 美元/月起)。
挑战示例
让我们使用相同的挑战来面对他们,以更好地了解他们的不同之处。
挑战 #1
夜间混乱街机的广角镜头,宫崎骏的动漫线描,多面板漫画,穿着街头服装的女人玩街机游戏,科幻小说,漫画面板,轻小说风格,深红色颜色
稳定扩散:
中途:
DALL·E 2:
DALL·E 2
由于Midjing不是我们的开源,Yaoj有2个我们的开源API。您可以立即开始使用它,看看它生成的图像与稳定扩散和中途有何不同。
- 生成步骤
- 访问 https://labs.openai.com/ 并创建一个帐户(如果您还没有帐户)。
- 在文本字段中写下您的提示。
- 按“生成”或可选的“给我惊喜”。

我们仍然使用相同的挑战:
Manju Warier,春日花园里的宇航员,Martine Johanna 和 simon stalenhag 和 chie yoshii 和 caseyweldon 和 wlop::华丽,动态,特殊,色彩丰富,复杂,优雅,高度详细,harpers bazaar艺术,时尚杂志,平滑,锐利,8k,辛烷渲染
如您所见,结果并不是那么好。但我们可以微调挑战并重试。然而,艺术渲染并不是 Dall-E 的强项。它缺乏定制和高级功能,但价格非常实惠!尽管根据单个图像来跟踪可能会有点困难。
他真正非常擅长的是照片写实主义。而且技巧往往不那么复杂。让我们尝试一些非常简单的事情。
意大利猫的肖像
我们在中途尝试同样的技巧:
现在看稳定扩散效果:
可以看到,2DALL2效果最好三者中的简单性和简短提示。这并不意味着您无法使用稳定扩散或中途旅程获得类似的结果,您只需要了解一些有关提示工程的知识即可。
挑战#2
多面板漫画,宫崎骏的动漫线条艺术,轻小说风格,书呆子女孩在装满小玩意的房间里在电脑上编程,艺术站,轮廓剪影,戏剧性的灯光,杰作,黑暗蓝色
稳定扩散:
中途:
DALL·E 2:
挑战第3号'宽幅复古动漫漫画0巷子在晚上;戴兜帽的女人坐着看书;作者:空山基、格雷格·托奇尼、维吉尔·芬莱,科幻小说。铅笔画。赛博朋克艺术
稳定扩散:
中途:
DALL·E 2:
挑战#4
由Kentaro Miura绘制的以太森林门户详细说明,海报,peter mohrbacher,粉彩,对称稳定扩散:
稳定扩散:
中途:
DALL·E 2:图像生成器‷这些‷各有优势,可以根据您的需求提供出色的体验。读完本文后,我鼓励您访问所有网站并亲自尝试一下。
探索他们的优势,亲自测试它们,看看事情与你自己的经历相比如何。最后,清楚地了解您想要创建的内容和超级清晰的提示,无论您使用什么平台,您都会得到一些很棒的东西。
除了我上面分享的内容之外,如果我告诉你,你可以结合三种人工智能工具的优势来创建一张击败它们的巨型图像,会怎么样?
这是我使用所有三个工具创建的示例:
本文最初由 Meta Mae 撰写,由 Boya Shuzhi 翻译自中文。
版权声明
本文仅代表作者观点,不代表Code前端网立场。
本文系作者Code前端网发表,如需转载,请注明页面地址。
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。