Code前端首页关于Code前端联系我们

文图转换三种模型：Stable Diffusion、Midjourney、DALL·E 2

terry 3年前 (2023-09-23) 阅读数 199 #AI人工智能

在人工智能的生成风暴中，文图转换三种模型脱颖而出：Stable Diffusion、Midjourney、DALL·E 2.

简而言之，本文将帮助您确定哪一个最适合您的工作流程。

稳定扩散

如果您正在寻找开源图像生成器，稳定扩散是目前这三个选项中的唯一选择。您可以在计算机上本地运行 Stable Diffusion，这意味着您拥有更多控制权、更好的自定义功能，甚至可以使用其文本到图像深度学习模型构建自己的 AI 工具。

因为它是开源的，所以许多工具/公司如雨后春笋般涌现，允许您直接从网络浏览器访问稳定扩散。我们将在本文中使用 Lexica，因为它有一个内置的搜索聚合器和生成器！

生成步骤

如果您还没有账户，请前往lexica.art创建一个账户。
在“描述您的图像”框中，输入有关您要创建的内容的提示。

3。（可选）输入关于您不希望在图像中看到的内容的负面注释。

单击“生成”按钮创建图像。

看看这有多容易！

稳定扩散有什么好处

稳定扩散是开源的并且高度可定制，您可以使用自己的模型对其进行训练并突破您的想象力的极限。Lexica通过他自己的“光圈”模型做到了这一点。

如果您的预算非常紧张，稳定扩散也非常有用。有很多方法可以免费访问稳定扩散（搜索“SD Replicate”以获取即时选项）。

像 Aperture 这样的一些专有模型也击败了其他一代人工智能工具，因为它们专门针对人和图像进行训练。例如，查看以下内容：

Manju Warier，春日花园里的宇航员，作者：Martin Johanna、Simon stalenhag、chie yoshii、caseyweldon 和 wlop：：华丽、动感、独特、色彩丰富、复杂、优雅，高度详细，来自 harper's bazaar 时尚杂志的艺术平滑锐焦点 8k 辛烷渲染

Midjourney

Midjourney 不像稳定扩散那样开源，但它仍然很棒，特别是对于更具艺术性的图像。它擅长创建与艺术家创作的图像相似的图像。

生成步骤

加入MJ Discord：https://discord.gg/midjourney
加入Discord后，系统会询问您几个问题来验证自己。
如果您想直接从 Midjourney 中了解有关其功能的更多信息，请阅读#getting-started 模块。
访问任何#newbies 频道。
在底部的聊天文本框中，输入 /imagine，然后输入您的小费。
按键盘上的回车键，系统会提示您！

这相当于“免费版本”。您可以用它来测试中途风格是否适合您的口味。您还可以查看社区中其他人创建的精彩图像。

中途挑战需要一些与稳定扩散不同的工程。学习这一点的最佳方法是通过反复试验来了解如何调整图像以获得所需的效果。让我们尝试一下之前的相同提示：

Manju Warier，春日花园里的宇航员，作者：Martin Johanna、Simon stalenhag、chie yoshii、caseyweldon 和 wlop：：华丽、动态、独特、色彩丰富、错综复杂，优雅、高度详细的 harpers bazaar 艺术时尚杂志平滑锐利焦点 8k 辛烷值渲染

与上面的稳定扩散相比，这可能看起来不太好，但您可以尝试其他方法，随着时间的推移进行变化和更改，直到找到适合您需求的图像。

总的来说，Midjourney 非常适合初学者，因为即使它最先进的功能也非常易于使用。 Discord 服务器附带大量易于访问和理解的说明、支持和设置。多代定价也非常实惠（8 美元/月起）。

挑战示例

让我们使用相同的挑战来面对他们，以更好地了解他们的不同之处。

挑战 #1
夜间混乱街机的广角镜头，宫崎骏的动漫线描，多面板漫画，穿着街头服装的女人玩街机游戏，科幻小说，漫画面板，轻小说风格，深红色颜色

稳定扩散：

中途：

DALL·E 2：

DALL·E 2

由于Midjing不是我们的开源，Yaoj有2个我们的开源API。您可以立即开始使用它，看看它生成的图像与稳定扩散和中途有何不同。

生成步骤

访问 https://labs.openai.com/ 并创建一个帐户（如果您还没有帐户）。
在文本字段中写下您的提示。
按“生成”或可选的“给我惊喜”。

我们仍然使用相同的挑战：

Manju Warier，春日花园里的宇航员，Martine Johanna 和 simon stalenhag 和 chie yoshii 和 caseyweldon 和 wlop：：华丽，动态，特殊，色彩丰富，复杂，优雅，高度详细，harpers bazaar艺术，时尚杂志，平滑，锐利，8k，辛烷渲染

如您所见，结果并不是那么好。但我们可以微调挑战并重试。然而，艺术渲染并不是 Dall-E 的强项。它缺乏定制和高级功能，但价格非常实惠！尽管根据单个图像来跟踪可能会有点困难。

他真正非常擅长的是照片写实主义。而且技巧往往不那么复杂。让我们尝试一些非常简单的事情。

意大利猫的肖像

我们在中途尝试同样的技巧：

现在看稳定扩散效果：

可以看到，2DALL2效果最好三者中的简单性和简短提示。这并不意味着您无法使用稳定扩散或中途旅程获得类似的结果，您只需要了解一些有关提示工程的知识即可。

挑战＃2
多面板漫画，宫崎骏的动漫线条艺术，轻小说风格，书呆子女孩在装满小玩意的房间里在电脑上编程，艺术站，轮廓剪影，戏剧性的灯光，杰作，黑暗蓝色

稳定扩散：

中途：

DALL·E 2：

挑战第3号'宽幅复古动漫漫画0巷子在晚上；戴兜帽的女人坐着看书；作者：空山基、格雷格·托奇尼、维吉尔·芬莱，科幻小说。铅笔画。赛博朋克艺术

稳定扩散：

中途：

DALL·E 2：

挑战#4

由Kentaro Miura绘制的以太森林门户详细说明，海报，peter mohrbacher，粉彩，对称稳定扩散：

稳定扩散：

中途：

DALL·E 2：图像生成器‷这些‷各有优势，可以根据您的需求提供出色的体验。读完本文后，我鼓励您访问所有网站并亲自尝试一下。

探索他们的优势，亲自测试它们，看看事情与你自己的经历相比如何。最后，清楚地了解您想要创建的内容和超级清晰的提示，无论您使用什么平台，您都会得到一些很棒的东西。

除了我上面分享的内容之外，如果我告诉你，你可以结合三种人工智能工具的优势来创建一张击败它们的巨型图像，会怎么样？

这是我使用所有三个工具创建的示例：

本文最初由 Meta Mae 撰写，由 Boya Shuzhi 翻译自中文。

版权声明

本文仅代表作者观点，不代表Code前端网立场。
本文系作者Code前端网发表，如需转载，请注明页面地址。

上一篇：单片机开发中VDD和VCC有什么区别？下一篇：ChatGPT提示工程，惊艳你的开发

相关文章

Microsoft TypeScript 开发人员解释为什么他们选择 Go 而不是 Rust、C#

微软的 Anders Hejlsberg 解释说，选择 Go 作为其 TypeScript 编译器端口是因为它的原生代码...

TypeScript

1年前 (2025-04-14) 520阅读 #AI人工智能
人工智能时代投资软技能的重要性

我会摆好我的摊位，让你知道我仍然是人工智能怀疑论者。哎呀，我很多时候仍然在谈论“人工智能”时用引号括起来。然...

人工智能

1年前 (2025-01-14) 724阅读 #AI人工智能
4GB/8GB/16GB RAM 足够用于 Windows 11 吗？

Windows 11 使用多少 RAM？4GB、8GB 或 16GB RAM 对于 Windows 11 来说足够吗？M...

Windows 11

2年前 (2024-01-26) 913阅读 #AI人工智能
谷歌的新人工智能搜索功能正在改变移动用户（包括iOS）的游戏规则

想用谷歌搜索一些东西吗？只需拍照即可获得人工智能生成的响应。谷歌正试图利用其在搜索引擎领域的主导地位在人工智能（AI）竞...

人工智能搜索

2年前 (2024-01-24) 926阅读 #AI人工智能
这个人工智能只需看几张照片就能找到你的位置

安全的社交媒体做法包括不发布展示个人信息（例如车牌号、街道名称或门牌号）的照片。但如果我告诉你，生成式人工智...

Google

2年前 (2024-01-22) 915阅读 #AI人工智能