Llama3助力高质量图像生成：突破性的增强技术解析

Llama3助力高质量图像生成：突破性的增强技术解析

2年前更新

03519

图片[1]-Llama3助力高质量图像生成：突破性的增强技术解析

Llama 3引发了新一波丰富用户Prompt的应用。

流行的AI生成工具，如ComfyUI和Automatic1111/Forge现在无缝集成了Llama 3。这使得提示增强变得更加容易，无需复杂的操作，这要归功于配套的插件

什么是Llama 3？

Llama 3是Meta推出的大型语言模型（LLM）。在特定条件下可以免费商用（每月最多7亿次请求）。Meta Llama 3的版本从8B到400B不等，超过了谷歌的Gemma/Gemini、Mistral和Claude 3 Sonnet等可比模型，能够在4GB GPU上高效运行。

安装Ollama

Ollama 用作安装 Llama 3 的辅助工具。您可以从下面的链接下载与您的操作系统兼容的版本。

下载Ollama

在启动 Ollama 后，在终端中执行以下命令以下载 llama3_ifai_sd_prompt_mkr_q4km。它大约占用 4.9GB 的存储空间。

ollama run impactframes/llama3_ifai_sd_prompt_mkr_q4km

该模型将 Llama 3 与 5000 个高质量的稳定扩散提示结合在一起，以确保优越的提示性能和质量。

下载完成后，您可以与 Llama 3 进行对话。它专门设计用于提示。如果我向 Llama 3 输入 1girl，它将详细描述提示，并提供关于 1girl 概念的详细见解。

提示：可爱、充满活力的年轻女孩，灿烂的微笑，卷曲的棕色头发，独自站在郁绿的森林林地上，脖子上戴着鲜艳的花环，用闪亮的眼睛直视着观众，周围开满了盛开的野花，阳光透过树木洒落下来。

安装扩展

每次手动复制提示都是不切实际的，按照指南安装 ComfyUI 节点和 Automatic1111 StableDiffusionWebUI/Forge 扩展，以简化 Llama 3 的使用。

自动稳定扩散 WebUI/Forge 扩展

WebUI 和 Forge 版本共享相同的扩展和安装过程，如下所述。

导航到 Extensions > Available，然后点击 Load from，然后搜索 IF_prompt_MKR 以找到并安装它。

扩展设置

•安装后，转到设置 > 未分类 > iF_prompt_MKR 并将生成提示的 API 选择设置为 Ollama。

•然后在脚本部分，选择 iF_prompt_MKR。

•在文本模型中，选择字符作为 iF_prompt_MKR。

•选择文本模型为 impactframes/llama3_ifai_sd_prompt_mkr_q4km:latest。

•您可以在输入提示字段中输入一个简单的提示。

•请注意，启用扩展将使用 iF_prompt_MKR 生成的提示替换原始提示框。

•在样式（可选）下，自定义和设置提示的样式。选择的样式将显示用于立即修改提示的样式。

在前缀和嵌入以及后缀和洛拉中，如果需要，选择嵌入模型和洛拉模型。尽管这些是可选的。

选择负面提示将在文本字段中显示选项。我选择了 simple_negative。

我使用 Juggernaut XL Lightning 作为检查点模型。如果不使用 Lightning 或 Turbo 模型，请调整步骤和 CFG 比例。

使用此扩展时，终端会提供提示的指南和建议供参考。

比较测试

在 iF_prompt_MKR 文本模型中，将女孩，蓝天背景作为提示输入。样式选择为史诗和摄影，负面提示为简单负面。

在没有 Llama 3 支持的情况下生成相同提示的图像。

虽然两组图像都描绘了一个女孩站在蓝天背景下，但使用 Llama 3 提示生成的图像更丰富，具有更多的细节和背景内容。Llama 3 显著增强了提示，特别是当原始提示缺乏具体性时。

ComfyUI

安装 Ollama 后，使用 ComfyUI 管理器搜索 ComfyUI-IF_AI_tools 并安装它。

然后在以下链接中下载工作流程：

使用 Llama 3 为 ComfyUI 生成提示

我配置它来比较常规提示和 Llama 3 增强提示。在 IF Prompt to Prompt 部分，我使用toy cat作为提示。

•我选择了 Juggernaut XL Lightning 作为检查点模型，如果不使用 Lightning Model，则调整 steps 和 cfg。

•样式装饰提示设置为 Epic，样式提示设置为 DigitalArt，负面提示设置为 simple_negative。

在 IF Display Text 中，观察 Llama 3 生成的提示与原生提示的不同之处，顶部显示 prompts，底部显示 negative prompts。

Llama 3 增强的提示结果在背景内容上更丰富和详细。然而，由于其逼真性，一些图像失去了动画感，但仍展示了 Llama 3 提供的显著增强。

结论

与 Llama 3 一起使用的扩展极大地简化了增强提示的过程。尽管在增强后偶尔会出现偏差，但总体测试结果非常令人满意，特别是当初始提示缺乏详细的背景描述时。

Llama 3 提供的补充上下文显著增强了图像，使其成为 Stable Diffusion 提示生成武器库中不可或缺的元素。

© 版权声明

THE END

喜欢就支持一下吧

相关推荐

评论抢沙发

欢迎您留下宝贵的见解！

提交

暂无评论内容