ComfyUI：搭积木一样构建专属于自己的AIGC工作流（保姆级教程）

ComfyUI：搭积木一样构建专属于自己的AIGC工作流（保姆级教程）

2025-09-07 21:04

阿里妹导读

通过本篇文章，你可以了解并实践通过【ComfyUI】构建自己的【文生图】和【文生动图】工作流。

一、省流版简介

通过本篇文章，你可以了解并实践通过【ComfyUI】构建自己的【文生图】和【文生动图】工作流，本文所有操作环境和硬件都基于公司所发工作电脑，模型都基于网络开源，无需自己训练调参。（不过如果你有更强悍的电脑，自己有自己的模型就更好了）。同时我也会给出我自己简单搭建的【workflow】给大家，方便大家快速使用。

二、安装

需要：

PyTorch 是一种用于构建深度学习模型的功能完备框架，是一种通常用于图像识别和语言处理等应用程序的机器学习。使用 Python 编写，因此对于大多数机器学习开发者而言，学习和使用起来相对简单。PyTorch 的独特之处在于，它完全支持 GPU，并且使用反向模式自动微分技术，因此可以动态修改计算图形。这使其成为快速实验和原型设计的常用选择。

我是使用conda来进行安装的，没有conda的可以先进行安装：

然后通过conda工具来安装pytorch：

最后运行一个python脚本来判断：

如果安装正确，会有如下输出：

使用 git 命令下载代码库到本地：

然后cd到仓库主目录，安装依赖：

然后运行程序，检测下载安装是否正常：

可以看到如果安装正常，会提示你服务已经部署在了本地地址：http://127.0.0.1:8188

请求本地地址，即可访问ComfyUI：

但是现在，你还没有配套部署任何的模型，所以此时是跑不起来的。

我自己在用两个模型下载的网站，两个都被墙了，需要大家自行科学上网：

HuggingFace：https://huggingface.co/

civitai：https://civitai.com/models

个人体验下来，HuggingFace更权威更偏学术一些，civital下载更快更偏娱乐一些（civital上有很多有趣的模型，玩起来还是很不错）。

模型的话，一般会存在两种后缀格式：

在下载完模型后，我们需要将模型导入到 ComfyUI 的 models 目录下，这样 ComfyUI 才能够加载到对应的模型。

三、使用

1. Comfy界面详解和基础使用

ComfyUI是通过一个个Node，加上Node与Node之间的链接，完成输入输出，并最终串联起整个AI生成的工作流（workflow）。

以【Clip Text Encode(Prompt)】节点为例：

其左侧端点是 Input（输入）端，右侧是 Output（输出）端，节点里还会有一些配置项，这些配置项我会称其为 Parameter（参数），参数是可编辑和调整的。通过将连线输入或输出到不同Node，可以串起不同的工作流。

1.2.1. Load Checkpoint

【Load Checkpoint】，顾名思义，就是加载模型用的。从节点的右边输出端点可以看出，Checkpoint 包含了三个部分：MODEL、CLIP 还有 VAE，这三部分其实就是Stable Diffusion 的模型运行的三大步骤，可以说这个节点是所有 Workflow 的起点。

三大步骤：

类似于降噪然后蚀刻的过程，可以参考 Midjourney 图片生成的过程：由暗变清晰：

1.2.2. CLIP Text Encode(Prompt) Node

CLIP Text Enocde 节点，CLIP 全称是 Contrastive Language-Image Pre-training，即对比文本图像预训练。这个节点主要是输入 Prompt。一般会有两个这样的节点，一个是正向的 Prompt，列你希望在图片中看到的内容；另一个是负向的 Prompt，列你不希望在图片中出现的内容。

一般说来，写 Stable Diffusion 的 prompt 有几个原则：

另外，还有个小技巧，你可以输入 (keyword:weight) 方式来控制关键词的权重，比如 (hight building: 1.2 ) 就意味着 hight building 的权重变高，如果填写的权重数小于 1，则意味着这个词的权重会变低，生成的图与这个词更不相关。