如何在 如何在微信群里发起接龙

作者: Joel Pennington US
预设链接: https://blogs.nvidia.cn/blog/rtx-ai-garage-comfyui-tutorial
+++
AI 驱动的内容生成如今已深度融入 Adobe、Canva 等热门工具,众多机构和职业室也已将该技术纳入职业流。当下的图像模型能够稳定输出逼真的写实效果,视频模型可以生成时长更长、连贯性更强的画面内容,而两者都能够遵循创作指令进行生成。
创作者正越来越多地在本地 PC 上运行这些职业流,以便把控创作素材、节省云服务成本,避免反复修改的阻碍,从而更高效地优化生成结局,满足创意项目的创作时刻需求。
< 插入 LTX-2 视频案例: https://youtu.be/6Iao0Q9cYlA?si=S1YL_PFiM-jNSMYm >
自诞生以来,NVIDIA RTX PC 凭借强大的性能成为运行创意 AI 的首选平台,不仅大幅缩短了迭代时刻,还允许用户不收费在本地运行模型,彻底消除了对 Token 消耗的焦虑。
本月早些时候在 CES 上公开的 RTX 优化和最新放开权重模型让创作者能以更快的速度、更高的效率进行创作,并获取远超以往的创意呈现。
怎样开始
视觉生成式 AI 也许会让新用户感觉复杂且有诸多限制。在线AI生成工具虽然运用简单,但可控性有限。
ComfyUI 这样的开源社区工具简化了顶级创意职业流的搭建,且配置便捷。同时,它们还提供了获取新鲜、强大的模型,如 FLUX.2 和 LTX-2,以及杰出社区职业流的简单途径。
下面内容是怎样在 RTX PC 上运用 ComfyUI 和主流模型,运用视觉生成式 AI 进行本地创作的方式:
-
访问comfy.org下载并配置适用于Windows的ComfyUI。
-
启动ComfyUI。
-
运用入门模板创建第一张图像:
-
点击“模板”按钮,接着选择“快速开始”,并选择“文本转图片”。
-
将模型“节点”连接到“保存图像”节点。这些节点以流水线方法协同职业,利用AI生成内容。
-
点击蓝色的“运行”按钮,观察绿色“节点”高亮显示,RTX PC 将开始生成你的第一张图像。
修改提示词并再次运行,即可进一步深入寻觅视觉生成式AI的创作全球。
下面说明了怎样深入运用更多 ComfyUI 模板,尝试采用更顶级的图像和视频模型的创作流。
模型规模和GPU
当用户逐渐熟悉 ComfyUI 及其支持的模型后,就需要开始思考GPU显存容量,以及某个模型是否能够在显存范围内运行。下面内容是根据不同 GPU 显存容量给出的入门示例:
[1] *为获取最佳效果,提议在 NVIDIA GeForce RTX 50 系列 GPU 上运用 FP4 模型,在 RTX 40 系列 GPU 上运用 FP8 模型。这样可以在占用更少显存的同时提供更高性能。
[2] *为获取最佳效果,提议在 NVIDIA GeForce RTX 50 系列 GPU 上运用 FP4 模型,在 RTX 40 系列 GPU 上运用 FP8 模型。这样可以在占用更少显存的同时提供更高性能。
生成图像
寻觅怎样运用FLUX.2-Dev提高图像生成质量:
在 ComfyUI 的“模板”部分,点击“全部模板”,并搜索“FLUX.2 Dev 文生图”。选择后,ComfyUI 将加载一组已连接的节点,即“职业流”。
FLUX.2-Dev 包含需要下载的模型权重。
模型权重是 AI 模型内部所包含的“姿势”,可以将其领会为大脑中的突触。当像 FLUX.2 这样的图像生成模型被训练时,它会从数百万张图像中进修玩法,而这些玩法会以数十亿个数值的形式存储下来,这些数值就被称为“权重”。
ComfyUI 并未内置这些权重文件,而是在需要时从 Hugging Face 等仓库中按需下载。这些文件体积通常很大(FLUX.2 根据版本不同,大致也许超过 30GB),因此体系需要具备足够的存储空间,并预留相应的下载时刻。
体系会弹出壹个对话框,引导用户下载模型权重。权重文件(filename.safetensors)会自动保存到用户 PC 上 ComfyUI 对应的正确文件夹中。
保存职业流:
在模型权重下载完成后,下一步是将这个新下载的模板保存为壹个“职业流”。
点击左上角的汉堡菜单(三条横线),选择“保存”。该职业流将被保存到用户的“职业流”列表中(按下 W 键可显示或隐藏该窗口)。随后可关闭标签页,在不丢失任何内容的情况下退出该职业流。
如果在模型权重尚未下载完成前意外关闭了下载对话框:
● 按下 W 键可快速打开“职业流”窗口。
● 选择该职业流,ComfyUI 将从头加载,并自动提示下载缺失的模型权重。
此时,ComfyUI 已准备就绪,可运用 FLUX.2-Dev 生成图像。
FLUX.2-Dev提示词诀窍:
● 从清晰、具体的主体、场景、风格和气氛描述开始,例如:“电影感特写,一辆雨中的复古赛车,湿漉漉的柏油路面上映出霓虹反射,高对比度,35mm 摄影。”在入门阶段,简短到中等长度的提示词——一两句聚焦明确的描述——通常比冗长、故事化的提示更容易控制效果。
● 添加约束条件以引导一致性和质量,例如:
○ 构图(“广角镜头”或“人像构图”)
○ 细节水平(“高细节,清晰对焦”)
○ 写实程度(“写实风格”或“风格化插画”)
● 如果画面显得过于杂乱,优先减少形容词,而不是继续添加。
● 避免运用负面提示词,专注描述你想要的内容。
请参见 Black Forest Labs 提供的指导,了解更多关于FLUX.2提示词的运用诀窍。
本地存储途径:
完成图像细化后,右键点击“保存图像”节点,即可在浏览器中打开图像,或将其保存到新的位置。
根据应用类型和操作体系不同,ComfyUI 的默认输出文件夹通常如下:
● Windows(独立版/便携版):通常位于C:\ComfyUI\output,或程序解压目录下的类似途径。
● Windows(桌面版):途径通常位于AppData目录中,例如:C:\Users%username%\AppData\Local\Programs@comfyorgcomfyui-electron\resources\ComfyUI\output
● Linux:默认配置途径为~/.config/ComfyUI。
视频生成
以最新的 LTX-2 模型为例,寻觅怎样提高视频生成质量:
< 插入 LTX-2 视频案例: https://youtu.be/ifxOXmL351I?si=xf2_j01BAQlUhfhY >
Lightrick 的 LTX-2 是一款先进的音视频模型,专为在 ComfyUI 中实现可控、分镜式的视频生成而设计。在下载完成LTX-2 图生视频模板及模型权重后,提议将提示词视为简短的镜头描述,而非完整的电影剧本。
和前两个模板不同,LTX-2 图生视频结合了一张图像和文本提示词来生成视频。
用户可以选用在 FLUX.2-Dev 中生成的图像其中一个,并添加文本提示词,让画面“动”起来。
LTX-2 提示词诀窍:
为在ComfyUI中获取最佳效果,提议将提示词用现在时写成壹个连贯的段落,或采用简洁的脚本格式,包括场景深入了解、动作、人物名称和对白。整体以4到6句描述性语句为宜,覆盖全部决定因素要素:
● 确立镜头和场景(远景/中景/特写、光照、色彩、材质、气氛)。
● 将动作描述为清晰的连续经过,定义人物的可见特征和肢体语言,并明确镜头运动方法。
● 最后补充音频元素,如环境音、音乐和对白,并运用引号标注。
细节层级需和镜头尺度相匹配。例如,特写镜头比远景镜头更需要精确的人物和材质细节。要清楚说明镜头和主体之间的关系,而不仅仅是镜头怎样移动。
提示词中可思考加入更多细节,包括:
● 镜头运动语言:明确指定“缓慢推轨前进”“手持跟拍”“过肩镜头”“横给摇摄”“给上俯仰”“推进”“拉远”或“固定镜头”等。
● 镜头类型:清晰说明远景、中景或特写,并结合合适的光照、浅景深和天然运动。
● 节拍:引导运用慢动作、延时摄影、停留镜头、长镜头、定格画面或无缝转场,以塑造节拍和气氛。
● 环境气氛:加入雾气、薄雾、雨水、黄金时刻光线、反射效果和丰盛的表面纹理等场景细节,让画面更具真正感。
● 风格:在提示词开头明确风格,如绘画感、黑色电影、胶片风格、定格动画、像素化边缘、流行大片或超现实风格。
● 光照:运用具体语言描述逆光、特定配色方法、柔和轮廓光、镜头光晕或其他光照细节。
● 心情:重点刻画单一主体的表演,通过清晰的面部表情和细微动作传达情感。
● 声音和音频:提示人物运用不同语言说话或歌唱,并配合明确的环境音描述。
优化显存占用和图像质量
一直以来前沿模型,LTX-2 为了提供高质量效果,需要占用大量显存(VRAM)。随着分辨率、帧率、视频时长或采样步数的提高,显存占用也会随之增加。
ComfyUI 和 NVIDIA 合作优化了一项 weight streaming 功能,当 GPU 显存不足时,可将职业流的部分内容卸载到体系内存中运行——但这会以性能下降为代价。
根据GPU型号和运用场景的不同,用户也许需要对这些影响加以限制,以确保生成时刻保持在合理范围内。
LTX-2 是一款极其先进的模型——但和任何模型一样,参数配置的调整都会对最终质量产生显著影响。
了解怎样在 RTX GPU 上优化 LTX-2,请参考用于 ComfyUI 的 LTX-2 快速入门指导,
运用FLUX.2-Dev 和LTX-2 构建自定义职业流
用户如需简化在不同 ComfyUI 职业流之间来回切换、在本地寻找 FLUX.2-Dev 生成的图片并插入 LTX-2 职业流中的经过,可以将 FLUX.2-Dev 和 LTX-2 组合到壹个新的职业流中:
● 打开已保存的 FLUX.2-Dev 文本转图像职业流。
● 按住 Ctrl 并用鼠标左键点击 FLUX.2-Dev 文本转图像节点。
● 在 LTX-2 图像转视频职业流中,运用 Ctrl+V 粘贴该节点。
● 将鼠标悬停在 FLUX.2-Dev 文本转图像节点的 “IMAGE” 接口点上,按住左键并拖动至 “调整图像/掩码大致” 接口点,蓝色连接线将自动生成。
以新名称保存该职业流,即可在同壹个职业流中同时为图像和视频输入提示词。
顶级3D 生成
在运用 FLUX.2 生成图像、LTX-2 生成视频后,下一步是加入 3D 引导。NVIDIA 的 3D 引导生成式 AI Blueprint 展示了怎样利用 3D 场景和资产,在 RTX PC 上驱动更可控、面给专业制作流程的图像和视频管线——并提供现成的职业流,供用户查看、调整和扩展。
创作者还可以在 Stable Diffusion subreddit 和 ComfyUI Discord 上展示作品、和其他用户探讨并获取帮助。
#别有失— NVIDIA RTX AI PC 的新鲜进展
