晨涧云文档

首页

目录

Kohya_ss-LoRA训练器 容器镜像

简介

Kohya_ss 是一个功能强大且专业的 Stable Diffusion LoRA 训练工具,提供了完整的图形化界面(GUI),支持多种模型的 LoRA 训练。它是目前最流行和功能最全面的 LoRA 训练解决方案之一,被广泛应用于 AI 图像生成领域。

主要特点

  1. 图形化界面:提供直观易用的 Web UI,无需复杂的命令行操作

  2. 功能全面:支持 LoRA、DreamBooth、Textual Inversion 等多种训练方式

  3. 参数丰富:提供详细的训练参数配置,满足专业用户需求

  4. 模型支持广泛:支持 SD1.5、SDXL、Flux 等多种主流模型

  5. 训练工具完善:内置数据集准备、标注、预处理等辅助工具

支持的训练类型

  • LoRA 训练:轻量级模型微调,适合人物、风格、物体等训练

  • DreamBooth:个性化模型训练

  • Textual Inversion:文本嵌入训练

  • Fine-tuning:完整模型微调

当前支持的版本

Kohya_ss版本Ubuntu版本Python版本
v25.2.122.043.10

 

访问 Kohya_ss

在控制台中,查看实例的【IP】和【预留端口】,端口选择内网端口8001映射的外网端口;

预留端口8001访问.png#500px #184px

然后打开浏览器,输入http://<IP>:<8001映射外网端口>访问 Kohya_ss。

快速开始

1. 启动

镜像启动后,Kohya_ss 会自动运行,访问地址:

http://<服务器IP>:8001

kohya_ss界面.png#1200px #660px

LoRA 训练使用流程

步骤 1:准备训练数据

1.1 创建数据集目录

在服务器上创建训练数据目录结构:

/data/kohya_ss/datasets/my_lora/
├── img/
│   └── 10_trigger_word/
│       ├── image1.jpg
│       ├── image1.txt
│       ├── image2.jpg
│       ├── image2.txt
│       └── ...

目录命名规则重复次数_触发词

  • 10:表示每个 epoch 重复训练 10 次

  • trigger_word:你的触发词,如 upper_body

1.2 准备训练图像

  1. 图像数量:建议 10-50 张高质量图像

  2. 图像质量

    • 分辨率:建议 512x512 或 1024x1024(SDXL)

    • 格式:JPG、PNG 均可

    • 内容:清晰、多角度、多场景

  3. 图像多样性:包含不同角度、表情、姿势、背景等

1.3 图像标注(Captioning)

为每张图像创建对应的 .txt 文件,文件名与图像文件相同,描述图像内容。

为每张图片创建同名的 .txt 文件,如:

image1.jpg → image1.txt

.txt 文件中写入相应图片的描述,如:

sks person wearing a red dress, standing in a garden, smiling

kohya_ss数据集准备.png#319px #180px

步骤 2:配置训练参数

LoRATraining 标签页中配置训练参数:

kohya_ss参数.png#1090px #590px

对于高级用户,可以进一步设置高级参数,参考官方文档

 

步骤 3:开始训练

点击页面底部的 Start training 按钮开始训练

kohya_ss训练.png#1000px #300px

步骤 4:监控训练过程

训练过程日志,需要登录后台查看:

/var/log/kohya_ss/kohya_ss.log

步骤 5:训练完成

训练完成后,会在日志中显示生成的LoRA模型路径

LoRA 模型会保存在指定的输出目录中,如:

/root/kohya_ss/outputs/
├── last.safetensors