Після тестування 200 зображень, брате Лонг зменшив правила для ComfyUI до 6 пунктів.


Спочатку думав, що підказки — це просто купа ключових слів — "двовимірне, аніме, миле, JK форма, довге волосся" — і безладно їх вставляв, але результати були завжди трохи не те, що я хотів.
Пізніше зрозумів: модель не розпізнає людську мову, вона лише реагує на ключові слова + вагу ймовірності.
❶ Синтаксис ваг — досить запам’ятати один.
(Ключове слово:число) — 1.2 підсилення, 0.8 послаблення, 1.0 за замовчуванням. Вкладені не більше 3 рівнів (глибше — переобучення). Мінімалістичний запис: (ключове слово++) = 1.2, [ключове слово] = 0.9.
❷ Чотири рівні золотого порядку
Об’єкт → оточення → стиль → якість. Модель найбільше уваги приділяє першим 20 токенам, тому ключові слова потрібно ставити на початок.
1дівчина, довге рожеве волосся, усмішка, кімоно,
сад із сакурами, м’яке сонячне світло,
аніме стиль, цільове затінення, пастельна палітра,
шедевр, найвища якість, 4K, деталізовані елементи
❸ Не використовуйте китайські підказки
Дані для тренування SD1.5/SDXL переважно англійські, китайські теги мають дуже низьку розпізнаваність. Англійський підказка + китайські коментарі — найкращий варіант.
❹ Універсальний шаблон негативних слів (підходить для 90% сцен)
низька якість, погана анатомія, зайві пальці, спотворені очі,
розмиття, потворне, дублі, водяний знак, підпис
Додатково для двовимірного: nsfw, монохром, плоскі кольори
Додатково для реалістичного стилю: пластикова шкіра, воскове обличчя, переекспозиція, шум
❺ Два набори стилістичних слів
- Двовимірне: кадр з аніме, цільове затінення, яскраві кольори, деталізований фон
- Реалістичне: фотореалістичне, кінематографічне освітлення, 85мм, субповерхневе розсіювання, зерно плівки
❻ Виявлення проблем із зображенням (на випадок біди)
- Не релевантне → згадка CFG 7-8
- Надмірний один елемент → зменшити вагу ключового слова / поставити пізніше
- Злиплі кілька персонажів → переписати структуру з чотирьох рівнів
- Дублюючі об’єкти → змінити насіння + додати негативні слова та repeat
Ці 6 правил не багато, їх легко копіювати та вставляти. Чи вони цінні — важко сказати, але після тестування 200 зображень я стабільно отримую результат.
Переглянути оригінал
post-image
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено