dskjal
deeplearning カテゴリの記事一覧を表示しています。
広告
広告

Z Image Turbo を ComfyUI で実行する+プロンプトガイド

カテゴリ:deeplearning

Z Image Turbo はベースモデルではなく蒸留モデル(DMD)であることに注意。

Automatic1111 互換の forge-neo でも実行できる。

Qwen Image Edit や FLUX.2 は編集も生成もできるが、Z Image はそうではない

LoRa 作成用モデル
生成用モデル

Z-Image VS Turbo

Turbo は実写の画像生成のリアルさに強い。シードで多様性は出せないが、破綻した画像を出す確率が低い。

Z-Image(Turbo でない方)は多様なアニメ・イラストスタイルが表現できる。実写の品質もそこそこ高く、シードで多様性が出せる。ただし推論に時間がかかる(Turbo のおよそ5倍)。

Turbo と Z-Image との比較は Z-Image Base VS Z-Image Turbo を参照。

目次

特徴

続きを読む

ComfyUI で NetaYume-Lumina-Image-2.0

カテゴリ:deeplearning

次世代の NSFW モデルは Anima が軽量で NSFW が出せて自然言語に対応しており最有力候補。

目次

続きを読む

Qwen Image Edit 2511 を ComfyUI で実行する+プロンプトリスト

カテゴリ:deeplearning

目次

続きを読む

ComfyUI で FLUX.2 klein 9B を使う

カテゴリ:deeplearning

FLUX.2 klein 9B の編集能力は高い。物体除去、画像のモノクロトーン化、線画を維持した着色が高速でできる。FLUX.2 klein 9B をデフォルトで使い、できないタスクは Qwen Image Edit や FLUX.2 dev や Nano Banana Pro に投げるのがいいだろう。

Klein 4B は MCP サーバーを立てて LLM と同時に使うと楽しい。

昨今の強化学習で絵が固定されたモデルと違い、シードで多様性が出せるのもよい。

欠点

  • 一貫性の維持ができない
    • 編集すると色が変化する
    • FLUX.2 は HEX コードや参照色で色を指定できるが、klein では機能しない
    • 1~2ピクセルのピクセルシフトがおこる(ピクセルシフトが問題なら Qwen Image Layered や FLUX.2 dev を使う)
    • 参照画像の顔をコピペできない場合は顔がそこそこ変化する
  • t2i の性能は Z Image Turbo の方がよりリアルでプロンプトの追従性が高い
  • 指が溶けたり腕が増えたりする(蒸留モデルでガチャをすればいいので、あまり問題ではない)

目次

続きを読む

LoRA の学習方法

カテゴリ:deeplearning

続きを読む

Windows で Radeon を使って ComfyUI や Automatic1111WebUI を動かす

カテゴリ:deeplearning

続きを読む

Waifu Diffusion で効率的に画像を生成する

カテゴリ:deeplearning

プロンプトリストはプロンプトよく検索されているプロンプト(R18)danbooru タグ検索を参照。

目次

続きを読む

AI を使用した漫画作画

カテゴリ:deeplearning

この記事の作例は指定がなければ Qwen Image Edit 2511 を使っている。

目次

続きを読む