LoRA の学習方法

カテゴリ：deeplearning

T2I 拡散モデルの設計メモ

カテゴリ：deeplearning

VRAM 8 GB で Qwen Image Edit 2509 を ComfyUI で実行する

カテゴリ：deeplearning

Waifu Diffusion で効率的に画像を生成する

カテゴリ：deeplearning

プロンプトリストはプロンプトやよく検索されているプロンプト（R18）、danbooru タグ検索を参照。

LLM を使ったストーリー作成

カテゴリ：deeplearning

LLM を使ったストーリー作成が一発でうまくいく事はない。なので、ストーリー作成の各工程ごとにアイデア出しの補助をさせることでストーリーを作成する。

AI のべりすとは日本語が使えるが性能は高くない。無料で公開されているローカル実行できる LLM を英語で使ったり、Chat GPT を使う方が効率がいい。AI のべりすとの強みはアダルト文章を日本語で出力できることだ。

oobabooga の tips

カテゴリ：deeplearning

AIのべりすとのようにプロンプトを編集しながらテキストを生成する

Default タブでできる。

テキスト生成のショートカットは Shift + Enter。

CPU のスレッド数を制限する

CPU で処理する場合４スレッドあたりで性能の限界が来る。E コアや Hyperthreading がスレッドをつかむと遅くなるので、Model タブで実行スレッドを制限する。

一部の処理を GPU にオフロードする

NAG Normalized Attention Guide の原理

カテゴリ：deeplearning

Wan2.2 の timestep 境界 0.875 の計算

カテゴリ：deeplearning

0.875 にはならないが以下の方法で計算していると考えられる。

ComfyUI の ModelSamplingAuraFlow とは何か

カテゴリ：deeplearning

ModelSamplingAuraFlow は高解像度画像を生成する際に、ノイズが不足しないようにするノード。

中身は ModelSamplingSD3 ノードと同じ。詳細は SD3 論文の p. 10 Resolution-dependent shifting of timestep schedules を参照。

ノイズを増量することで画像にディティールを追加する使い方もできる。

カテゴリ

LoRA の学習方法

Windows で llama.cpp のビルド

T2I 拡散モデルの設計メモ

目次

VRAM 8 GB で Qwen Image Edit 2509 を ComfyUI で実行する

目次

Waifu Diffusion で効率的に画像を生成する

目次

LLM を使ったストーリー作成

目次

oobabooga の tips

AIのべりすとのようにプロンプトを編集しながらテキストを生成する

CPU のスレッド数を制限する

一部の処理を GPU にオフロードする

NAG Normalized Attention Guide の原理

Wan2.2 の timestep 境界 0.875 の計算

ComfyUI の ModelSamplingAuraFlow とは何か