Z-Imageとは?

Z-Image は、Alibaba / Tongyi-MAI による 画像生成モデルファミリー です。

Z-Image という名前自体がモデル群の総称なので少し分かりにくいですが、このページでは、派生元となる ベースモデルとしての Z-Image を扱います。 (区別のために Z-Image-Base と呼ばれることもあります。)

Z-Image は、(ファインチューニング元となる)ベースモデルとして、素直な特性を持っています。

Z-Image-Turbo のような蒸留・強化学習による安定化が入っていないため、シードや初期ノイズの違いが出力に反映されやすく、創造性とバリエーションが広い反面、パラメータにシビアで結果が大きく振れる難しいモデルでもあります。


モデルのダウンロード

📂ComfyUI/
└── 📂models/
    ├── 📂diffusion_models/
    │   └── z_image_bf16.safetensors
    ├── 📂text_encoders/
    │   └── qwen_3_4b.safetensors
    └── 📂vae/
        └── ae.safetensors

text2image

Z-Image.json
  • steps : サンプラーにもよりますが、30〜40 ほどと少し多めのほうが安定します

Z-Image-Turbo によるリファイン

Z-Image の生成結果を、Z-Image-Turbo で短いステップでリファインする方法です。 Z-Image の創造性と、Z-Image-Turbo の品質の安定感の両取りを狙います。

image2image してもいいですが、ここでは少しオシャレにサンプリングを2段に分けてみましょう。

Z-Image_refine-turbo.json

今回は前半50%、後半50%で分けます。 (cf. サンプリングを分割する)

  • 🟪 Z-Image : 30 steps のうち 15 steps
  • 🟨 Z-Image-Turbo : 8 steps のうち 4 steps

比較

Z-Image のみ
Z-Image のみ
Z-Image + Turbo
Z-Image + Turbo

Z-Image-Fun-Controlnet-Union-2.1

Z-Image 用の ControlNet 風パッチです。

モデルのダウンロード

📂ComfyUI/
└── 📂models/
    └── 📂model_patches/
        └── Z-Image-Fun-Controlnet-Union-2.1.safetensors

workflow

Z-Image-Fun-Controlnet-Union-2.1.json
  • 🟩 QwenImageDiffsynthControlnet にモデルと制御画像を追加
  • 🟩 この workflow では Depth Anything V2 で深度マップを作成します。

参考