テキストを入力するだけで高品質な画像が生成できるとして、Stable Diffusionが世間をにぎわせています。
ローカル版のStable Diffusion Web UI(AUTOMATIC1111)は、自身のパソコンにインストールして無料で利用できます。非常に高性能な自動生成aiイラストなので、その人気はうなぎのぼりです。
本記事ではStable Diffusionのインストール方法について解説し、最後は実際のaiイラストの生成例などを交えて説明していきます。
Stable Diffusionとは
Stable Diffusionは、テキストをもとに画像を自動生成することができるAIです。
ChatGPTとほぼ同時期に発表され、AI時代の到来を感じさせる代表的なモノの1つになっていますね。
人間なら数時間どころか数日かかりそうな美麗なイラストを、ものの数秒で自動生成してしまうStable Diffusion。
その完成度の高さから、多くのイラストレーターの職を奪ってしまうのではないかと危惧されてしまうくらいStable Diffusionのイラストのレベルは高いです。
Stable Diffusionは、Stable Diffusion Web UI(AUTOMATIC1111)をインストールすればローカル環境で使用できるので、最も一般的かつ人気の使用方法になります。
ちなみに「Stable Diffusion Online」という無料Webサイトがありますが、本家のStable Diffusionと比べると、イラストのレベルが明らかに低くなってしまいます。
注意点1 パソコンスペック
Stable Diffusionをローカル環境で使用するには、高性能なパソコンが必要です。
本物と見まがうような美麗な人物や背景を描き出すには、相応の負荷がパソコンにかかります。
Stable Diffusionの公式サイトでは、
OS | Windows 10/11 64bit |
---|---|
CPU | ・Intel Core-i シリーズ ・AMD Ryzenシリーズ |
メモリー | 16GB以上 |
グラボ | VRAM 8GB以上 *実際は12GB以上欲しい |
上記が推奨スペックとされていますが、グラボのVRAM(ビデオメモリー)容量は8GBではなく12GB以上欲しいです。
8GBだと生成画像を大きくしたり、美麗な設定にするとフリーズする危険があります。
Google Colabなどを介してオンラインで使用する方法もありますが、処理を肩代わりしてほらう代わりに月額課金が必要になります。無料で使用するために、推奨スペックを持ったパソコンを用意したい。
「Stable Diffusionの推奨PCスペックとおすすめパソコン」について詳しく記事にしているので、気になる方はこちらの記事もご覧いただければと思います。
【関連記事】
ローカル版:Stable Diffusion Web UI(AUTOMATIC1111)
Stable Diffusionを自分のパソコンにインストールし、ローカル環境で使用するためには、
・Python 3.10.6
・Git
・Stable Diffusion Web UI(AUTOMATIC1111)
の3つをインストールする必要があります。
注意点2 ダウンロード場所には十分な容量を
Stable Diffusion Web UI(AUTOMATIC1111)は非常に大きなデータです。ダウンロードする場所には十分な容量(数十GB)を持っていることを確認しましょう。
例えば無料版のOneDriveと連結している場所だと、5GBの容量しかないので足りません。
デスクトップ・ドキュメントなどだとOneDriveと連結している可能性が高いので、PC⇒Windows(C:)などにインストールしましょう。
私は実際にそれをやってしまい、OneDriveがパンパンになってしまい、急いで中止して、もう一度インストールするという二度手間を経験しました。パソコンがものすごい音を立てるし、当時はめちゃくちゃ焦りましたね。
もちろん無料版ではなく、有料版のOneDriveを使用している方は、容量に余裕があるかもしれないのでその場合はOneDriveでも全然OKですが。
Stable Diffusionのインストール
それでは早速、Stable Diffusionに必要な
・Python 3.10.6
・Git
・Stable Diffusion Web UI(AUTOMATIC1111)
の3つの導入方法を説明していきます。
Python 3.10.6
①Python 3.10.6を公式サイトからダウンロードします。ページ下部にある「Windows installer (64-bit)」をクリックしましょう。
Python 3.10.6をダウンロードしたら、パソコンにインストール。インストール時には「Add Python 3.10 to PATH」へのチェックを。✓状態に。
Git
②Gitを公式サイトからダウンロードします。「64-bit Git for Windows Setup.」をクリックしてダウンロード。
ダウンロードしたら、パソコンにインストールします。NextをクリックしていればOKです。
Web UI(AUTOMATIC1111)
③Gitをインストールすれば、Stable Diffusion Web UI(AUTOMATIC1111)をダウンロードしたい場所で右クリック。「Git Bash Here」をクリック。
Gitが開くので、下記コマンドを入力。コピペしてくだされば早いです。
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
貼り付けると、自動でStable Diffusion Web UI(AUTOMATIC1111)がダウンロードされます。
ダウンロードが完了すると、「stable-diffusion-webui」というフォルダが作成されているのを確認できます。
Stable Diffusionを起動
「stable-diffusion-webui」を開き、ファイル内で下から2番目の「webui-user(Windowsバッチファイル)」をダブルクリックします。ファイル形式を表示するようにしている人には「webui-user.bat」と一目でわかります。
コマンドプロンプトが開き、黒い背景に白文字が羅列されていきます。
初回起動時には必要なファイルをダウンロードするために時間がかかりますが、2回目以降はすぐに立ち上がります。
完了までは数分かかります。完了すると、
上記のURLを開きます。URLは共通なので、以下のURLをコピペして開いていただければ大丈夫です。
http://127.0.0.1:7860
下記の画面が表示されれば成功です。
ちなみにダウンロードが完了する前にURLを開こうとすると、「このサイトにアクセスできません」と出ます。気長に待ちましょう。
Stable Diffusionを実際に使ってみる
自動生成したい内容のテキストを「Prompt」に入力し、「Generate」をクリックします。
これだけで、AIイラストを作成できます。
初期状態の設定で、推奨PCスペックを満たしていたら、数秒で作成できると思います。
試しに「girl」と入力してみます。
このようなAIイラストが生成されました。良く言えば綺麗、悪く言えば無個性といった感じでしょうか。
デフォルトで入っているモデルですが、上のイラストは何回かやり直して一番きれいに生成されたAIイラストです。下の謎の文字列はたまたま入った感じですね。
このイラストは512×512サイズで16KBほどにしているので画質が荒くなっていますが、本来は512×512で300KBほどあり、画質は上の画像よりも全然きれいです。
本来の容量のままだと、記事を開くのに時間がかかってしまうので、画質を下げています。申し訳ないです。
注意点3 使用時は本体を最初に起動
Stable Diffusionを使用するときは、「http://127.0.0.1:7860」へと移動する前に、Stable Diffusionを起動しておく必要があります。
「webui-user(Windowsバッチファイル)」をダブルクリックしておくということですね。
起動する前に「http://127.0.0.1:7860」へ移動すると、「このサイトにアクセスできません」と出てしまいます。
基本的なことですが、私はそれを忘れていて、アンインストールしてもう一度インストールしなおす直前までいったので(汗)。
Stable Diffusion モデルをインストール
Stable Diffusionには有志の方々が、多くのモデルを作って配布しています。
アニメ調のイラストを得意とするモデルだったり、本物さながらの3Dイラストを得意とするモデルなどがあります。
今回はBRAを例に解説します。Civitaiというサイトから入手できます。容量は約3.6GB。
右上の「Download」ボタンからダウンロード。「Stable-diffusion」にダウンロードします。
場所は「stable-diffusion-webui」〉「models」〉「Stable-diffusion」です。
すでにStable Diffusion Web UI(AUTOMATIC1111)を起動している方は、
上部の更新ボタンをクリックすれば、そのままBrav5が候補リストに入り、自由に切り替えることができるようになります。
起動していない方は、次の起動時に自動的に更新されて、候補にBrav5が入っているので、更新ボタンの左のモデルリストからBrav5を選びましょう。
試しに「girl」で一枚生成したイラストがこちら。
かわいいですね。何回やっても、不自然な人間になることは少なく、とてもかわいい女の子が生成されます。
サイズを18KBにまで縮小しているので画像が荒いですが、本来のイラストはとてもきれいです。
ちなみにBrav5には推奨されるプロンプト(呪文)があり、
(Best quality, 8k, 32k, Masterpiece, UHD:1.2),Photo of Pretty Japanese woman
(Worst Quality:2.0)
(Worst Quality:2.0)
上記の2つのプロンプト(呪文)を入力すると、より美麗なイラストが生成される可能性が高まります。
①に(Best quality, 8k, 32k, Masterpiece, UHD:1.2),Photo of Pretty Japanese woman
②に(Worst Quality:2.0)
と入力。
今回はBrav5が日本人女性に特化したモデルということで、このプロンプトのまま生成してみます。
結果がこちら。
リアリティが一気に増しましたね。
このプロンプト(呪文)にさらに、様々なプロンプトを加えて、望むイラストを生成していきます。
Stable Diffusionのモデルは、CivitaiというサイトだけではなくHugging Faceというサイトからもダウンロードが可能です。詳しく知りたい方は「Stable Diffusion WebUIへのモデルの入れ方・追加ダウンロード方法について解説。」という記事をチェックしてみてください。
Stable Diffusionのモデルの多くは有料で、商用利用も可能なものは限られます。
BRAは無料でダウンロードができ、かつ、商用利用が可能なモデルです。この2つの条件を見たいしているモデルの中では、完成度が段違いに高い。chilled_remixも商用可能のモデルとしては高クオリティで人気が高いです。
有料のモデルと比べても正直全く遜色がないです。
アジア女性のイラスト生成には、もう一つ有名なモデルとしてChilloutMixがありますが、ChilloutMixは無料ですが商用利用は不可。
Stable Diffusionのモデル一覧とおすすめを紹介している記事がありますので、よければご覧ください。
【関連記事】
Stable Diffusionで最重要なPCパーツ
Stable Diffusionで最も重要なPCパーツはグラフィックボード(グラボ)です。
グラフィックボードは、GPU(Graphics Processing Unit)という画像処理装置と、処理を制御・一時記憶するためのVRAM(Video Ram:ビデオメモリー)、冷却ファンなどで構成されています。
グラフィックボードの性能が低ければ、Stable DiffusionでのAIイラスト自動生成は非常に難しくなります。出来たとしても、時間がとてもかかってしまう。
Stable DiffusionはVRAM容量が特に重要で、日常的に使用するのならVRAM容量が12GB以上欲しいです。最低でも8GB。
該当するグラフィックボードは、
・GeForce RTX 3060(VRAM12GB):約4万円
・GeForce RTX 4070(VRAM12GB):約9万円
・GeForce RTX 4070(VRAM12GB):約9万円
・GeForce RTX 4080(VRAM16GB):約17万円
・GeForce RTX 4090(VRAM24GB):約25万円
など。
Stable Diffusionにおけるグラフィックボードの重要性と、おすすめのグラボについて解説している記事がありますので、よければご覧ください。
【関連記事】
Stable Diffusionに適したPC
Stable Diffusionにはグラフィックボード性能、特にVRAM容量が重要だと前述しましたが、そのグラフィックボード・VRAM容量を基準におすすめのパソコンをご紹介します。
価格 | 139,800円 |
---|---|
OS | Windows |
スペック | CPU:Core i5-12400F メモリ:16GB GPU:RTX 3060 VRAM:12GB SSD:1TB(NVMe) |
重量 | 約7.2kg |
公式サイト | G-Tune PG-I5G60 |
GPUがGeForce RTX 3060搭載の人気パソコン。
G-TuneはマウスコンピューターのゲーミングPCブランドです。
Stable Diffusionを日常的に行うなら、このくらいのスペックは欲しい。
RTX 3060は最新世代ではないですが、Stable Diffusionを行う上では非常にコスパがよく、相性もいいです。
最新世代のRTX 4060はVRAMが8GBで、VRAMが12GBあるRTX 3060よりもStable Diffusionを行う上では不向きです。
VRAMが12GB以上あるグラボとしては、RTX 3060が最も安い。
ゲーミングPCとしても使え、何かと融通のきくバランスに優れたパソコンです。
Stable Diffusionにおすすめのパソコンについて、もっと詳しく解説・紹介している記事もあります。良ければこちらの記事もご覧ください。
まとめ
Stable Diffusionのインストール方法を解説しました。
インストール場所に十分な容量が必要なことや、起動時には毎回Stable Diffusion本体の起動をしてからサイトに移動するなどの注意点はありますが、Stable Diffusionは簡単に美麗なイラストを生成できる優れたコンテンツです。
存分に使い倒して、快適なStable Diffusionライフを送りましょう。
【関連記事】