Stable Diffusionの登場により、イラストレーターが廃業に追いやられたという記事を見かけるほどです。
本業のイラストレーターが危機を抱くほどの、優れたAIイラストを生み出せるStable Diffusion。
優れたイラストを描けるだけあって、パソコンのスペック、特にグラボには高性能なものが求められます。
本記事では、Stable Diffusionに必要なグラボの選び方を解説し、おすすめのグラボをご紹介します。
【Stable Diffusion】AIイラストに必要なグラボの選び方
Stable DiffusionでのAIイラスト自動生成には、高性能なグラボが必要です。
グラボ(グラフィックボード)は主に、グラフィック処理に特化したGPUと、それを補佐するVRAM(GPU版のメモリ)で構成されています。あとは冷却用のファンなど。
この項目では、
・グラフィックボードは、NVIDIA社製[GeForce]・AMD社製[Radeon]、どちらを選ぶべきか
・VRAM容量の重要性
・各グラボのVRAM容量
・生成時間の一例
・高性能GPUのコスパの良さ
の5点を解説していきます。
NVIDIAかAMDか
Stable Diffusionに向いているグラフィックボードについて解説します。
グラフィックボードには、NVIDIA社製のGeForce・AMD社製のRadeonという2つの選択肢があるのですが、これは圧倒的にNVIDIA社製のGeForceがおすすめです。
Stable Diffusionにおいては、NVIDIA社のGeForceのほうが圧倒的に効率が上だからです。
AMD社製のRadeonだと性能が著しく低下します。最適化がほとんどされていないからです。起動オプションやドライババージョンを変更してもほぼ効果はなく、焼け石に水でしかありません。
この差は、Stable DiffusionがNVIDIA社のGPUでの使用を前提にして開発されたからです。Stable Diffusionに限らず、いろんなプログラムがNVIDIA社のGPUをもとにつくられます。
これは、NVIDIA社のGeForceがGPU市場で最も普及しているからです。
基本的にこういった新しい技術では、普及率が高い製品を前提に作るので、少数派のAMDとは相性が悪いつくりが多くなってしまいます。
PCゲームなども、数年前まではNVIDIA社の独壇場でした。
最近では、PCゲームでも編集ソフトでも最適化が進んでおり、AMD社のGPUも有力な候補ですが、Stable Diffusionに最適化するのはもう少し時間が必要なようです。
Stable Diffusionもいずれは最適化が進み、AMD社のGPUでも高効率のパフォーマンスを発揮できるようになるでしょうが、出てきたばかりの今は、まだ効率が悪いと言わざるを得ません。
グラボ | NVIDIA社のGeForce が圧倒的に効率がいい |
VRAM容量の重要性
GPU版のメモリであるVRAM(Video RAM:ビデオメモリ)について以下、公式サイトからの引用です。
VRAM の容量が少ない (4GB 以下) ビデオ カードで実行すると、メモリ不足エラーが発生する可能性があります。コマンド ライン引数を通じてさまざまな最適化を有効にすることができ、VRAM の使用量を減らして速度の一部または大幅を犠牲にすることができます。
公式では4GBで動作すると書いてありますが、あくまで最低ライン。4GBだと、そもそも起動が難しい。
日常的に使うには明らかにメモリ不足で、同時生成数を増やしたり、画質・サイズを高くするとエラーが頻発します。
6GB以上で起動が可能ですが、画像を大きくしたり解像度を上げると、エラーが頻発してしまいます。
VRAMは最低でも8GB以上、推奨したいのは12GB以上となるので、必然的にGPUはある程度高性能なものに限られます。低スペックのグラボは除外。
日常的にStable DiffusionでのAIイラスト自動生成を考えている方は、12GB以上の容量をもったVRAM搭載のグラフィックボードを用意したほうがいいです。
具体例を言うと、
・GeForce RTX 3060(VRAM12GB)
・GeForce RTX 4070(VRAM12GB)
・GeForce RTX 4070(VRAM12GB)
・GeForce RTX 4080(VRAM16GB)
・GeForce RTX 4090(VRAM24GB)
などが該当します。
公式サイトでVRAMについてのみ記載があるのは、GPU性能が低くても時間をかければ大きくて高画質なAIイラストを生成できるが、VRAMのメモリが少ないとそもそも生成できないからです。
ただ、上記でも述べたように、AMD社製のRadeonシリーズは、NVIDIA社製のGeForceよりも、はるかに効率が悪いです。
VRAM容量の利用効率が非常に悪いため、GeForceだと4GBでも起動・イラスト生成ができる使い方をしても、Radeonだと8GBのVRAM容量すら使い切ってしまう始末です。
数値上では互角のスペックでも、Stable Diffusionでは倍近いメモリを消費してしまいます。
GeForceなら8GBで動作可能な要求だと、Radeonだと20GB以上のVRAM容量が必要になります。
例に出すと、
・GeForce RTX 3060(VRAM12GB):約4万円
・Radeon RX 7900 XTX(VRAM24GB):約15万円
同価格のグラフィックボードだと、Radeonは間違いなくエラーになり、この倍以上のVRAM容量を埋めるには、予算で換算すると3倍以上の差になってしまいます。
以下に、グラフィックボードのVRAM容量で可能なことを表にしていますが、あくまでNVIDIA社のGeForce製であることを前提にしています。
4GB | ダメ |
6GB | 厳しい |
8GB | OK(簡易な使用のみ) |
12GB | OK!(時間はかかるが、 高画質やポーズ指定も可能) |
16GB 以上 | OK!(複雑かつ大容量の 作業が短時間) |
各グラボのVRAM容量
グラボとグラボに搭載されているVRAMの容量一覧です。
一概には言えませんが、性能当たりでVRAM容量が大きいほうが、Stable Diffusionに向いているグラボということになります。
並びは、下に行くほどGPU性能値が高いです。
GeForce GTX 1050 2GB
GeForce GTX 1650 4GB
GeForce GTX 1660 6GB
GeForce RTX 3050 8GB
GeForce RTX 3060 12GB
GeForce RTX 3060 Ti 8GB
GeForce RTX 4060 Ti 8GB
GeForce RTX 3070 8GB
GeForce RTX 3070 Ti 8GB
GeForce RTX 3080 10GB
GeForce RTX 4070 12GB
GeForce RTX 3080 12GB
GeForce RTX 3080 Ti 12GB
GeForce RTX 3090 24GB
GeForce RTX 3090 Ti 24GB
GeForce RTX 4070 Ti 12GB
GeForce RTX 4080 16GB
GeForce RTX 4090 24GB
GeForce RTX3060のVRAM12GBが際立っていますね。コストパフォーマンスという点から見れば非常に優れたグラフィックボードと言えます。
RTX4060などは高性能GPUですが、VRAM8GBであり、これだとStable Diffusionには不向きなGPUと言わざるを得ません。
ゲーミングPC用のGPUとしては優れたGPUですが、Stable DiffusionはVRAMの容量が重要なので、こういった事態が起こります。
ノートパソコン用のGPUは、同じ型番でも、上記のデスクトップ用GPUに比べてVRAMの容量は少なくなりがち。
今までなら、デスクトップに比べると、熱がこもりやすい・コスパが悪いの2つが主なデメリットでしたが、Stable DiffusionだとVRAMの容量がノートパソコンだとネックになりやすいというデメリットが加わる形になります。
生成時間の一例
グラボの性能によって、Stable Diffusionで生成できるAIイラストの画質や大きさ・生成速度は大きく変わってきます。
NVIDIA社のGeForceを例に出すと、
GeForce RTX 3060だと、512×512(一辺約14cm)のAIイラストは4~5秒かかります。ちなみに画質はとても綺麗です。Stable Diffusionのデフォルト設定で画質は最初から美麗。
GeForce RTX 3060の「RTX」はリアルタイムレイトレーシングという意味で、実写に近いCGを作りますよ、というNVIDIA社の意気込みみたいなものです。
GeForce RTX 3060の「3060」は「30(世代)60(性能)」を表しており、世代・性能ともに数字が大きいほど高性能です。
性能の数字が特に大きく影響し、3060と3070では性能が大きく違います。
Stable Diffusionでもそれは同じなのですが、Stable Diffusionは世代の違いでも大きく性能差が出ます。ゲーミングPCなどでは、世代の違いで効率に差はほとんど出ないです。
基本的には、最新世代である「GeForce RTX 4000」シリーズが最高効率。
1枚、512×512(一辺14cmくらいの正方形)、で生成すると下記のような生成時間になります。512×512はデフォルトの大きさ。
GTX 1650 30秒 GTX 1660 20秒 GTX 1080 11秒 RTX 3050 6秒 RTX 3060 4.5秒 RTX 3070 3秒 RTX 4070 2秒 RTX 4090 1秒 |
他の美麗さもデフォルト。画質や試行回数を減らせばもっと早くなるし、上げれば遅くなります。
RTX3060(VRAM12GB)とRTX3070(VRAM8GB)では、RTX3060のほうがVRAM容量は大きいですが、GPU性能はRTX3070のほうが優れているため、RTX3070のほうが早くなります。
VRAM容量は生成するAIイラストの大きさや質が大きくなるほど真価を発揮するので、RTX3070ではエラーを起こす画像サイズでも、RTX3060なら時間はかかっても最後まで画像を生成できるケースが多々あるという感じですね。
サイズを512×512から1024×1024にすると、(面積的に)4倍の大きさになり、かかる時間も4倍強になります。大きくしすぎると、VRAM容量が耐えられなくなるので注意。あと、Stable Diffusionは512×512がデフォルト基準なので、サイズを大きくしすぎたり、逆に小さくしすぎても、美麗なイラストを生成できなります。
LoRAモデルという学習装置(これを使えば、同じキャラでポーズや背景だけを変更したりできる)を使っての生成だと、かかる時間は標準よりも1.2~1.4倍ほどに増えます。
ControlNetという学習装置(こちらは、構図やポーズを決めてキャラだけを変更できる)を使っての生成だと、かかる時間は標準よりも1.5~1.7倍ほどに増えます。キャラ指定よりもポーズ指定のほうが、AIイラスト生成には負担が大きい。
1つ確かなことは、標準のデフォルト状態でのAIイラスト生成、LoRAモデル使用時のAIイラスト生成、ControlNet使用時のAIイラスト生成、いずれにしてもStable Diffusionのグラボは、性能だけでなく、世代もなるべく新しいものを選んだほうがいいということです。少なくとも1つ昔の世代である「GeForce RTX 3000」シリーズ。
高性能なほどコスパもいい
普通、グラボは高性能になるほど、価格はそれ以上に跳ね上がるため、一定のGPU性能を超えると、コスパの悪い、言ってみれば道楽的なグラボとなります。
5万円のグラボと10万円のグラボの価格差は2倍ですが、2つのグラボの性能差は2倍もありません。
しかし、Stable Diffusionにおけるグラボは、価格差が2倍あったら、AIイラスト自動生成にかかる秒数がそのまま半分ほどになります。
上記の一例では、GPUの性能値とかかる秒数がそのまま反比例しています。
しかし、生成枚数を増やしたり、画像サイズを大きくすると、この差はさらに広がります。
画質や枚数を上げれば、半分以下の秒数になることがあります。つまり2倍以上の効率になるということですね。
グラボが高性能であるほど、Stable Diffusionではコスパもいい。
Stable Diffusionの本格的な運用を考えている人は、高性能グラボの恩恵がとても大きくなります。
グラボなしは?
グラボを搭載していないパソコンでは、ローカル環境下において、Stable Diffusionを使用することはできません。
4GB以上のVRAM容量を持つグラフィックボードが絶対に必要です。
グラボなしでStable Diffusionを使うには、月額課金して、Google Colabというグラフィックボードが行う役割を肩代わりしてもらう必要があります。
ノートパソコンのグラボ
「GeForce RTX 3060」のVRAM容量が非常に優れており、コスパも高いと説明してきましたが、これはあくまでデスクトップパソコンのグラフィックボードです。
ノートパソコンの「GeForce RTX 3060」だと、GPU性能は低くなり、VRAM容量も6GBと少なくなってしまうので注意。
Stable Diffusion用に使えるグラボの一例(下に行くほど、GPU性能が高い)は以下のようになります。
GeForce RTX 3060 6GB
GeForce RTX 4060 8GB
GeForce RTX 3070 8GB
GeForce RTX 3080 16GB
GeForce RTX 4070 8GB
GeForce RTX 4070 8GB
GeForce RTX 4080 12GB
GeForce RTX 4090 16GB
ノートパソコン用グラボでは、「GeForce RTX 3080」のコストパフォーマンスが高いですね。VRAM容量が16GBあり、Stable Diffusionの日常使いにも快適です。
ただ、ノートパソコン用グラボは、GPU性能もデスクトップ用グラボに比べると低いので、VRAM容量の大きさを生かした大画像の生成には、かなりの時間を要してしまいます。
デスクトップ用グラボに比べると、VRAM容量の恩恵はそれほど受けられないと考えたほうがいいです。
VRAM容量が8GB以上あれば、512×512サイズの画像生成には余裕で耐えるので、個人的にはVRAM容量を重視するよりは、「GeForce RTX 4000番台」の最新シリーズから選ぶほうをおすすめ(ノートパソコンの場合のみ)。
ノートパソコン用のグラフィックボードを単品で入手・カスタマイズするのは現実的ではないので、ノートパソコンでAIイラスト生成をするには、該当グラボの搭載している高性能パソコンから選ぶことになります。
本サイトには、Stable Diffusionにおすすめのパソコンを、デスクトップ・ノートの両機種で紹介している記事もあるので、よければご覧ください。
【Stable Diffusion】AIイラストにおすすめのグラボ3選
GeForce RTX 3060
GeForce RTX 3060
「GeForce RTX 3060」は、VRAM容量が12GBあるグラフィックボードの中で、最も値段が安いです。
基本的なAIイラスト生成だけでなく、AI学習によってポーズの指定などもこなします。
ゲーミングPC用のグラボとしても、コスパの高さから人気が高い。
最新世代の「GeForce RTX 4060」が8GBである理由はわかりませんが、60番台のグラボではStable Diffusionと最も相性のいいオススメのグラフィックボードです。
GeForce RTX 4080
GeForce RTX 4080
「GeForce RTX 3060」の約4倍の値段のするグラボで、イラスト生成の時間は約4分の1。
高性能なほど性能は目減りし、値段も跳ね上がる傾向にあるグラフィックボードですが、Stable Diffusionにおいては、コスパがいいままです。
基本的な使い方での生成時間は4分の1ですが、生成枚数やサイズを上げるとさらに効率が上がります。
Stable DiffusionでのAIイラスト生成時間は爆速かつ最速。
予算が潤沢にある方は、「GeForce RTX4090」が最良の選択肢であることに間違いありません。
Stable Diffusion グラボ【まとめ】
Stable Diffusionに最適なグラフィックボードについての記事をお届けしました。
VRAM容量がこれほど重要な分野は、Stable Diffusionくらいです。
私自身、複数のグラボで検証してみて、かなり驚きました。
Stable DiffusionによるAIイラストは非常にレベルが高く、多くのイラストレーターが廃業の危機に追い込まれているほどです。
しかし、まだまだAIイラストのレベルは発展途上で、今後数年でさらに上がっていくでしょう。
商用利用も可能なStable Diffusionは、小説などの表紙に使われたり、漫画の画像そのものに置き換えられる時代が来てもおかしくありません。
その波に乗り遅れないように、今のうちからStable Diffusionに触って慣れておくだけでも、今後の人生の何かに役立つかもしれません。
私も「ChatGPT」や「Stable Diffusion」など、AI技術に触れているだけで知恵熱が出そうですが、何とか振り落とされないようにもがいています(笑)。
本記事が、グラフィックボード選びの一助になれたのなら、幸いです。
Stable Diffusionにおすすめのパソコンについての記事もあります。もしよければご覧ください。
一例として、以下のパソコンはコストパフォーマンスに優れたデスクトップPCになります。
デスクトップPC1
価格 | 115,800円 |
---|---|
OS | Windows |
スペック | CPU:Ryzen 5 4500 メモリ:16GB グラボ:GeForce RTX 3060 VRAM:12GB SSD:500GB(NVMe) |
重量 | 記載なし |
公式サイト | LEVEL-M1P5-R45-RBX-WHITE |
グラフィックボードがGeForce RTX 3060搭載の人気パソコン。
LEVELはパソコン工房のゲーミングPCブランドです。
Stable Diffusionを日常的に行うなら、このくらいのスペックは欲しい。
RTX 3060は最新世代ではないですが、Stable Diffusionを行う上では非常にコスパがよく、相性もいいです。
最新世代のGeForce RTX 4060はVRAMが8GBで、VRAMが12GBあるRTX 3060よりもStable Diffusionを行う上では不向きです。
VRAMが12GB以上あるグラボとしては、RTX 3060が最も安い。
ゲーミングPCとしても使え、何かと融通のきくバランスに優れたパソコンです。