マシンパワーは必要だが、画像を生成し放題な「Stable Diffusion」

「Stable Diffusion」はStability AI社が開発した画像生成AIで、なんとオープンソースとして公開されている。つまり、自分のPCにインストールして、無料で好きなだけ画像を生成できるのだ。ただし、快適に動作させるには、NVIDIAの高性能グラフィックボードが必要になる。筆者が利用しているのは、GeForce RTX 4070 Tiで約13万円だった。

 自分でインストールしなければならないので、少々手間はかかるのだが、ネットに解説情報がたくさんあるので、エンジニアでなくてもセットアップは可能。筆者も見よう見まねでインストールし、毎日、画像を生成しまくっている。

 どんな画像でも生成できるが、例えばビジネスユースなら、企業ロゴやアイコンなども簡単に作れる。1枚1秒くらいで生成できるので、100枚でも1000枚でも生成して、気に入った画像が出るまでチャレンジするのもいい。

 ちなみに、Stable Diffusionのプロンプトは、「ChatGPT」で生成するような文章ではなく、ピンポイントに必要なキーワードを並べていく方が成功率が高まる。

 Stable Diffusionの出力画像サイズは、「Width(幅)」と「Height(高さ)」欄にドット数を入力する。あまり大きい数字にすると生成画像が破綻するので、長辺でも512~768ドット程度にしておくといい。解像度を高めたいなら、「Hires.fix」機能を利用すると、4倍程度まで高画質化できる。

オオカミのロゴを生成してみるオオカミのロゴを生成してみる 拡大画像表示
1秒に1つくらいの勢いで、大量の画像を生成できる1秒に1つくらいの勢いで、大量の画像を生成できる 拡大画像表示

Stable Diffusionで「古代ローマ人」風の画像を生成してみる

 人物の画像も生成できる。例えば、「賽は投げられた」のカエサルのようなイメージカットが必要な場合、本人の肖像権はないにせよ、著作権のあるどこかの写真を勝手に利用するわけにもいかない。

 そんな時も、Stable Diffusionが活躍する。「Gaius Iulius Caesar,Julius , ancient Rome」くらいのプロンプトでは、いろいろなポーズや構図の画像が生成されてしまう。そのため、まずは短時間で生成するために低い解像度で、いろいろとチャレンジしてみる。

 石像や彫像という単語を入れたり、画質が低いようなら「masterpiece, best quality, 8k resolution , realistic」などのプロンプトを追加したりする。単語を( )で囲んでいるのは、そのプロンプトの強度を上げるという意味。無視されたくないキーワードに付けておくといいだろう。想像している画像が出るようになったら、解像度を上げ、時間をかけて画像をたくさん生成し、その中から目当てを選べばいい。

プロンプトを入力したら、「Batch count」に出力する枚数を入力し、「Generate」をクリックプロンプトを入力したら、「Batch count」に出力する枚数を入力し、「Generate」をクリック 拡大画像表示
手軽にカエサルをイメージした彫刻の画像を生成できる手軽にカエサルをイメージした彫刻の画像を生成できる 拡大画像表示