Stable Diffusionで軽く遊ぶ

この記事は約2分で読めます。
Sponsored links
この記事はアフィリエイト広告を利用しています。

オープンソースかつ無償で利用できる、テキストから画像を生成できる「Stable Diffusion」が先月下旬に公開された。

高性能画像生成AI「Stable Diffusion」無料リリース。「kawaii」までも理解し創造する画像生成AI - AUTOMATON
イギリスのスタートアップ企業Stability AIは8月22日(現地時間)、高性能画像生成AI「Stable Diffusion」をオープンソース化。一般向けに公開した。昨今話題の「Midjourney」よりも高性能な画像生成AIであると...

プロンプト(通称「呪文」、現状ほぼ英語と顔文字のみ解釈する)を入力しパソコンを回せば、100枚ほど作ったうち2~3枚はイイ感じの絵が作れる。

AIやStable Diffusionの仕組みは僕にはさっぱり理解できないが、ネット上の集合知が集まって、どんな呪文を使えば理想の絵柄に近づくか、追及が続いている。

GitHubに公開されているソフトも更新が激しい。バグ取りや、できることが増えたりが続々と進められている。

とりあえず、僕がやっているのは「AUTOMATIC1111」氏の作ったWebUI版。

GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI
Stable Diffusion web UI. Contribute to AUTOMATIC1111/stable-diffusion-webui development by creating an account on GitHub...
画像生成AI「Stable Diffusion」を4GBのGPUでも動作OK&自分の絵柄を学習させるなどいろいろな機能を簡単にGoogle ColaboやWindowsで動かせる決定版「Stable Diffusion web UI(AUTOMATIC1111版)」インストール方法まとめ
(2022/09/22 17:52更新)画像生成AI「Stable Diffusion」を簡単に利用するための実行環境の1つである「Stable Diffusion web UI」のコントリビューター(開発貢献者)の1人であるAUTOMAT...

僕のパソコンのGPUはNVIDIA GeForce RTX3060なので、面倒なGoogle Colabではなくローカル環境を構築して実行している。
seed値によっても違うが、1枚の絵を作るのにだいたい10秒かかる。

なお、デフォルトの512×512pixelが一番安全で、無理すれば512×768も作れるものの、768×768は3060のメモリ12GBでは足りずにエラーが出る。
まあ、「Extras」タブに持っていって拡大すれば最大で4倍の画像にはなるのだが。

ともあれ、作例をいくつか。

ミュシャ風のネコ耳ネコしっぽ少女、振り返りポーズ
スター・ウォーズ風のオスプレイ
森山大道風の街並みモノクロスナップ
トーストと目玉焼きとブロッコリーの朝ごはん
モネ風のセーラー服少女
セザンヌ風の猫
レオナルド・ダ・ヴィンチ風の細密な透明の水槽っぽい文鎮
ブレードランナー風の東京を走るトヨタ車

Follow me!

Mastodon PAGE TOP
タイトルとURLをコピーしました