Stable Diffusionは、テキストや画像のプロンプトからユニークな写実的な画像を生成する生成型人工知能(Generative AI)モデルです[2]。このモデルは、深層生成型人工ニューラルネットワークの一種である潜在拡散モデルに基づいています[1]。2022年に公開され、画像だけでなく、ビデオやアニメーションの生成にも使用できます[2]。
Stable Diffusionは、テキストから画像を生成する機能を持ち、詳細な画像をテキストの説明に基づいて生成することが主な機能です[3]。このモデルは、潜在表現空間でノイズを繰り返し減少させることによって動作し、異なるニューラルネットワークを組み合わせたモデルです[3]。
Stable Diffusionは、ユーザーフレンドリーであり、画像を生成するために追加情報を必要としません。活発なコミュニティが存在し、十分なドキュメントとチュートリアルが提供されています。ソフトウェアのリリースはCreative ML OpenRAIL-Mライセンスの下で行われ、ソフトウェアを使用、変更、改変されたソフトウェアを再配布することが許可されています[2]。
このモデルは、消費者グレードのグラフィックスカード上で動作可能であり、誰でもモデルをダウンロードして自分の画像を生成することができます。重要なハイパーパラメーター、例えばデノイジングステップの数や程度を制御することができます[2]。
情報源
[1] Stable Diffusion - Wikipedia https://en.wikipedia.org/wiki/Stable_Diffusion
[2] What is Stable Diffusion? - Stable Diffusion AI Explained - AWS https://aws.amazon.com/what-is/stable-diffusion/
[3] What is Stable Diffusion? | Deci https://deci.ai/deep-learning-glossary/stable-diffusion/
[4] What Is Stable Diffusion and How Does It Work? https://www.vegaitglobal.com/media-center/knowledge-base/what-is-stable-diffusion-and-how-does-it-work
[5] The Illustrated Stable Diffusion http://jalammar.github.io/illustrated-stable-diffusion/
[6] Stable Diffusion - What, Why, How? https://www.youtube.com/watch?v=ltLNYA3lWAQ
[7] What is Stable Diffusion and How to Use it | Fotor https://www.fotor.com/blog/what-is-stable-diffusion/
[8] What is Stable Diffusion | Definition, origin and uses https://www.arimetrics.com/en/digital-glossary/stable-diffusion
Perplexityにより https://www.perplexity.ai/search/cf252f01-5cfc-4455-924b-e28830ac50a7 にて
[[Stable Diffusion 参照リンク集]]
[[画像生成AIの比較]]