- AI BEST SEARCH
- AI関連用語集・キーワード一覧【AI BEST SEARCH】
- 拡散モデル(Diffusion Model)
拡散モデル(Diffusion Model)
拡散モデル(Diffusion Model)とは、ランダムなノイズから徐々に意味のあるデータ(画像・音声・動画など)を生成する、生成AIの一種です。 もともとは物理学や統計力学における「拡散過程」の考え方をベースにしており、近年では特に画像生成AIの分野で革新的な成果を上げています。 拡散モデルの基本的な仕組みは以下の2段階で構成されます: 1. ノイズ付加(フォワードプロセス):実在の画像やデータに徐々にノイズを加えて、最終的に完全なランダムノイズへと変換する 2. ノイズ除去(リバースプロセス):そのノイズから少しずつ情報を復元し、元のようなデータを生成するよう学習する このようなプロセスを繰り返すことで、高品質で自然なデータを一から生成することが可能になります。 モデルには「U-Net」や「スケジューラー」「自己注意機構」などの技術が用いられており、微細な調整によって生成品質をコントロールできます。 拡散モデルを活用した代表的なAIは以下の通りです: • Stable Diffusion(Stability AI) • DALL·E 2(OpenAI) • Midjourney • Imagen(Google Research) • MusicLM・VideoDiffusion など音声・動画分野への応用も進行中 主な応用領域: • テキストから画像を生成する Text-to-Image タスク • 顔画像の修復や画像の拡張(Inpainting・Outpainting) • 写真のスタイル変換・合成 • 音楽や映像の自動生成 拡散モデルは、従来のGAN(敵対的生成ネットワーク)に比べてトレーニングが安定しやすく、高精度な出力が得られる点で注目されており、今後の生成AIの主流技術として急速に存在感を高めています。