画像生成AI 単語


ニコニコ動画で画像生成AIの動画を見に行く

ガゾウセイセイエーアイ

3.0千文字の記事

画像生成AIとは、テキストなどの入力から画像を自動生成する人工知能技術である。

概要

画像生成AIは、機械学習の一種である深層学習を用いて、テキストプロンプト(文章による示)や既存の画像から新たな画像を生成する技術である。2022年以降、一般ユーザーが利用可サービスが急速に普及し、イラスト制作デザイン創作活動など幅広い分野で使用されるようになった。

従来のコンピュータグラフィックスとは異なり、AI学習したデータをもとに画像を「生成」する点が特徴である。ユーザーは詳細な描画スキルがなくても、適切な示(プロンプト)を与えることで、高品質な画像を得ることができる。

歴史と発展

初期の研究(2014年〜2020年)

画像生成AIの基礎技術として、2014年GAN(Generative Adversarial Network:敵対的生成ネットワーク)が発表された。この技術により、AIによる画像生成の可性が大きく広がった。

実用化の始まり(2021年〜2022年)

2021年OpenAIが「DALL-E」を発表し、テキストから画像を生成する技術が注を集めた。2022年には複数の画像生成AIサービスが一般開され、急速に普及が進んだ。

大衆化と議論(2023年以降)

高性な画像生成AIがでも使えるようになったことで、創作活動における新たな可性が開かれた一方、著作権倫理に関する議論も活発化した。

主要な画像生成AI

Stable Diffusion

2022年8月Stability AI開したオープンソースの画像生成AI。無料で利用でき、ローカル環境での実行も可なため、最も普及している画像生成AIの一つである。高いカスタマイズ性が特徴。

Midjourney

Discordを通じて利用する画像生成AI。芸術的で独特な画の画像生成に定評がある。有料サービスとして提供されている。

DALL-E

OpenAI開発した画像生成AI。2021年に初代、2022年DALL-E 2、2023年DALL-E 3が開された。高い精度と安全性への配慮が特徴。

NovelAI Diffusion

小説AI執筆サービスNovelAI」が提供する画像生成機アニメイラスト調の画像生成に特化している。

主要な技術と用語

プロンプト(Prompt)
画像生成AIに対して与える文章による示。どのような画像を生成したいかを記述する。プロンプトの工夫により、生成される画像の品質や内容が大きく変化する。
LoRA(Low-Rank Adaptation)
AIモデルに追加学習を行うための技術。特定キャラクター、画オブジェクトなどを学習させることで、元のモデルでは生成できなかった画像を生成可にする。較的少ないデータと計算資学習できる点が特徴。
Inpaintingインインティング)
既存の画像の一部を定して、その部分だけをAI再生成させる技術。画像の修正や部分的な変更に使用される。
Outpainting
既存の画像の外側を拡して、画像の範囲を広げる技術。画像の続きをAIが想像して描き足す。
img2imgImage to Image
既存の画像を入力として、それをもとに新しい画像を生成する手法。元画像の構図や雰囲気を保ちながら、別の画や内容に変換できる。
ControlNet
生成される画像のポーズ、構図、線画などを細かく制御するための拡技術。より意図した画像を生成しやすくなる。
ネガティブプロンプト
生成したくない要素を定するプロンプト。「低品質」「手の崩れ」など、避けたい要素を記述することで、生成画像の品質を向上させる。
seed
画像生成時の乱数の初期値。同じseed値と同じプロンプトを使用すれば、同じ画像を再現できる。

社会的議論

画像生成AIの急速な普及に伴い、創作活動における倫理法律に関する議論が活発化している。

著作権に関する議論

AI学習に使用するデータや、AIが生成した画像の著作権について、様々な意見が存在する。日本文化庁は、AIによる学習著作権法第30条の4(著作物に表現された思想又は感情の享受を的としない利用)により、原則として著作権にあたらないとの見解を示している。ただし、生成された画像が既存の著作物と類似している場合や、特定の著作物を意図的に再現しようとした場合には、著作権となる可性がある。一方、経済産業省においては、関係のない第三者が著作権者に許諾を得ず、既存の著作物を意図して模倣し全なコピーを生成して自身の商業物として販売したりする行為は例外なく違法としている。当然著作権法不正競争防止法違反にもなるため、刑罰が厳しくなり、損賠償金も個人で到底支払えない桁の金額となる。事情が悪ければ社会的身分を失い人生終了になってしまう事もあるため、商業物としての扱いには十分な注意が必要である。

反AI運動

画像生成AIの普及に対して、一部のクリエイター支援者から批判的な意見が表明されている。な懸念として、創作活動への著作権の問題、AIによる雇用の喪失などが挙げられる。

一方で、こうした批判に対しては、既存の法的組みで対応可な問題が多いとの摘もある。例えば、断で特定作家の作を模倣して商業利用する行為は、AI利用の有にかかわらず著作権法不正競争防止法規制される可性がある。また、キャラクター断使用なども、従来の二次創作と同様の法的問題として扱われる。

このような状況から、AI技術そのものの是非ではなく、技術の適切な使用方法や、クリエイターの権利保護のあり方について、建設的な議論められている。

技術に関する誤解

画像生成AIに対する批判の中には、技術的な誤解に基づくものも見られる。

データセットと画像の保存

AIデータセットには学習した画像がそのまま保存されている」というがあるが、これは画像生成AIの仕組みに対する誤解である。実際には、AIは画像そのものではなく、大量の画像から抽出したパターンデータの特徴学習している。

仮に画像をそのままデータとして保存した場合、その容量は膨大なものとなる。例えば、Stable Diffusion学習に使用されたとされるLAION-5Bデータセットには約50億枚の画像が含まれるが、1枚あたり均5MBと仮定しても、総容量は約25ペタバイト(25,000テラバイト)に達する計算になる。これは現在存在するどのような圧縮技術を用いても、個人のパソコンで扱える規模ではない。

実際のStable Diffusionモデルファイルは数ギガバイト程度であり、これは画像を直接保存しているのではなく、学習によって得られた重み付けパラメータ数学的なデータ)のみを保存しているためである。このパラメータから、AIは新たな画像を「生成」する。

この仕組みは、人間が絵を学ぶプロセスに似ている。画は多くの絵画を見て学ぶが、見た絵を頭の中に写真のように保存しているわけではなく、描画の技法やスタイルの特徴を理解している。AIも同様に、画像の特徴やパターン学習しているのであり、元画像を取り出すことは基本的にできない。

関連項目

この記事を編集する
関連記事

親記事

子記事

兄弟記事

掲示板

おすすめトレンド

ニコニ広告で宣伝された記事

記事と一緒に動画もおすすめ!
もっと見る

急上昇ワード改

最終更新:2025/12/10(水) 17:00

ほめられた記事

最終更新:2025/12/10(水) 16:00

ウォッチリストに追加しました!

すでにウォッチリストに
入っています。

OK

追加に失敗しました。

OK

追加にはログインが必要です。

           

ほめた!

すでにほめています。

すでにほめています。

ほめるを取消しました。

OK

ほめるに失敗しました。

OK

ほめるの取消しに失敗しました。

OK

ほめるにはログインが必要です。

タグ編集にはログインが必要です。

タグ編集には利用規約の同意が必要です。

TOP