DALL-E 単語


ニコニコ動画でDALL-Eの動画を見に行く

ダリ

3.1千文字の記事
これはリビジョン 3409477 の記事です。
内容が古い・もしくは誤っている可能性があります。
最新版をみる

DALL-E(ダリ)とは、OpenAIによって開発された、テキストから画像を生成する画像生成AIである。

概要

DALL-Eは、自然言語で書かれた説明文(プロンプト)を入力すると、その内容に基づいてオリジナルの画像を生成することができる深層学習モデルである。2021年1月OpenAIブログで初めて発表され、AI画像生成分野において大きな注を集めた。

名前の由来は、スペインの画サルバドール・ダリ(Salvador Dalí)と、ピクサーアニメーション映画ウォーリー」の主人公WALL-Eを組み合わせたものである。

DALL-Eは、大規模な言語モデルGPT-3を画像生成用に変更したバージョンベースとしている。膨大な画像とテキストのペアを学習することで、言語の意味を理解し、それに対応する視覚的なイメージを生成することが可となっている。

バージョンの変遷

DALL-E(初代)

2021年1月に発表された初代DALL-Eは、GPT-3の120億パラメータモデル画像生成用に変更したものである。テキストから画像を生成する基本的な機を備えており、複数の物体やその属性間的な関係を理解して画像を生成できることが示された。

初代DALL-Eは、物体の属性の変更、視点の制御、スタイルの変換など、様々な力を持っていたが、生成される画像の解像度や品質には限界があった。また、ソースコードは一般には開されず、限定的な研究レビューのみが提供された。

DALL-E 2

2022年4月に発表されたDALL-E 2は、初代から大幅に性が向上したバージョンである。より高い解像度(1024×1024ピクセル)で、よりリアルで詳細な画像を生成することが可となった。

DALL-E 2では、以下のような新機が追加された。

2022年7月20日にはベータ版として一般開が開始され、100万人の待機リストに招待が送られた。同年9月28日には待機リストが撤され、でも利用可となった。ユーザーは毎定数の画像を無料で生成でき、追加の生成には有料クレジットを購入する形式となっている。

DALL-E 3

2023年9月に発表されたDALL-E 3は、最新バージョンであり、前バージョンから約1年7ヶぶりの大アップデートとなった。

DALL-E 3の最大の特徴は、ChatGPTとの統合である。ChatGPTを通じて自然な会話形式で画像生成示を出すことができ、プロンプトの作成をChatGPTサポートしてくれる。また、生成された画像が意図と異なる場合も、簡単な言葉を追加するだけで微調整が可となっている。

DALL-E 3は、ChatGPT PlusChatGPT EnterpriseMicrosoft Copilot(旧Bing Chat)、Bing Image Creatorなどで利用することができる。

主な機能と特徴

テキストから画像生成

DALL-Eの基本機は、テキストの説明から画像を生成することである。「夕日に照らされた富士山を見つめる柴犬」「サイバーパンク東京タワー」のような具体的な説明を入力すると、それに対応した画像が生成される。

複数の概念属性スタイルを組み合わせることができ、現実には存在しない架シーンオブジェクトも生成可である。ただし、物体が増えると属性の関連付けを混同する傾向があり、複雑なプロンプトでは成功率が低下することがある。

画像編集機能

DALL-E 2以降では、既存の画像を編集する機が追加されている。インインティング機では画像の一部を選択して別の内容に置き換えることができ、アウトインティング機では画像の外側に新たな要素を追加して画像を拡することができる。これらの機は、元の画像のコンテクストや視覚要素(、反射、テクスチャなど)を考慮して自然な仕上がりとなるよう設計されている。

バリエーション生成

既存の画像をアップロードすると、その画像に基づいた複数のバリエーションを生成することができる。元の画像の雰囲気やスタイルを保ちながら、異なる構図や細部の表現を持った画像を作成できる。

利用方法

ChatGPT経由での利用

DALL-E 3は、ChatGPT Plus(有料プラン)に加入することで利用できる。ChatGPTの会話画面で画像生成示を出すと、DALL-E 3が自動的に呼び出され、画像が生成される。ChatGPTプロンプトの改善をサポートしてくれるため、複雑なプロンプトを考える必要がない点が特徴である。

Microsoft製品での利用

DALL-E 3は、Microsoft CopilotやBing Image Creatorでも無料で利用できる。これらのサービスでは、Microsoftアカウントがあればでも画像生成を試すことができる。

API経由での利用

OpenAIAPIを通じて、DALL-E 2およびDALL-E 3をプログラムから利用することも可である。開発者は、自社のアプリケーションサービスにDALL-Eの画像生成を組み込むことができる。

商用利用について

OpenAI公式サイトによると、DALL-Eで生成した画像の権利はユーザーに帰属し、商用利用も含めて自由に利用できるとされている。ただし、OpenAIコンテンツポリシーに違反する内容(暴力的、差別的な表現など)や、他者の知的財産権を侵する場合、法律に違反する場合は除く。

一方、Microsoft CopilotやBing Image Creatorで生成した画像については、商用利用の可否がOpenAIほど明確ではないため、利用にあたっては最新の利用規約を確認することが推奨される。

安全性への取り組み

OpenAIは、DALL-Eの開発において安全性を重視している。学習データから暴力的、性的、差別的なコンテンツを除去し、有な画像が生成されにくいよう対策を施している。また、実在の人物の顔が写実的に生成されることを防ぐ技術も導入されている。

DALL-E 2では、データセット依存することによるバイアス(例えば、性別や人種に関する偏り)の問題も摘されており、OpenAIプロンプトに性別や人種を示す語句を自動的に挿入するなどの対策を行っている。

影響と評価

DALL-Eの登場は、AI画像生成分野に大きなを与えた。テキストから高品質な画像を生成できる技術が一般に広く知られるきっかけとなり、Midjourney、Stable Diffusionなど、他の画像生成AIサービス開発・普及も加速した。

クリエティブ分野では、デザインイラストレーション制作過程において、アイデアの視覚化やラフスケッチの作成に活用されるようになった。一方で、AIによる画像生成著作権芸術家仕事に与えるについての議論も活発化している。

関連動画

関連リンク

関連項目

関連記事

親記事

子記事

  • なし

兄弟記事

おすすめトレンド

ニコニ広告で宣伝された記事

記事と一緒に動画もおすすめ!
ニコニ広告[単語]

提供: ☆ドラえもの☆

もっと見る

急上昇ワード改

最終更新:2025/12/31(水) 05:00

ほめられた記事

最終更新:2025/12/31(水) 04:00

ウォッチリストに追加しました!

すでにウォッチリストに
入っています。

OK

追加に失敗しました。

OK

追加にはログインが必要です。

           

ほめた!

すでにほめています。

すでにほめています。

ほめるを取消しました。

OK

ほめるに失敗しました。

OK

ほめるの取消しに失敗しました。

OK

ほめるにはログインが必要です。

タグ編集にはログインが必要です。

タグ編集には利用規約の同意が必要です。

TOP