Geminiとは以下のものを指す。
- Googleが開発したマルチモーダルな大規模言語モデルである。
- ふたご座(星座)。黄道十二星座の一つである。
- ジェミニ計画(宇宙開発)。NASAがアポロ計画の前に行った、2人乗り宇宙船の有人宇宙飛行計画である。
- 双子・双生児。ラテン語に由来する言葉で、双子や双生児を意味する。
本記事では1.を解説する。
Gemini(ジェミニ)とは、Googleが開発した、テキスト・画像・音声・動画など複数の種類のデータを同時に処理できる、マルチモーダルな大規模言語モデルである。Google検索やGoogle広告、YouTubeといったGoogleの様々なサービスに統合されるほか、個人向けにチャット形式で対話できるサービス「Google Gemini」(旧:Bard)としても提供されている。
概要
2023年12月6日(米国時間)、Googleは最新のAIモデル「Gemini」を発表した。Geminiは、GoogleのAI研究部門であるGoogle DeepMindによって開発され、「Ultra」「Pro」「Nano」の3つのモデルで構成されている。
- Gemini Ultra:最も高性能なモデルで、非常に複雑なタスクに対応する。
- Gemini Pro:幅広いタスクにバランス良く対応するモデルで、Googleの主力AIサービスに組み込まれている。
- Gemini Nano:スマートフォンなどのデバイス上で直接動作することを目的とした、最も効率的なモデルである。
Geminiの最大の特徴は、マルチモーダルであることである。これまでの多くのAIモデルがテキストのみを扱っていたのに対し、Geminiはテキストだけでなく、画像、音声、動画、コードなど、複数の情報を同時に理解・処理することができる。この能力により、例えば「このグラフから何が読み取れるか」といった画像に関する質問や、「この動画で何が起きているか」といった動画の内容に関する質問にも答えることが可能である。
また、Geminiは、プログラミング言語の生成やデバッグにも優れており、Python、Java、C++など多岐にわたる言語に対応している。Googleは、Geminiが科学、数学、医療、法律など、幅広い分野での革新を促進すると期待している。
2024年には、個人向けサービス「Bard」が「Google Gemini」に名称変更され、Geminiモデルが完全に統合された。これにより、誰でもGeminiの高性能な対話能力を体験できるようになった。
個人向けサービスとしてのGoogle Gemini
かつて「Bard」という名称で提供されていたこのサービスは、Geminiモデルの統合に伴い、2024年2月8日(米国時間)に「Google Gemini」へと名称が変更された。
Google Geminiは、チャット形式でテキストや画像、音声などを用いて、ユーザーと対話する形で様々なタスクを支援する。ユーザーは、質問への回答、文章の要約や作成、アイデアのブレインストーミング、画像の分析など、多岐にわたる用途でこのサービスを利用できる。
このサービスは、Geminiモデルを基盤としており、GoogleアシスタントやGoogle検索などの他のサービスとの統合が進められている。
競合サービスとの比較
| サービス名 | 主な特徴 | ユーザーへのメリット |
|---|---|---|
| Google Gemini | Googleの膨大な知識と情報源、リアルタイム検索との連携が強みである。マルチモーダル能力が高く、画像や音声を使った対話が得意である。 | 最新の情報を基にした回答や、画像・音声を使った柔軟なコミュニケーションが可能である。 |
| ChatGPT | 対話能力の高さと、豊富なプラグインによる拡張性が強みである。幅広い分野での文章生成やコード作成に優れている。 | 多様な用途に対応でき、外部サービスとの連携で活用の幅が広い。 |
| Claude | 長い文章の要約や、倫理的・安全性の高い応答に特化している。大規模なテキストを一度に処理する能力が高い。 | 長文の資料を要約したり、安全性を重視した回答を得たい場合に適している。 |
関連リンク
関連項目
親記事
子記事
- なし
兄弟記事
- 1
- 0pt


