ジェミナイ:グーグルが開発した次世代マルチモーダルAI

Photo of author

By Global Team

ジェミナイ(Gemini)は、グーグルが開発した次世代人工知能モデルである。既存の言語中心のAIの限界を超え、テキストと画像、コードなど様々なデータを同時に理解し処理するマルチモーダル(Multimodal)モデルとして設計された。オープンAIのGPTシリーズと直接競争し、人工知能産業の主導権を巡るグーグルの戦略的反撃でもある。

ジェミナイは2023年12月、グーグルのディープマインド(DeepMind)が初めて公開した。ディープマインドは囲碁AIであるアルファ碁(AlphaGo)を開発した研究組織で、グーグル内のAIの核心的研究を担当する。ジェミナイは『双子座』を意味する名称のように、人間の言語と思考をともに学習する二重構造を持つ。言語を理解しながら同時に視覚・数理・コーディングデータを結びつけて思考する構造だ。

既存の言語モデルはテキストベースのデータに依存していた。対してジェミナイはテキスト、画像、オーディオ、コードなど複数形式のデータを共に学習する。例えば、ユーザーが「このグラフで異常値を見つけ、その原因を説明せよ」と要求すれば、ジェミナイはグラフ画像を分析し、数学的推論を経て結果を文章で提示できる。言語理解と視覚認識、論理的判断が統合された構造だ。

ディープマインドはジェミナイの開発でアルファ碁の強化学習(Reinforcement Learning)技術を積極的に活用した。アルファ碁は人間の囲碁棋譜を学習したのち、自ら対局して性能を高めた。ジェミナイもまた人間のフィードバックを学習する強化学習ベースのモデルで、学習効率と判断精度を同時に引き上げた。グーグルはこれを通じて『自ら学習し改善するAI』への進化を目指している。

ジェミナイはバージョンごとに性能が区別される。2024年基準でジェミナイ1.0シリーズは3つのバージョンが公開された。最も強力なモデルであるGemini Ultra、汎用モデルのGemini Pro、モバイル機器に最適化されたGemini Nanoである。これらのうちGemini Proはグーグルのチャットボット『バード(Bard)』に適用され、2024年初めにはバードはジェミナイのアップデートとともに『Gemini』ブランドに統合された。

グーグルはジェミナイを通じて自社サービス全般にAI機能を内蔵している。Gmail、ドキュメントツール(Google Docs)、シート(Sheets)、YouTubeなど主要プラットフォームにジェミナイを結合し、ユーザーが自然言語で命令すれば文書作成、動画要約、データ分析などを自動で遂行する。AIがサービスの道具から主体へと進化するグーグルの戦略的実験だ。

ジェミナイのもう一つの特徴はコード理解能力である。テキスト解釈のみならずプログラミング言語を分析し作成する機能が強化された。コード生成、デバッグ、最適化まで行い、グーグルのクラウドプラットフォーム(Google Cloud)と結びつけ、開発者の生産性を高める。グーグルはこれを通じて「AIが単なる対話型アシスタントを超え、業務全般を支援する協力者になる」と説明している。

ジェミナイは性能評価でも上位を占めた。グーグルによればジェミナイは標準ベンチマーク試験であるMMLU(Massive Multitask Language Understanding)でGPT-4を上回るスコアを記録した。MMLUは歴史、数学、物理学、倫理など多様な学問分野を含む言語理解評価指標である。この結果はグーグルがオープンAIを実質的に追い越したことを示している。

ただし、議論もある。ジェミナイの性能の一部は内部テスト結果に基づいて公開され、外部の検証が不足しているという指摘がある。AIモデルの透明性と安全性確保が不可欠であるため、実際の使用環境での正確性と倫理的検証が今後の課題となる。特にAIモデルが生成する虚偽情報(ハルシネーション)と偏向性の問題は依然として解決されていない。

グーグルはジェミナイを中心に自社AI生態系を再構築している。2025年現在、アンドロイドOSやグーグルクラウド、検索エンジン(Google Search)にもジェミナイ基盤の機能が搭載されている。これはグーグルが「すべての製品にAIを組み込む」という戦略を本格化したことを意味する。

AI産業は今や言語モデルの競争からマルチモーダル競争へと転換している。ジェミナイは人間の言語を理解するAIから、世界を『見る』AIへの拡張を象徴する。テキスト、画像、コードの境界が消える時代に、ジェミナイはグーグルが掲げる人工知能の新たな基準である。

ジェミナイ
ジェミナイ

 

Leave a Comment