「思考型AI」グーグル、ジェミナイ2.5 Proを公開 - GPT-4.5を上回る性能実証

現在、実験的な形で公開されたGemini 2.5 Proは、テキストはもちろんイメージ、オーディオ、ビデオなど様々なタイプの入力データを同時に処理し、それを論理的に統合して高次元的な応答を生成できる構造を備えています。Googleは、このモデルを「思考(thinking)」能力を持った次世代AIと定義し、既存モデルの単純応答方式から脱却した進化した学習構造を強調しました。

Googleが自社の最新人工知能モデル『Gemini 2.5 Pro』を公開し、生成型AI技術競争で新たな転機を迎えました。（写真提供＝Google）

特に、Gemini 2.5 Proはユーザーの要求に対し複雑な文脈を理解し、論理的推論を経て応答を生成する「多段階推論(multi-step reasoning)」能力を強化しました。これにより、数学、科学、プログラムコードの生成など高難度な作業において正確性と効率性を同時に確保したことが特徴です。

該当モデルは、コード生成および変換能力でも進歩を示しました。たった一行のプロンプトで実行可能な複雑なコード作成が可能であり、これは開発者中心のアプリケーション制作にも実質的な活用度を高める要素として評価されています。Googleはこれに対し、後続学習強化技術を適用してAIのリアルタイム問題解決能力を改善しました。

ベンチマーク指標でもGemini 2.5 Proは業界最高水準の成果を見せました。人間の応答嗜好を評価するLMArenaリーダーボードでは競合モデルであるClaude 3.7、o3-miniを抑えて大差で1位を獲得しました。複雑な推論が必要な「Humanity’s Last Exam」では道具なしで18.8%を記録し他のモデルを上回り、「GPQA Diamond」では84.0%の正解率を、「AIME 2025」では86.7%の正解率を示し精密推論能力を証明しました。

Gemini 2.5 Proが三つの主要ベンチマークで競合モデルを上回る性能を示しています。Humanity’s Last Exam（推論）、GPQA Diamond（科学）、AIME 2025（数学）でそれぞれ18.8%、84.0%、86.7%の正解率を記録し、現存最高水準のAIモデルとして評価されています。（資料提供＝Google）

長文ドキュメント解析力を評価するMRCRベンチマークでは128Kトークン基準91.5%の精度を達成し、GPT-4.5と比較してほぼ二倍の性能を記録しました。マルチモーダル理解力測定であるMMMUでは81.7%の正解率を示し、様々な形式の情報を同時に分析する能力でも競争力を確保しました。

MRCR（Multi Round Coreference Resolution）評価結果更新 25.03.26.（資料提供＝Google）

技術仕様の面でもGemini 2.5 Proは業界基準を大きく引き上げました。最大100万トークンのコンテキストウィンドウをサポートし、これは既存モデルに比べて数十倍以上の情報処理範囲を提供します。Googleはこの範囲を近い将来200万トークンまで拡張する計画であり、出力も最大65,000トークンまで生成可能でより詳細かつ包括的な応答提供が可能です。

現在、該当モデルはGoogle AI StudioおよびGemini Advancedの有料サブスクライバーにウェブベースで提供されており、今後はVertex AIを通じて企業ユーザーへ拡大される予定です。モバイルプラットフォーム連動も近いうちに実現されると予想されています。価格政策と速度制限解除など商用化に必要な詳細情報は数週間以内に発表される予定です。

Googleはこの段階的公開戦略を通じて初期ユーザーフィードバックを収集し、それを基にGemini 2.5 Proの性能を精巧化して自社全体のサービスエコシステムに統合する方針です。現在は実験的な段階ですが、推論基盤AIの本格的商用化のための前哨戦として産業全体の関心が集中しています。

最近の人々が人間関係を避ける理由

Leave a Comment 응답 취소

Categories

Follow us

Contact Us

「思考型AI」グーグル、ジェミナイ2.5 Proを公開 – GPT-4.5を上回る性能実証

Leave a Comment 응답 취소