「思考型AI」グーグル、ジェミナイ2.5 Proを公開 – GPT-4.5を上回る性能実証
現在、実験的な形で公開されたGemini 2.5 Proは、テキストはもちろんイメージ、オーディオ、ビデオなど様々なタイプの入力データを同時に処理し、それを論理的に統合して高次元的な応答を生成できる構造を備えています。Googleは、このモデルを「思考(thinking)」能力を持った次世代AIと定義し、既存モデルの単純応答方式から脱却した進化した学習構造を強調しました。 Googleが自社の最新人工知能モデル『Gemini 2.5 Pro』を公開し、生成型AI技術競争で新たな転機を迎えました。(写真提供=Google) 特に、Gemini 2.5 Proはユーザーの要求に対し複雑な文脈を理解し、論理的推論を経て応答を生成する「多段階推論(multi-step reasoning)」能力を強化しました。これにより、数学、科学、プログラムコードの生成など高難度な作業において正確性と効率性を同時に確保したことが特徴です。 該当モデルは、コード生成および変換能力でも進歩を示しました。たった一行のプロンプトで実行可能な複雑なコード作成が可能であり、これは開発者中心のアプリケーション制作にも実質的な活用度を高める要素として評価されています。Googleはこれに対し、後続学習強化技術を適用してAIのリアルタイム問題解決能力を改善しました。 ベンチマーク指標でもGemini 2.5 Proは業界最高水準の成果を見せました。人間の応答嗜好を評価するLMArenaリーダーボードでは競合モデルであるClaude 3.7、o3-miniを抑えて大差で1位を獲得しました。複雑な推論が必要な「Humanity’s Last Exam」では道具なしで18.8%を記録し他のモデルを上回り、「GPQA Diamond」では84.0%の正解率を、「AIME 2025」では86.7%の正解率を示し精密推論能力を証明しました。 Gemini 2.5 Proが三つの主要ベンチマークで競合モデルを上回る性能を示しています。Humanity’s Last Exam(推論)、GPQA Diamond(科学)、AIME ...
Read more