アンソロピック、次世代AIモデル「Claude Sonnet 4.5」を発表 – 開発者はこの30分で驚くべき成果を体験できる

Photo of author

By Global Team

グローバルAIスタートアップのアンソロピック(Anthropic)が、最新の最先端AIモデル「Claude Sonnet 4.5」を9月29日(現地時間)、発表しました。会社側は、このモデルがコード作成と問題解決能力において大幅に向上し、特に複雑なソフトウェア開発や数学的推論、そして実際のコンピュータ使用能力において世界最高レベルの性能を示していると強調しています。

Claude Sonnet 4.5公開 (写真提供=アンソロピック)
Claude Sonnet 4.5公開 (写真提供=アンソロピック)

「Claude Sonnet 4.5」の最大の特徴は、プログラミング分野での性能向上です。コード実行能力はソフトウェア開発、スプレッドシート管理、文書作成など現代の業務環境全般と直結しています。会社はこのモデルが単にコードを生成することを超えて、長時間にわたる複雑な開発課題も安定的に遂行できると説明しています。

実際のベンチマークテストでも目覚ましい結果が出ました。「SWE-bench Verified」という実用的なソフトウェア開発評価で最高の性能を記録し、オペレーティングシステム上の実際の作業遂行能力を検証する「OSWorld」ベンチマークでも既存モデルより大きく先行しました。4ヶ月前には42%台に留まっていた性能指標が今回は61%を超えました。

ソフトウェアエンジニアリングベンチマーク(SWE-bench Verified)結果、Sonnet 4.5が82%で最も高い精度を記録し、GPT-5とGemini 2.5 Proを上回った。(資料提供=アンソロピック)
ソフトウェアエンジニアリングベンチマーク(SWE-bench Verified)結果、Sonnet 4.5が82%で最も高い精度を記録し、GPT-5とGemini 2.5 Proを上回った。(資料提供=アンソロピック)
OSWorldベンチマークで42%水準に留まっていた性能が4ヶ月で61%を超えて既存モデルを大きく上回った。(資料提供=アンソロピック)
OSWorldベンチマークで42%水準に留まっていた性能が4ヶ月で61%を超えて既存モデルを大きく上回った。(資料提供=アンソロピック)

アンソロピックはこのモデルとともに自社の主要製品群を全面的にアップグレードしました。コード開発ツール「Claude Code」には、ユーザーが作業履歴を保存し以前の状態に戻ることができるチェックポイント機能が追加されました。開発者から継続的に要請されてきた機能で、大規模プロジェクト管理に特に有用です。

さらに、ターミナルインターフェースが改善され、マイクロソフトの代表的な開発環境「VS Code」向けの拡張プログラムも新たに提供されます。また、長時間実行されるエージェントがより大きな作業を処理できるよう支援するメモリ管理ツールと文脈編集機能もClaude APIに追加されています。

ユーザーに優しいアップデートも目を引きます。Claudeアプリでは、対話中にコード実行はもちろん、スプレッドシートやスライド、文書などのファイルも作成可能になりました。Chromeブラウザの拡張プログラムも待機者リストにあった有料ユーザーに順次提供されています。

アンソロピックは今回のモデル発表とともに自社内部で使用してきたエージェント開発インフラを外部開発者に公開しました。「Claude Agent SDK」という名前のこのツールはAIエージェントを設計し運営するための核心技術を提供します。

このツールを通じて開発者はメモリ管理、権限システム、多重下位エージェント調整など複雑な問題を解決することができます。会社側は「直接使用してきたエージェント開発インフラを開放することで、誰でも自身の強力なAIエージェントを構築できるだろう」と述べています。

アンソロピックはこのモデルが単に性能だけでなく安全性においても進歩したと説明しています。既存のモデルで問題となっていたお世辞や騙し、過度な自律性追求、幻想的発言誘導など不適切な行動を大幅に減らしたとされています。特にプロンプトインジェクション攻撃(悪意ある入力による誤用)防御力が強化されました。

Claude Sonnet 4.5にはAI安全レベル3(ASL-3)グレードの保護装置が適用されました。これは化学・生物・放射能・核(CBRN)関連リスク入力を検知する分類器(Classifier)のような安全フィルターが含まれることを意味します。ただし、正常なコンテンツが誤ってブロックされる可能性があるため、利用者が望む場合、危険度が低い以前のモデルに切り替えるオプションも提供されます。

新モデルは9月29日(現地時間)から全世界で利用可能です。既存のClaude Sonnet 4と同様に、百万トークン当たり3ドル(入力)、15ドル(出力)の料金プランが維持されます。Claude Code、Claudeアプリ、Claude APIなど全製品群でアップグレードされた性能を即座に活用できます。

また、アンソロピックは「Imagine with Claude」という研究用プレビュサービスも一時的に提供します。この実験機能は事前のコーディングなしにユーザーの要求に応じてリアルタイムでソフトウェアを生成することを目的としています。

Claude Sonnet 4.5は金融、法律、医療、工学など専門分野でも以前のモデルより優れた成果を示したと評価されています。会社は今回のモデルが「これまでに公開されたアントロピックモデルの中で最も整合(alignment)されたAI」だと強調しています。

既にGoogle、OpenAI、Metaなどが次世代モデル競争に参入している中、アンソロピックの「Claude Sonnet 4.5」は市場に新しい変化をもたらす可能性が大きいです。特にソフトウェア開発環境と実際のコンピュータ活用能力を大幅に引き上げた点で、他の企業の対応が注目されます。

Leave a Comment