「アントロピック、クロードワークベンチの機能拡充…API実験・コード分析機能を導入」

Photo of author

By Global Team

米国の人工知能(AI)企業アンソロピック(Anthropic)が自社の言語モデル「クロード(Claude)」の開発者ツールである「ワークベンチ(Workbench)」機能を内部的に拡張していることが確認されました。クロードワークベンチは、AI APIを活用する開発者がテストと設定を簡単に行えるように設計されたツールです。

今回の機能拡張は、新しいAI機能とベータテスト情報を専門的に取り扱うテスティングカタログ(TestingCatalog)を通じて最近確認されました。テスティングカタログは、クロードだけでなく、チャットGPTやジェミニなど、生成AIに関する最新の変更事項を探し、開発者専用機能を定期的にモニタリングしていることで知られています。

テスティングカタログによると、ワークベンチには「APIプレイグラウンド」という名前の新しい機能が追加されたことが判明しました。この機能は、コードを記述しなくてもクロードAPIのさまざまな設定を試すことができるように構成されています。ユーザーはウェブインターフェースで直接応答温度(temperature)、キャッシュ設定、カスタムヘッダーなどを調整することができます。

APIプレイグラウンド(playground) (出典=TestingCatalog @Alexey Shabanov)
APIプレイグラウンド(playground) (出典=TestingCatalog @Alexey Shabanov)

ワークベンチ内の「分析(Analytics)」タブでは、「クロードコード(Claude Code)」ユーティリティの活動履歴を視覚的に確認できる機能も試験中です。クロードコードは、コマンドライン環境でコードを生成し、バージョン管理システムに直接コミットする機能を提供するツールです。

クロードコード(Claude Code) (出典=TestingCatalog @Alexey Shabanov)
クロードコード(Claude Code) (出典=TestingCatalog @Alexey Shabanov)

さらに、テスティングカタログは、「製品評価(Product Evals)」という名前のセクションがワークベンチに追加されたことも確認しました。現在は「coming soon」と表示されており、具体的な機能内容は明らかになっていません。ただし、機能名から判断すると、プロンプト応答品質評価やモデル間の比較テストなどの実験的ツールが含まれる可能性があります。

製品評価(Product Evals) (出典=TestingCatalog @Alexey Shabanov)
製品評価(Product Evals) (出典=TestingCatalog @Alexey Shabanov)

クロードワークベンチのこのような拡張機能は、現在米国およびいくつかの制限された地域の非公開ビルドでのみ実験されており、韓国を含む一般ユーザーにはまだ公開されていません。アンソロピック側は、これらの機能の正式なリリース日程や地域別導入計画に関して別途公式の立場を発表していません。

今回の機能拡張は、チャットボット機能に留まっていたAIツールを実質的な開発と運用環境に拡張しようとする動きの一環として解釈されます。OpenAIがチャットGPTを中心に多様な開発者用機能を段階的に開放したのと同様に、アンソロピックもクロードのエコシステムを技術基盤組織に最適化されたツールとして再整備しているといえます。

ワークベンチ機能が正式にリリースされると、クロードは単なる対話型AIを超えて、実際の業務やコード作成、製品開発全過程で活用される総合ツールとして機能する見込みです。

Leave a Comment