Claude Sonnet 4.5の主な特徴
AnthropicがリリースしたClaude Sonnet 4.5は、SWE-bench Verified 77.2%、OSWorld 61.4%という業界最高水準のスコアを達成し、「世界最高のコーディングモデル」として注目されています。長時間の自律動作能力、専門領域での高度な推論力、そして新しいClaude Agent SDKによる強力なエージェント構築機能を備えています。
世界最高のコーディングモデルが登場
AnthropicがリリースしたClaude Sonnet 4.5は、SWE-bench Verified 77.2%、OSWorld 61.4%という業界最高水準のスコアを達成し、「世界最高のコーディングモデル」として注目されています。長時間の自律動作能力、専門領域での高度な推論力、そして新しいClaude Agent SDKによる強力なエージェント構築機能を備えています。
Claude Sonnet 4.5は、ソフトウェア開発における実問題解決能力を評価するSWE-bench Verifiedで77.2%という高スコアを達成しました。
| モデル | スコア | 改善点 |
|---|---|---|
| Claude Sonnet 4.5 | 77.2% | 200kトークン設定 |
| Claude Opus 4.1 | 74.5% | 前世代モデル |
| Claude Sonnet 3.7 | 62-70% | 旧バージョン |
| Sonnet 4.5(1M設定) | 78.2% | 推論負荷高 |
| Sonnet 4.5(並列) | 82.0% | ハイコンピュート |
OSWorldベンチマークでは、AIが実際にコンピュータを操作してタスクをこなす能力を測定します。Claude Sonnet 4.5は61.4%のスコアを記録し、前バージョンから約19ポイントの大幅向上を達成しました。
Claude Sonnet 4.5はChrome拡張機能を通じて、実際のブラウザ操作を自動化できます
Claude Sonnet 4.5の最大の特徴の一つは、30時間以上にわたって途切れることなく自律的に動作し続けられる能力です。
Anthropicは新たにClaude Agent SDKを公開し、開発者が高度なエージェント機能を活用できるようになりました。
Claude Sonnet 4.5は専門ドメイン知識や分野特化タスクにおいても、前モデルから大幅な向上を示しています。
パートナー企業からの報告では、Claude Sonnet 4.5により以下のような成果が得られています:
Claude Code(コーディング支援エージェント)でも、Sonnet 4.5へのアップグレードがすでに完了しています。
claude-sonnet-4-5Claude Sonnet 4.5は、AI開発とコーディング支援の新時代を切り開く革新的なモデルです