Explorer・Worker・Reviewer の3ロール分業により、テスト通過率+20〜40%、7Mトークン並列処理を実現する実験的新機能
1つのAIエージェントに全てを任せると、コンテキスト汚染・デグレッション・幻覚ループという根本的な問題が発生します。
調査・実装・レビューを一つのコンテキストで行うと、情報過多で精度が低下。重要な条件を見落とし、品質が劣化します。
新しいコードを書く際に既存コードに副作用が発生。単一エージェントでは影響範囲を正確に把握できません。
自分の出力を自分で検証する「自己採点」構造により、誤りが修正されず増幅し続ける悪循環に陥ります。
人間のチーム開発と同じ原理 ― 調査・実装・レビューを専門のエージェントに分離し、それぞれに適切な権限とモデルを割り当てることで、品質と速度を飛躍的に向上させます。
各ロールは明確に分離された権限を持ち、人間の開発チームのように協調して動作します。
コードベースを探索し、影響範囲の特定と実装計画の策定を担当。安全のため書き込み権限を持たず、調査に専念します。
sandbox = "read-only"Explorerが策定した計画に忠実に従い、最小限の差分でコード編集とテスト作成を実行します。
sandbox = "workspace-write"職務分離(SoD)の原則に基づく独立した監査。セキュリティ脆弱性・テスト不足・後方互換性の問題を検出します。
sandbox = "read-only"
3つのロールが固定フォーマットの計画書(PLAN.md)をハンドオーバーポイントとして、調査→構築→検証のサイクルを回します。
Explorer が調査し
PLAN.md を作成
Worker が計画に沿って
最小差分で実装
Reviewer が独立した
視点で品質監査
Explorerは以下の5セクションを含む構造化された計画書を出力します。これが後続エージェントへの「設計書」となります。
影響を受けるサービスの一覧と、各サービスの役割を明記
API契約の変更差分を具体的に記載。既存の呼び出し元への影響を明確化
実装手順をステップバイステップで記載。Worker が迷わないレベルの具体性
デプロイ戦略とロールバック手順。段階的リリースの計画
必要なテストケースの定義。カバレッジ基準と回帰テストの範囲
マルチエージェントは config.toml で有効化・制御します。設定は3段階の優先度で解決されます。
# マルチエージェント機能を有効化 [features] multi_agent = true # 並列スレッド数(推奨: 4から開始) [performance] max_threads = 4 # Explorer ロールの定義 [agents.explorer] description = "コードベース調査専用" config_file = "agents/explorer.toml" # Worker ロールの定義 [agents.worker] description = "実装・テスト作成" config_file = "agents/worker.toml"
サブエージェントは親のサンドボックス設定を継承し、権限外の操作は自動的にブロックされます。人間の介在なしに安全を保証する仕組みです。
Explorer と Reviewer はファイル変更不可。調査・監査に特化し、意図しない変更を防止。
Explorer, ReviewerWorker のみ許可されたディレクトリ内で書き込み可能。外部ファイルシステムへのアクセスはブロック。
Worker only権限外の操作は即座に失敗し、親エージェントにエラーとして報告。ユーザー承認待ちにならず安全に失敗。
Non-interactive Approval
親エージェント(Orchestrator)には高い推論能力のモデル、子エージェント(Sub-agents)には高速・軽量モデルを割り当て、コストとパフォーマンスを両立します。
マルチエージェントは2つのインターフェースで運用でき、設定ファイルは両者で共有されます。
自動化と厳密なワークフロー制御に特化したコマンドラインインターフェース。
視覚的な監督と並列スレッド管理の「コマンドセンター」。
エージェントが応答しなくなった場合のリセット方法。
リセットしてリソースを解放します。
並列スレッド数が多すぎるとAPIレート制限に抵触。
最初は4から開始し、プランに応じて12まで調整。
全エージェントの操作履歴を記録。
thread.started, file_change イベントを追跡可能。
「変更境界=サービス境界」。複数サービスにまたがるAPI契約変更を、マルチエージェントが安全に管理する例です。
Update Provider
API Contract
API Contract
Update Consumer
契約差分を調査
整合性を監査
開発スタイルに合わせた最適なプランの選択ガイド。マルチエージェント機能はPro以上で最大限活用できます。
コードの細部に埋没する「作業者」から、専門性と権限を設計し、チームを監督する「設計者」へ。
config.toml を定義し、あなただけのAI開発チームを編成してください。