Daily AI News — 2026/02/19 v0.102.0+

Codex マルチエージェント機能
AIを「個人」から「専門チーム」へ

Explorer・Worker・Reviewer の3ロール分業により、テスト通過率+20〜40%、7Mトークン並列処理を実現する実験的新機能

Codex Multi-Agent Architecture
+20〜40%
テスト通過率の向上
7M
トークン並列処理
84〜87%
キャッシュ効率
3
専門ロール (Explorer/Worker/Reviewer)

なぜマルチエージェントが必要なのか?
単一エージェントの3つの限界

1つのAIエージェントに全てを任せると、コンテキスト汚染・デグレッション・幻覚ループという根本的な問題が発生します。

Context Dilution(文脈汚染)

調査・実装・レビューを一つのコンテキストで行うと、情報過多で精度が低下。重要な条件を見落とし、品質が劣化します。

Regression(デグレッション)

新しいコードを書く際に既存コードに副作用が発生。単一エージェントでは影響範囲を正確に把握できません。

Hallucination Loops(幻覚ループ)

自分の出力を自分で検証する「自己採点」構造により、誤りが修正されず増幅し続ける悪循環に陥ります。

単一エージェントの限界

戦略的転換:「関心事の分離」という解法

人間のチーム開発と同じ原理 ― 調査・実装・レビューを専門のエージェントに分離し、それぞれに適切な権限とモデルを割り当てることで、品質と速度を飛躍的に向上させます。

戦略的転換

3つの専門ロールによるチーム編成

各ロールは明確に分離された権限を持ち、人間の開発チームのように協調して動作します。

🔍

Explorer(調査役)

read-only

コードベースを探索し、影響範囲の特定と実装計画の策定を担当。安全のため書き込み権限を持たず、調査に専念します。

sandbox = "read-only"
🔨

Worker(実装役)

write

Explorerが策定した計画に忠実に従い、最小限の差分でコード編集とテスト作成を実行します。

sandbox = "workspace-write"
🛡

Reviewer(監査役)

read-only

職務分離(SoD)の原則に基づく独立した監査。セキュリティ脆弱性・テスト不足・後方互換性の問題を検出します。

sandbox = "read-only"
チーム構成

黄金サイクル:Investigate → Build → Verify

3つのロールが固定フォーマットの計画書(PLAN.md)をハンドオーバーポイントとして、調査→構築→検証のサイクルを回します。

Step 1

Investigate

Explorer が調査し
PLAN.md を作成

Step 2

Build

Worker が計画に沿って
最小差分で実装

Step 3

Verify

Reviewer が独立した
視点で品質監査

Handover Point = 固定フォーマットの計画書(PLAN.md)。エージェント間の「契約」として機能し、曖昧さを排除。
黄金サイクル

Explorer の5つの必須出力(PLAN.md)

Explorerは以下の5セクションを含む構造化された計画書を出力します。これが後続エージェントへの「設計書」となります。

1Services

影響を受けるサービスの一覧と、各サービスの役割を明記

2Contract Diffs

API契約の変更差分を具体的に記載。既存の呼び出し元への影響を明確化

3Plan

実装手順をステップバイステップで記載。Worker が迷わないレベルの具体性

4Rollout

デプロイ戦略とロールバック手順。段階的リリースの計画

5Tests

必要なテストケースの定義。カバレッジ基準と回帰テストの範囲

Explorer PLAN.md

Worker と Reviewer の行動原則

🔨 Worker:Minimal Diffs(最小差分)

  • PLAN.md の指示に忠実に実装
  • 変更は必要最小限に抑制
  • テストファーストで実装を進行
  • 不明点は独断せずExplorerに差し戻し

🛡 Reviewer:職務分離(SoD)

  • セキュリティ脆弱性の検出
  • テスト不足・カバレッジ低下の指摘
  • 後方互換性の破壊チェック
  • 実装者と独立した視点で品質保証
Worker & Reviewer

config.toml 階層的設定システム

マルチエージェントは config.toml で有効化・制御します。設定は3段階の優先度で解決されます。

1
CLI Flags
最高優先。コマンドラインオプション
2
./.codex/config.toml
プロジェクト単位の設定
3
~/.codex/config.toml
グローバル(ユーザー共通)
config.toml — マルチエージェント有効化
# マルチエージェント機能を有効化
[features]
multi_agent = true

# 並列スレッド数(推奨: 4から開始)
[performance]
max_threads = 4

# Explorer ロールの定義
[agents.explorer]
description = "コードベース調査専用"
config_file = "agents/explorer.toml"

# Worker ロールの定義
[agents.worker]
description = "実装・テスト作成"
config_file = "agents/worker.toml"
config.toml 階層 カスタムロール定義

ガバナンス:サンドボックスと非対話型承認

サブエージェントは親のサンドボックス設定を継承し、権限外の操作は自動的にブロックされます。人間の介在なしに安全を保証する仕組みです。

Read-Only サンドボックス

Explorer と Reviewer はファイル変更不可。調査・監査に特化し、意図しない変更を防止。

Explorer, Reviewer

Workspace-Write サンドボックス

Worker のみ許可されたディレクトリ内で書き込み可能。外部ファイルシステムへのアクセスはブロック。

Worker only

Fail-Safe:非対話型承認

権限外の操作は即座に失敗し、親エージェントにエラーとして報告。ユーザー承認待ちにならず安全に失敗。

Non-interactive Approval
サンドボックスと非対話型承認

インテリジェンス・ティアリング:コストと速度の最適化

親エージェント(Orchestrator)には高い推論能力のモデル、子エージェント(Sub-agents)には高速・軽量モデルを割り当て、コストとパフォーマンスを両立します。

Orchestrator(親)

gpt-5.3-codex
High Reasoning / 指揮・意思決定

Sub-agents(子)

gpt-5.3-codex-spark
High Speed / 実装・調査の実行
Cache Efficiency: 84〜87% — プロンプトキャッシュにより大幅コスト削減
インテリジェンス・ティアリング

運用インターフェース:CLI と macOS App

マルチエージェントは2つのインターフェースで運用でき、設定ファイルは両者で共有されます。

Codex CLI

JetBrains Mono

自動化と厳密なワークフロー制御に特化したコマンドラインインターフェース。

  • CI/CDパイプラインへの統合
  • /spawn_agent コマンドでロール指定
  • スクリプトによるバッチ処理
  • 詳細なオーケストレーション制御

macOS App

JetBrains Mono

視覚的な監督と並列スレッド管理の「コマンドセンター」。

  • スレッド単位でエージェントを監督
  • Git Worktrees 自動サポート
  • 並行作業時のコード競合を防止
  • リアルタイムのステータス表示
CLI と macOS App

トラブルシューティングと監査

Issue: Stuck / 処理停止

エージェントが応答しなくなった場合のリセット方法。

/agent list
/agent close

リセットしてリソースを解放します。

Issue: Rate Limits (429)

並列スレッド数が多すぎるとAPIレート制限に抵触。

max_threads = 4

最初は4から開始し、プランに応じて12まで調整。

Audit Logs(監査ログ)

全エージェントの操作履歴を記録。

~/.codex/sessions/*.jsonl

thread.started, file_change イベントを追跡可能。

トラブルシューティング

実践ユースケース:マイクロサービスの契約変更

「変更境界=サービス境界」。複数サービスにまたがるAPI契約変更を、マルチエージェントが安全に管理する例です。

Worker A

Update Provider

Provider Service

API Contract

Consumer Service

API Contract

Worker B

Update Consumer

Explorer

契約差分を調査

Reviewer

整合性を監査

サービスの境界を越える変更を安全に管理
マイクロサービスの契約変更

プラン別利用ガイド

開発スタイルに合わせた最適なプランの選択ガイド。マルチエージェント機能はPro以上で最大限活用できます。

Plus

$20/月
個人開発者向け

Business

$25/人/月
チーム利用

実装者から「アーキテクト」

コードの細部に埋没する「作業者」から、専門性と権限を設計し、チームを監督する「設計者」へ。

"Architect your agents. Define the boundaries. Lead the team."

config.toml を定義し、あなただけのAI開発チームを編成してください。

結論