実践ワークフロー
Codexを日常の開発に組み込むための具体的なワークフローパターン。シングルタスクからハイブリッド運用、自動化ループまで段階的に解説します。
シングルタスクCLI
最もシンプルなCodexの使い方は、CLIからワンライナーでタスクを渡す方法です。対話型セッションを開かずに、コマンド一発で作業を完了させます。
基本パターン
# バグ修正
codex "ログイン画面でメールアドレスのバリデーションが効かないバグを修正して"
# リファクタリング
codex "src/utils/date.ts の日付フォーマット関数をdayjsに置き換えて"
# テスト追加
codex "src/api/users.ts のCRUD操作に対するユニットテストを追加して"
# ドキュメント生成
codex "src/lib/ 配下の公開APIのJSDocコメントを追加して"オプション付き実行
# Full Autoモードで自律実行
codex --approval-mode full-auto "型エラーをすべて修正して"
# 特定モデルを指定
codex --model gpt-5-codex "パフォーマンスのボトルネックを分析して最適化案を出して"
# 静かに実行(出力を最小限に)
codex -q "package.jsonの依存関係をすべて最新に更新して"シングルタスクCLIは「5分以内に終わる作業」に最適です。複雑なタスクや複数ステップが必要な作業は、対話型セッションやAppを使いましょう。
App並列開発
Codex Appの真価は、複数のスレッドで異なるタスクを同時進行させる並列開発にあります。1人の開発者が3〜5人分の作業を同時に管理できます。
並列開発の実践例
スレッド1: フロントエンド
"ダッシュボード画面にリアルタイムグラフコンポーネントを追加。Chart.jsを使用し、WebSocketでデータを受信"
スレッド2: バックエンド
"WebSocketエンドポイントを実装。5秒間隔でメトリクスデータをブロードキャスト。認証ミドルウェアを適用"
スレッド3: インフラ
"Docker Composeの設定を更新。Redisコンテナを追加し、WebSocketのpub/subバックエンドとして設定"
スレッド4: テスト
"WebSocket接続のE2Eテストを作成。接続、認証、データ受信、切断の各シナリオをカバー"
各スレッドはビルトインWorktreeにより隔離されているため、互いの作業が干渉しません。すべてのスレッドが完了したら、順番にレビューしてマージします。
並列スレッド数の目安は3〜5です。それ以上増やすとレビューの負荷が高くなり、かえって効率が下がることがあります。タスクの粒度とレビュー可能な量のバランスを取りましょう。
ハイブリッド運用
Claude Code + Codex のハイブリッド運用は、多くの上級開発者が報告している効果的なパターンです。それぞれの強みを活かして使い分けます。
典型的なハイブリッドフロー
-
Claude Codeで設計・実装(深い推論)
複雑なアーキテクチャ設計、新機能の実装、難しいバグの調査など、深い思考と対話が必要な作業をClaude Codeで行います。 -
Codexでレビュー・テスト(並列処理)
Claude Codeで作成したコードのレビュー、テスト追加、ドキュメント生成などを、Codexの複数スレッドで並列に実行します。 -
Codexで定型作業を自動化
依存関係の更新、Lint修正、型エラーの解消など、パターン化された作業をCodexに任せます。 -
Claude Codeで最終レビュー
すべての変更を統合した後、Claude Codeで全体の整合性を確認します。
使い分けの基準
| タスク特性 | 推奨ツール | 理由 |
|---|---|---|
| 複雑な設計判断 | Claude Code | 深い推論と対話的な探索が必要 |
| 定型的なコード生成 | Codex | パターンに従った大量生成が得意 |
| バグの根本原因調査 | Claude Code | 仮説検証の対話ループが有効 |
| テスト追加 | Codex | 複数ファイルのテストを並列生成 |
| リファクタリング | 両方 | 設計はClaude Code、実行はCodex |
| コードレビュー | Codex | Skillsで一貫したレビュー基準を適用 |
ハイブリッド運用の鍵は「使い分けのルールを決めること」です。チームで「設計フェーズはClaude Code、実装フェーズはCodex」のような基準を共有すると、効率が大幅に向上します。
自動化ループ
Codex AppのAutomations機能を使えば、定期的なタスクを完全に自動化できます。人間はレビューキューを確認するだけで、ルーティンワークから解放されます。
自動化ループの構成
┌─────────────────────────────────────────┐
│ スケジュールトリガー (毎日/毎週/イベント) │
└────────────────┬────────────────────────┘
▼
┌─────────────────────────────────────────┐
│ Codexエージェント実行 │
│ - Skillsに基づくタスク処理 │
│ - サンドボックス内で安全に実行 │
└────────────────┬────────────────────────┘
▼
┌─────────────────────────────────────────┐
│ レビューキューに結果を追加 │
│ - PR作成、レポート生成、修正提案 │
└────────────────┬────────────────────────┘
▼
┌─────────────────────────────────────────┐
│ 開発者がレビュー・承認 │
│ - 承認 → マージ │
│ - 修正 → フィードバックして再実行 │
│ - 却下 → 破棄 │
└─────────────────────────────────────────┘自動化の具体例
- 毎朝の依存関係チェック —
npm auditとnpm outdatedを実行し、脆弱性やアップデートがあればPRを自動作成 - 毎週のコード品質レポート — Lintエラー数、型エラー数、テストカバレッジの推移をレポートとして生成
- PRマージ後の自動タスク — マージされたPRに対してCHANGELOGの更新やドキュメントの同期を自動実行
自動化ループの結果は必ず人間がレビューしてください。特にセキュリティに関わる変更(依存関係の更新、認証ロジックの修正など)は、自動マージせずに慎重に確認しましょう。
MCPオーケストレーション
Codex CLIをMCPサーバーとして公開し、OpenAI Agents SDKで決定論的パイプラインを構築するワークフローです。複数のエージェントを段階的に実行し、各ステップの結果を次のステップに渡します。
パイプライン例: PRレビュー自動化
from agents import Agent, Runner
from agents.mcp import MCPServerStdio
codex = MCPServerStdio(command="codex", args=["--mcp-server"])
# Step 1: 変更分析
analyzer = Agent(
name="change-analyzer",
instructions="""
PRの変更ファイルを分析し、以下を出力:
- 変更の種類(バグ修正/機能追加/リファクタリング)
- 影響範囲の評価
- リスクレベル(低/中/高)
""",
mcp_servers=[codex]
)
# Step 2: テスト検証
tester = Agent(
name="test-verifier",
instructions="""
変更に対するテストカバレッジを検証:
- 既存テストの実行結果
- カバレッジの変化
- 不足しているテストケースの提案
""",
mcp_servers=[codex]
)
# Step 3: レビューコメント生成
reviewer = Agent(
name="review-commenter",
instructions="""
分析結果とテスト検証を踏まえ、
PRレビューコメントを生成する。
改善提案は具体的なコード例を含めること。
""",
mcp_servers=[codex]
)MCPオーケストレーションは、CI/CDパイプラインへの組み込みに最適です。GitHub ActionsやGitLab CIのステップとしてCodexを呼び出し、PRのたびに自動レビューを実行できます。
日常開発フロー
Codexを日常の開発サイクルに組み込む具体的なシナリオを紹介します。
シナリオ1: バグ修正
-
バグの報告を受ける
「ユーザー一覧ページで、ソート順を変更するとページネーションがリセットされる」 -
CodexでFull Auto調査
codex --approval-mode full-auto "ユーザー一覧のソート変更時にページネーションがリセットされるバグを調査して原因を特定" -
修正の実行
codex "特定された原因に基づいてバグを修正し、リグレッションテストも追加" -
確認とコミット
変更内容を確認し、問題なければコミット・プッシュ
シナリオ2: 機能追加
設計フェーズ(Claude Code推奨)
要件の整理、アーキテクチャ設計、APIインターフェースの定義を対話的に進める。
実装フェーズ(Codex App)
設計に基づいて複数スレッドで並列実装。バックエンド、フロントエンド、テストを同時進行。
統合フェーズ
各スレッドの成果をマージし、統合テストを実行。問題があればCodexで修正。
シナリオ3: リファクタリング
# Step 1: 現状分析
codex "src/services/ 配下のコードを分析し、重複コード、長すぎる関数、
循環依存などの問題を一覧で報告して"
# Step 2: リファクタリング計画
codex "分析結果に基づいて、優先度付きのリファクタリング計画を作成して。
各タスクの見積もり工数も含めて"
# Step 3: 段階的に実行(App推奨)
# → 各タスクを個別スレッドで並列実行日常フローのポイントは「Codexに任せられる作業は任せて、自分は判断に集中する」ことです。調査や定型作業をCodexに委任し、設計判断やレビューに時間を使いましょう。