MiroThinker: AIスケーリングの「第3の軸」へ

🧠

MiroThinker v1.5

30Bパラメータの「小さな巨人」が1Tモデルに匹敵する理由

MiroMindがリリースしたMiroThinker v1.5は、従来の「モデルサイズ」「コンテキスト長」に続く第3の軸「インタラクティブ・スケーリング」を提唱。AIは思考の長さ（CoT）だけでなく、環境との試行錯誤（Action）の回数で賢くなります。GAIAベンチマークで80.8%、BrowseCompで69.8%を記録し、GPT-5級の商用モデルに肉薄しています。

主な特徴

🔑 MiroThinker v1.5 の特徴

1 GAIA 80.8% - GPT-5級の商用モデルに肉薄するベンチマーク結果
2 コスト1/20 - エンタープライズ向けDeep Researchツールの約1/20で運用可能
3 256Kトークン - 大規模なコンテキストウィンドウでDeep Diveが可能
4 MITライセンス - オープンソースでローカル実行可能（ただしAPI依存あり）

🔄

インタラクティブ・スケーリング

仮説→ツール実行→観察→修正のループで、行動するほど賢くなる

🔍

Dynamic Research Agent

「記憶」するAIから「調査」するAIへ。答えを見つける方法を知っている

🔗

MCP対応

Model Context Protocolで検索・コンテンツ・実行ツールを標準化

3段階のトレーニングパイプライン

MiroThinkerはAgentic SFT → DPO → Agentic RL (GRPO)の3段階で訓練されています。専門家の行動軌跡（Trajectory）を模倣学習し、正解への道筋を整列させ、大規模な試行錯誤（Rollout）による「粘り強さ」と「探索能力」を獲得。時間的感受性トレーニングにより、未来情報のリーク（予測タスクでのカンニング）を防止しています。

ベンチマーク：巨人殺しの証明

パラメータ数が少なくても、インタラクションの質と量で「賢さ」は逆転します。GAIA 80.8%（GPT-5 level）、BrowseComp 69.8%（オープンソーストップクラス）、HLE 39.2%（1Tモデル級の推論能力）を達成。ツール呼び出し回数が増えるほど精度が向上し、Step 50で75.0%に到達します。

「完全オープンソース」の落とし穴

モデルとコードはMITライセンスでローカル実行可能ですが、推奨される最小構成には商用API（Serper、E2B、Jina）が必要です。検索結果や実行環境が外部サービスに依存するため、完全な監査や再現性の担保が難しい場合があります。導入前にAPIコストの試算と依存サービスのSLA確認が必須です。

リサーチAI競合比較

MiroThinker v1.5：検証の深さ、透明性（ログ）、カスタマイズ性が強み。技術調査、複雑な裏取り、社内データ統合に最適。OpenAI/Gemini Deep Research：セットアップ不要、UI体験、一般知識が強み。Perplexity：速さとニュース検索が強み。用途に応じた使い分けが重要です。

📖