MiroThinker v1.5
30Bパラメータの「小さな巨人」が1Tモデルに匹敵する理由
MiroMindがリリースしたMiroThinker v1.5は、従来の「モデルサイズ」「コンテキスト長」に続く第3の軸「インタラクティブ・スケーリング」を提唱。AIは思考の長さ(CoT)だけでなく、環境との試行錯誤(Action)の回数で賢くなります。GAIAベンチマークで80.8%、BrowseCompで69.8%を記録し、GPT-5級の商用モデルに肉薄しています。
主な特徴
🔑 MiroThinker v1.5 の特徴
- 1 GAIA 80.8% - GPT-5級の商用モデルに肉薄するベンチマーク結果
- 2 コスト1/20 - エンタープライズ向けDeep Researchツールの約1/20で運用可能
- 3 256Kトークン - 大規模なコンテキストウィンドウでDeep Diveが可能
- 4 MITライセンス - オープンソースでローカル実行可能(ただしAPI依存あり)
3段階のトレーニングパイプライン
MiroThinkerはAgentic SFT → DPO → Agentic RL (GRPO)の3段階で訓練されています。専門家の行動軌跡(Trajectory)を模倣学習し、正解への道筋を整列させ、大規模な試行錯誤(Rollout)による「粘り強さ」と「探索能力」を獲得。時間的感受性トレーニングにより、未来情報のリーク(予測タスクでのカンニング)を防止しています。
ベンチマーク:巨人殺しの証明
パラメータ数が少なくても、インタラクションの質と量で「賢さ」は逆転します。GAIA 80.8%(GPT-5 level)、BrowseComp 69.8%(オープンソーストップクラス)、HLE 39.2%(1Tモデル級の推論能力)を達成。ツール呼び出し回数が増えるほど精度が向上し、Step 50で75.0%に到達します。
「完全オープンソース」の落とし穴
モデルとコードはMITライセンスでローカル実行可能ですが、推奨される最小構成には商用API(Serper、E2B、Jina)が必要です。検索結果や実行環境が外部サービスに依存するため、完全な監査や再現性の担保が難しい場合があります。導入前にAPIコストの試算と依存サービスのSLA確認が必須です。
リサーチAI競合比較
MiroThinker v1.5:検証の深さ、透明性(ログ)、カスタマイズ性が強み。技術調査、複雑な裏取り、社内データ統合に最適。OpenAI/Gemini Deep Research:セットアップ不要、UI体験、一般知識が強み。Perplexity:速さとニュース検索が強み。用途に応じた使い分けが重要です。













