Alibaba Tongyi Lab発:長期探索(long-horizon)に最適化されたAIエージェント
| 観点 | Tongyi DeepResearch | OpenAI WebGPT系 |
|---|---|---|
| アーキテクチャ | 30B MoE設計(3B活性化) | 汎用トランスフォーマー+外部ツール |
| エージェント性 | agentic interaction dataで事前最適化 | ReActプロンプト設計+ファインチューニング |
| トレーニング | 継続的事前学習+RL最適化 | 人間フィードバック+報酬モデル |
| ベンチマーク | BrowserComp、Humanity's Last Exam | 事実性改善+出典提示 |
| 公開性 | 完全オープンソース(GitHub+HF) | API+プラグインエコシステム |
| 商用利用 | Apache 2.0で自由利用可 | OpenAI利用規約に従う |
| 安全性 | ベンチマーク重視、出典管理は要実装 | 出典収集+人間評価ループ内蔵 |
1リポジトリをクローン
2Python環境作成
3依存パッケージインストール
4Hugging Faceログイン
5モデルダウンロード
6実行スクリプト設定
7実行開始
30B:大規模モデルの知識量
3-3.3B:推論時の実際の計算量
10倍効率化:同等性能で大幅な高速化
実用的:商用環境での現実的なデプロイ
| ベンチマーク | タスク内容 | Tongyi DeepResearch | 比較対象 |
|---|---|---|---|
| BrowserComp | ブラウザ操作タスク | SOTA級 | 既存オープンソース |
| Humanity's Last Exam | 複雑な推論問題 | 高性能 | 商用エージェント |
| WebWalkerQA | Web探索Q&A | 優秀 | 英中両言語 |
情報源:GitHub README、Hugging Face、公式ブログ
公開日:2025年9月中旬
スライド作成:2025年9月18日