2026年2月19日発表。前モデルからわずか数ヶ月で推論能力が2.5倍に飛躍。ARC-AGI-2で77.1%を達成し、人間の壁(~60%)を突破した次世代推論エンジン
Gemini 3.1 Pro(プレビュー版)は、複雑な推論やエージェント主導型タスクに特化した最新モデルです。前モデルのGemini 3 Proからわずか数ヶ月で推論能力が飛躍的に進化し、「思考プロセス(Reasoning)」と「Agentic Workflow」に最適化されました。
Knowledge Retrieval
Pattern Matching
Reasoning
Agentic Workflow
Observe → Reason → Verify → Act
未知の論理パターンを解く「流動性知能」の指標ARC-AGI-2で、人間の平均(~60%)を大きく超える77.1%を達成。前モデル(31.1%)から2.5倍の性能向上です。
生物学、物理学、化学などの専門分野において、人間の専門家レベルの知識精度を発揮。既存ベンチマークが飽和するほどの高スコアを達成しました。
従来のAI(Chat)がコード生成で終わるのに対し、Gemini 3.1はターミナルを操作し、実行・検証・修正のループを自律的に回す「エージェント」として動作します。
コードを生成して終了。実行結果の確認や修正は人間が行う必要がありました。
実行 → 検証 → 修正のループを自律的に回し、問題を解決まで導きます。
タスクの複雑さに応じて、AIの思考時間を「Low / Medium / High」で調整可能。新設の「Medium」モードは実務で最もバランスが良い設定です。
単純な応答、低コスト。日常的なチャットや簡単な質問に最適。
ビジネスロジック、データ整理。応答速度と推論精度のバランスが良く、実務利用に最適。
科学研究、複雑な推論(ARC-AGI)。最大限の思考時間を確保して精度を追求。
自律的に動くAIエージェントを管理・オーケストレーションする全く新しい統合開発環境「Google Antigravity」が発表。さらに、カスタムツールやBashコマンドの呼び出しに特化した専用エンドポイント(gemini-3.1-pro-preview-customtools)が提供され、エージェントワークフローの信頼性が向上しています。
エージェントが生成した成果物(Artifacts)を直接レビュー・修正するワークスペース。コードだけでなく、UI生成レポートも成果物として表示。
複数のエージェントを俯瞰・管理するコントロールパネル。
テキストプロンプトからWebサイトに直接埋め込み可能なアニメーションSVGを生成。ファイルサイズはわずか数KBで、解像度を問わず劣化しない高品質なベクター画像を作成できます。画像、音声、動画、全コードリポジトリを含む1Mトークンのコンテキストをネイティブに理解します。
| Category | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2 |
|---|---|---|---|
| Abstract Reasoning (ARC) | 77.1% | 68.8% | 52.9% |
| Scientific Knowledge (GPQA) | 94.3% | 91.3% | 92.4% |
| Cost Efficiency | High | Low ($$$) | Med |
| Agentic Coding | Strong | Strong | Moderate |
| User Preference (Elo/Vibe) | Good | Top | Good |
性能は最上位クラスながら、価格はClaude Opusの半分以下。コンテキストキャッシュを活用すれば、入力コストはさらに1/10に。大規模運用に現実的な解を提供します。
膨大なマニュアルや決算資料、1時間の会議動画を一括処理。NotebookLMと連携すれば、資料をアップロードするだけでAI同士が議論する「音声要約(Audio Overview)」を生成したり、横断的な検索・分析が可能に。
PDF / 1hr Video / Full Code Repo
Retrieval: MRCR v2 84.9%
Summary / Audio Overview / Analysis
Gemini 3.1 Proは「流動性知能」の飛躍により、AIをチャットボットから「思考するパートナー」へと進化させました。