論文の概要: Mind DeepResearch Technical Report
- arxiv url: http://arxiv.org/abs/2604.14518v1
- Date: Thu, 16 Apr 2026 01:20:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.667771
- Title: Mind DeepResearch Technical Report
- Title(参考訳): Mind DeepResearchテクニカルレポート
- Authors: MindDR Team, Li Auto Inc,
- Abstract要約: 我々は,効率的なマルチエージェントディープリサーチフレームワークである textbfMind DeepResearch (MindDR) を提案する。
MindDRはtextasciitilde30B-modelsのみで主要なパフォーマンスを実現している。
MindDRはLi Autoのオンライン製品としてデプロイされている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present \textbf{Mind DeepResearch (MindDR)}, an efficient multi-agent deep research framework that achieves leading performance with only \textasciitilde30B-parameter models through a meticulously designed data synthesis and multi-stage training pipeline. The core innovation of MindDR lies in a collaborative three-agent architecture (Planning Agent, DeepSearch Agent, and Report Agent) and a four-stage agent-specialized training pipeline comprising SFT cold-start, Search-RL, Report-RL and preference alignment. With this regime, MindDR demonstrates competitive performance even with \textasciitilde30B-scale models. Specifically, MindDR achieves 45.7\% on BrowseComp-ZH, 42.8\% on BrowseComp, 46.5\% on WideSearch, 75.0\% on xbench-DS, and 52.5 on DeepResearch Bench, outperforming comparable-scale open-source agent systems and rivaling larger-scale models. MindDR has been deployed as an online product in Li Auto. Furthermore, we introduce \textbf{MindDR Bench}, a curated benchmark of 500 real-world Chinese queries from our internal product user interactions, evaluated through a comprehensive multi-dimensional rubric system rather than relying on a single RACE metric. On MindDR Bench, MindDR achieves a state-of-the-art score of 51.8.
- Abstract(参考訳): 我々は,高効率なマルチエージェントディープリサーチフレームワークである \textbf{Mind DeepResearch (MindDR)} を提案する。
MindDRの中核となる革新は、協調的な3エージェントアーキテクチャ(Planning Agent、DeepSearch Agent、Report Agent)と、SFTコールドスタート、Search-RL、Report-RL、Report-RLを含む4段階のエージェント特殊化トレーニングパイプラインである。
この体制により、MindDRは \textasciitilde30B-scale モデルでさえ競合性能を示す。
具体的には、MindDRはBrowseComp-ZHで45.7\%、BrowseCompで42.8\%、WideSearchで46.5\%、xbench-DSで75.0\%、DeepResearch Benchで52.5を達成する。
MindDRはLi Autoのオンライン製品としてデプロイされている。
さらに、内部製品ユーザインタラクションから500の実際の中国語クエリをキュレートしたベンチマークである \textbf{MindDR Bench} を導入し、単一の RACE メトリックに頼るのではなく、総合的な多次元ルーリックシステムを用いて評価した。
MindDR Benchでは、MindDRは最先端のスコアが51.8に達する。
関連論文リスト
- AgentIR: Reasoning-Aware Retrieval for Deep Research Agents [76.29382561831105]
ディープリサーチエージェントは、各検索の前に明示的な自然言語推論を生成する。
Reasoning-Aware Retrievalは、クエリと一緒にエージェントの推論トレースを埋め込む。
DR-Synthは、標準的なQAデータセットからDeep Researchレトリバーのトレーニングデータを生成する。
AgentIR-4Bは、オープンウェイトエージェントであるTongyi-DeepResearchで68%の精度を達成する。
論文 参考訳(メタデータ) (2026-03-04T18:47:26Z) - Step-DeepResearch Technical Report [90.50586290399683]
コスト効率のよいエンドツーエンドエージェントである Step-DeepResearch を紹介する。
我々は、計画とレポート作成を強化するために、アトミック能力に基づくデータ合成戦略を提案する。
中国における評価ギャップを埋めるため,現実的な深層研究シナリオのためのADR-Benchを構築した。
論文 参考訳(メタデータ) (2025-12-23T16:32:27Z) - Deep Retrieval at CheckThat! 2025: Identifying Scientific Papers from Implicit Social Media Mentions via Hybrid Retrieval and Re-Ranking [4.275139302875217]
CLEF CheckThat! 2025コンペティションのサブタスク4bに対するDeep Retrievalチームの方法論と結果を示す。
本稿では,語彙的精度,意味的一般化,文脈的再ランク付けを併用したハイブリッド検索パイプラインを提案する。
提案手法は, 開発セットで76.46%, 隠されたテストセットで66.43%の平均相反ランクを5 (MRR@5) 達成する。
論文 参考訳(メタデータ) (2025-05-29T08:55:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。