論文の概要: Deep Researcher with Sequential Plan Reflection and Candidates Crossover (Deep Researcher Reflect Evolve)
- arxiv url: http://arxiv.org/abs/2601.20843v1
- Date: Wed, 28 Jan 2026 18:45:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-29 15:46:07.098875
- Title: Deep Researcher with Sequential Plan Reflection and Candidates Crossover (Deep Researcher Reflect Evolve)
- Title(参考訳): 逐次計画反射と候補交叉による深部研究員(深部研究員反射運動)
- Authors: Saurav Prateek,
- Abstract要約: 本稿では、複雑なPhDレベルのトピックに関する詳細な研究レポートを作成するために設計された、新しいDeep Researcherアーキテクチャを提案する。
本システムでは,リフレクションによる逐次研究計画修正と候補クロスオーバーアルゴリズムという,2つの重要なイノベーションを活用している。
我々の建築は46.21点を達成し、先進的な深層研究エージェントを超越して優れた性能を示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper introduces a novel Deep Researcher architecture designed to generate detailed research reports on complex PhD level topics by addressing the inherent limitations of the Parallel Scaling paradigm. Our system utilizes two key innovations: Sequential Research Plan Refinement via Reflection and a Candidates Crossover algorithm. The sequential refinement process is demonstrated as an efficient method that allows the agent to maintain a centralized Global Research Context, enabling it to look back at current progress, reason about the research plan, and intelligently make changes at runtime. This dynamic adaptation contrasts with parallel approaches, which often suffer from siloed knowledge. The Candidates Crossover algorithm further enhances search efficiency by deploying multiple LLM candidates with varied parameters to explore a larger search space, with their findings synthesized to curate a comprehensive final research response. The process concludes with One Shot Report Generation, ensuring the final document is informed by a unified narrative and high fact density. Powered by the Gemini 2.5 Pro model, our Deep Researcher was evaluated on the DeepResearch Bench, a globally recognized benchmark of 100 doctoral level research tasks. Our architecture achieved an overall score of 46.21, demonstrating superior performance by surpassing leading deep research agents such as Claude Researcher, Nvidia AIQ Research Assistant, Perplexity Research, Kimi Researcher and Grok Deeper Search present on the DeepResearch Bench actively running leaderboard. This performance marginally exceeds our previous work, Static DRA, and reinforces the finding that sequential scaling consistently outperforms the parallel self consistency paradigm.
- Abstract(参考訳): 本稿では,Parallel Scalingパラダイムの本質的な制約に対処して,複雑なPhDレベルのトピックに関する詳細な研究レポートを生成するために設計された,新しいDeep Researcherアーキテクチャを提案する。
本システムでは,リフレクションによる逐次研究計画修正と候補クロスオーバーアルゴリズムという,2つの重要なイノベーションを活用している。
シーケンシャルリファインメントプロセスは、エージェントが集中したグローバルリサーチコンテキストを維持でき、現在の進捗を振り返り、研究計画について推論し、実行時に知的に変更を加えることができる効率的な方法として実証される。
この動的適応は、しばしばサイロ知識に悩まされる平行アプローチとは対照的である。
The Candidates Crossover algorithm has further further search efficiency by deploy multiple LLM candidate with various parameters to explore a larger search space, their findings synthesised to curate a comprehensive final research response。
このプロセスは、最終文書が統一された物語と高い事実密度によって通知されることを保証するOne Shot Report Generationで締めくくられる。
Gemini 2.5 Proモデルによって、私たちのDeep Researcherは、世界中の100の博士レベルの研究タスクのベンチマークであるDeepResearch Benchで評価されました。
私たちのアーキテクチャは46.21という総合的なスコアを獲得し、Claude Researcher、Nvidia AIQ Research Assistant、Perplexity Research、Kim Researcher、Grok Deeper Searchといった、DeepResearch Benchがアクティブに運営しているリーダーボードを上回り、優れたパフォーマンスを示している。
このパフォーマンスは、これまでの作業であるStatic DRAをわずかに上回り、シーケンシャルなスケーリングが並列的な自己整合パラダイムを一貫して上回っていることの発見を強化します。
関連論文リスト
- Step-DeepResearch Technical Report [90.50586290399683]
コスト効率のよいエンドツーエンドエージェントである Step-DeepResearch を紹介する。
我々は、計画とレポート作成を強化するために、アトミック能力に基づくデータ合成戦略を提案する。
中国における評価ギャップを埋めるため,現実的な深層研究シナリオのためのADR-Benchを構築した。
論文 参考訳(メタデータ) (2025-12-23T16:32:27Z) - A Hierarchical Tree-based approach for creating Configurable and Static Deep Research Agent (Static-DRA) [0.0]
本稿では,階層木に基づく静的ワークフローに基づく新しいソリューションである静的ディープリサーチエージェント(Static-DRA)を紹介する。
コアコントリビューションは、DepthとBreadthという2つのユーザチューニング可能なパラメータの統合である。
エージェントのアーキテクチャは、スーパーバイザ、インディペンデント、およびWorkerエージェントで構成され、効果的なマルチホップ情報検索を促進する。
論文 参考訳(メタデータ) (2025-12-03T15:37:13Z) - IterResearch: Rethinking Long-Horizon Agents via Markovian State Reconstruction [107.49922328855025]
IterResearchは、マルコフ決定過程として長期研究を再構築する、新しい反復的深層研究パラダイムである。
6つのベンチマークで平均+14.5ppの既存のオープンソースエージェントよりも大幅に改善されている。
これは効果的なプロンプト戦略として機能し、ロングホライゾンタスクにおけるReActよりも19.2ppのフロンティアモデルを改善する。
論文 参考訳(メタデータ) (2025-11-10T17:30:08Z) - Evolving and Executing Research Plans via Double-Loop Multi-Agent Collaboration [27.238993026036354]
本稿では, 与えられた研究課題を自動的に解決する新しいDouble-Loop Multi-Agent (DLMA) フレームワークを提案する。
リーダーループは教授エージェントで構成され、研究計画の進化に責任がある。
博士課程の学生エージェントで構成される従者ループは、最も進化した計画を実行する責任がある。
論文 参考訳(メタデータ) (2025-10-08T08:40:58Z) - FlashResearch: Real-time Agent Orchestration for Efficient Deep Research [62.03819662340356]
FlashResearchは効率的なディープリサーチのための新しいフレームワークです。
シーケンシャル処理を並列なランタイムオーケストレーションに変換する。
同等のクオリティを維持しつつ、最大5倍のスピードアップを提供できる。
論文 参考訳(メタデータ) (2025-10-02T00:15:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。