論文の概要: Deep Researcher with Sequential Plan Reflection and Candidates Crossover (Deep Researcher Reflect Evolve)
- arxiv url: http://arxiv.org/abs/2601.20843v1
- Date: Wed, 28 Jan 2026 18:45:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-29 15:46:07.098875
- Title: Deep Researcher with Sequential Plan Reflection and Candidates Crossover (Deep Researcher Reflect Evolve)
- Title(参考訳): 逐次計画反射と候補交叉による深部研究員(深部研究員反射運動)
- Authors: Saurav Prateek,
- Abstract要約: 本稿では、複雑なPhDレベルのトピックに関する詳細な研究レポートを作成するために設計された、新しいDeep Researcherアーキテクチャを提案する。
本システムでは,リフレクションによる逐次研究計画修正と候補クロスオーバーアルゴリズムという,2つの重要なイノベーションを活用している。
我々の建築は46.21点を達成し、先進的な深層研究エージェントを超越して優れた性能を示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper introduces a novel Deep Researcher architecture designed to generate detailed research reports on complex PhD level topics by addressing the inherent limitations of the Parallel Scaling paradigm. Our system utilizes two key innovations: Sequential Research Plan Refinement via Reflection and a Candidates Crossover algorithm. The sequential refinement process is demonstrated as an efficient method that allows the agent to maintain a centralized Global Research Context, enabling it to look back at current progress, reason about the research plan, and intelligently make changes at runtime. This dynamic adaptation contrasts with parallel approaches, which often suffer from siloed knowledge. The Candidates Crossover algorithm further enhances search efficiency by deploying multiple LLM candidates with varied parameters to explore a larger search space, with their findings synthesized to curate a comprehensive final research response. The process concludes with One Shot Report Generation, ensuring the final document is informed by a unified narrative and high fact density. Powered by the Gemini 2.5 Pro model, our Deep Researcher was evaluated on the DeepResearch Bench, a globally recognized benchmark of 100 doctoral level research tasks. Our architecture achieved an overall score of 46.21, demonstrating superior performance by surpassing leading deep research agents such as Claude Researcher, Nvidia AIQ Research Assistant, Perplexity Research, Kimi Researcher and Grok Deeper Search present on the DeepResearch Bench actively running leaderboard. This performance marginally exceeds our previous work, Static DRA, and reinforces the finding that sequential scaling consistently outperforms the parallel self consistency paradigm.
- Abstract(参考訳): 本稿では,Parallel Scalingパラダイムの本質的な制約に対処して,複雑なPhDレベルのトピックに関する詳細な研究レポートを生成するために設計された,新しいDeep Researcherアーキテクチャを提案する。
本システムでは,リフレクションによる逐次研究計画修正と候補クロスオーバーアルゴリズムという,2つの重要なイノベーションを活用している。
シーケンシャルリファインメントプロセスは、エージェントが集中したグローバルリサーチコンテキストを維持でき、現在の進捗を振り返り、研究計画について推論し、実行時に知的に変更を加えることができる効率的な方法として実証される。
この動的適応は、しばしばサイロ知識に悩まされる平行アプローチとは対照的である。
The Candidates Crossover algorithm has further further search efficiency by deploy multiple LLM candidate with various parameters to explore a larger search space, their findings synthesised to curate a comprehensive final research response。
このプロセスは、最終文書が統一された物語と高い事実密度によって通知されることを保証するOne Shot Report Generationで締めくくられる。
Gemini 2.5 Proモデルによって、私たちのDeep Researcherは、世界中の100の博士レベルの研究タスクのベンチマークであるDeepResearch Benchで評価されました。
私たちのアーキテクチャは46.21という総合的なスコアを獲得し、Claude Researcher、Nvidia AIQ Research Assistant、Perplexity Research、Kim Researcher、Grok Deeper Searchといった、DeepResearch Benchがアクティブに運営しているリーダーボードを上回り、優れたパフォーマンスを示している。
このパフォーマンスは、これまでの作業であるStatic DRAをわずかに上回り、シーケンシャルなスケーリングが並列的な自己整合パラダイムを一貫して上回っていることの発見を強化します。
関連論文リスト
- Search More, Think Less: Rethinking Long-Horizon Agentic Search for Efficiency and Generalization [64.61432234404276]
emphSearch More, Think Less (SMTL) は、効率性と一般化の両方をターゲットとした長期エージェント検索のためのフレームワークである。
我々は、教師付き微調整と強化学習を用いてエンドツーエンドエージェントを訓練し、ベンチマーク全体にわたって、強固で頻繁なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2026-02-26T06:46:41Z) - Step-DeepResearch Technical Report [90.50586290399683]
コスト効率のよいエンドツーエンドエージェントである Step-DeepResearch を紹介する。
我々は、計画とレポート作成を強化するために、アトミック能力に基づくデータ合成戦略を提案する。
中国における評価ギャップを埋めるため,現実的な深層研究シナリオのためのADR-Benchを構築した。
論文 参考訳(メタデータ) (2025-12-23T16:32:27Z) - A Hierarchical Tree-based approach for creating Configurable and Static Deep Research Agent (Static-DRA) [0.0]
本稿では,階層木に基づく静的ワークフローに基づく新しいソリューションである静的ディープリサーチエージェント(Static-DRA)を紹介する。
コアコントリビューションは、DepthとBreadthという2つのユーザチューニング可能なパラメータの統合である。
エージェントのアーキテクチャは、スーパーバイザ、インディペンデント、およびWorkerエージェントで構成され、効果的なマルチホップ情報検索を促進する。
論文 参考訳(メタデータ) (2025-12-03T15:37:13Z) - DR Tulu: Reinforcement Learning with Evolving Rubrics for Deep Research [152.2148664328137]
ディープ・リサーチ・モデルは、多段階の研究を行い、長文でよく理解された回答を生成する。
ほとんどのオープンディープリサーチモデルは、検証可能な報酬を伴う強化学習を通じて、短い形式のQAタスクで訓練されている。
我々は、オープンエンドで長期のディープリサーチのために直接訓練された最初のオープンモデルであるDeep Research Tulu (DR Tulu-8B)を開発した。
論文 参考訳(メタデータ) (2025-11-24T18:35:54Z) - Deep Research: A Systematic Survey [118.82795024422722]
Deep Research (DR)は、大規模言語モデルの推論能力と検索エンジンなどの外部ツールを組み合わせることを目的としている。
本調査は,深層研究システムの包括的かつ体系的な概要を提示する。
論文 参考訳(メタデータ) (2025-11-24T15:28:28Z) - IterResearch: Rethinking Long-Horizon Agents via Markovian State Reconstruction [107.49922328855025]
IterResearchは、マルコフ決定過程として長期研究を再構築する、新しい反復的深層研究パラダイムである。
6つのベンチマークで平均+14.5ppの既存のオープンソースエージェントよりも大幅に改善されている。
これは効果的なプロンプト戦略として機能し、ロングホライゾンタスクにおけるReActよりも19.2ppのフロンティアモデルを改善する。
論文 参考訳(メタデータ) (2025-11-10T17:30:08Z) - Evolving and Executing Research Plans via Double-Loop Multi-Agent Collaboration [27.238993026036354]
本稿では, 与えられた研究課題を自動的に解決する新しいDouble-Loop Multi-Agent (DLMA) フレームワークを提案する。
リーダーループは教授エージェントで構成され、研究計画の進化に責任がある。
博士課程の学生エージェントで構成される従者ループは、最も進化した計画を実行する責任がある。
論文 参考訳(メタデータ) (2025-10-08T08:40:58Z) - FlashResearch: Real-time Agent Orchestration for Efficient Deep Research [62.03819662340356]
FlashResearchは効率的なディープリサーチのための新しいフレームワークです。
シーケンシャル処理を並列なランタイムオーケストレーションに変換する。
同等のクオリティを維持しつつ、最大5倍のスピードアップを提供できる。
論文 参考訳(メタデータ) (2025-10-02T00:15:39Z) - Deep Research: A Survey of Autonomous Research Agents [33.96146020332329]
大規模言語モデル(LLM)の急速な進歩は、複雑なタスクを自律的に実行可能なエージェントシステムの開発を促している。
これらの制約を克服するため、深層研究のパラダイムが提案され、エージェントは、Webベースの証拠に根ざした包括的で忠実な分析レポートを生成するために、計画、検索、合成に積極的に従事する。
本稿では,計画,質問開発,Web探索,レポート生成の4段階からなるディープリサーチパイプラインの体系的概要について述べる。
論文 参考訳(メタデータ) (2025-08-18T09:26:14Z) - Deep Researcher with Test-Time Diffusion [32.375428487905104]
実験時間拡散深層研究者は拡散過程として研究報告の生成を概念化する。
ドラフト中心のデザインは、レポート作成プロセスをよりタイムリーで一貫性のあるものにします。
我々のTTD-DRは、幅広いベンチマークで最先端の結果が得られることを実証する。
論文 参考訳(メタデータ) (2025-07-21T21:23:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。