論文の概要: ScaffoldAgent: Utility-Guided Dynamic Outline Optimization for Open-Ended Deep Research
- arxiv url: http://arxiv.org/abs/2606.20122v1
- Date: Thu, 18 Jun 2026 11:47:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.829642
- Title: ScaffoldAgent: Utility-Guided Dynamic Outline Optimization for Open-Ended Deep Research
- Title(参考訳): ScaffoldAgent: オープンエンドディープリサーチのためのユーティリティガイドによる動的アウトライン最適化
- Authors: Zhibang Yang, Xinke Jiang, Yuzhen Xiao, Ruizhe Zhang, Yue Fang, XinFei Wan, Zhengxing Song, Yuxuan Liu, Yuheng Huang, Xu Chu, Junfeng Zhao, Yasha Wang,
- Abstract要約: オープンエンドディープリサーチ(OEDR)では,多ラウンド検索による知識獲得とコヒーレントなロングフォームレポートの生成が求められている。
既存のメソッドは、書き込む前にアウトラインを修正するか、ローカルなドリフトで洗練する。
OEDR のための動的アウトライン最適化フレームワーク ScaffoldAgent を提案する。
- 参考スコア(独自算出の注目度): 27.916358340708907
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Open-ended deep research (OEDR) requires systems to acquire knowledge through multi-round retrieval and generate coherent long-form reports. The outline plays a central role as a structural scaffold that coordinates retrieval, evidence organization, and generation. However, existing methods either fix the outline before writing or refine it with local heuristics, leading to scaffold drift under continuous information accumulation and delayed feedback for evaluating outline modifications. We propose ScaffoldAgent, a utility-guided dynamic outline optimization framework for OEDR. ScaffoldAgent models outline evolution as a structured decision process with three operations: Expansion, Contraction, and Revision, enabling controlled updates to the report scaffold. It further introduces a utility-guided feedback mechanism that estimates the downstream value of each outline operation from retrieval gain, structural coherence, and trial-generation quality. The resulting utility signal guides node selection, operation scheduling, and termination during inference. Experiments on DeepResearch Bench and DeepResearch Gym show that ScaffoldAgent consistently improves long-form report generation and factual grounding over existing deep research agents.
- Abstract(参考訳): オープンエンドディープリサーチ(OEDR)では,多ラウンド検索による知識獲得とコヒーレントなロングフォームレポートの生成が求められている。
アウトラインは、検索、エビデンス組織、生成を協調する構造的な足場として、中心的な役割を果たす。
しかし、既存の手法では、記述する前にアウトラインを修正したり、局所的なヒューリスティックスで洗練したりすることで、連続的な情報蓄積の下で足場を漂わせたり、アウトライン修正を評価するためにフィードバックが遅れたりする。
OEDR のための動的アウトライン最適化フレームワーク ScaffoldAgent を提案する。
ScaffoldAgentモデルは、進化を3つの操作で構造化された決定プロセスとして概説している。
さらに、検索ゲイン、構造コヒーレンス、試行錯誤品質から各アウトライン操作の下流値を推定するユーティリティ誘導フィードバック機構を導入する。
結果として生じるユーティリティ信号は、ノードの選択、操作スケジューリング、推論中の終了をガイドする。
DeepResearch BenchとDeepResearch Gymの実験によると、ScaffoldAgentは一貫して、既存のディープリサーチエージェントに対する長期的なレポート生成と事実的根拠を改善している。
関連論文リスト
- DuMate-DeepResearch: An Auditable Multi-Agent System with Recursive Search and Rubric-Grounded Reasoning [58.09293442211248]
Deep Research(DR)は、複雑でオープンな研究課題に取り組むための新しいエージェントパラダイムとして登場した。
本稿では,Qianfan Agent Foundry上に構築されたマルチエージェントDRフレームワークであるDuMate-DeepResearchを紹介する。
論文 参考訳(メタデータ) (2026-06-05T14:10:48Z) - Towards Verifiable Multimodal Deep Research: A Multi-Agent Harness for Interleaved Report Generation [74.0621258662676]
レポート生成のためのマルチエージェントハーネスであるPtahを提案する。
Ptahは計画、研究、執筆段階を通じて、ユーザクエリからレンダリングされたWebレポートまでのライフサイクルを編成する。
検証エージェントがハーネスの受け入れ機能として機能し、ワークフロー全体を通して事実的接地、引用の忠実性、相互の整合性を強制する。
論文 参考訳(メタデータ) (2026-05-28T12:40:34Z) - AgentDisCo: Towards Disentanglement and Collaboration in Open-ended Deep Research Agents [21.086121542846907]
本稿では, 逆最適化問題として深層研究を定式化する, 分散協調型エージェントアーキテクチャであるAgenDisCoを提案する。
AgentDisCoは、生成されたアウトラインの評価と検索クエリの精査に批評家エージェントと、更新された結果の検索とアウトラインの修正にジェネレータエージェントを使用する。
全体的なワークフローは、手作りと自動検出の両方の設計戦略をサポートする。
論文 参考訳(メタデータ) (2026-05-12T08:14:15Z) - RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards [76.17893114021757]
長い形式のレポートを計画し、調査し、エビデンスを評価し、合成する深層研究システムには、根本的な答えがなく、多くのツール強化された決定にまたがる。
本研究では,ルーブリックは最終回答評価者だけでなく,ポリシーの実行,判断フィードバック,エージェントメモリを構成する共有インターフェースとして機能すべきである,と論じる。
我々は、段階的な政策分解とリフレクションに基づくメタ政治進化を組み合わせたルーリック誘導強化学習フレームワークEMを導入する。
論文 参考訳(メタデータ) (2026-05-11T17:40:38Z) - ARIS: Autonomous Research via Adversarial Multi-Agent Collaboration [10.076972559007116]
ARIS(Auto-Research-in-sleep)は、自律的な研究のためのオープンソースの研究ハーネスである。
ARISは、クロスモデル対外コラボレーションを通じて機械学習の研究を調整する。
論文 参考訳(メタデータ) (2026-05-04T18:10:15Z) - NaviRAG: Towards Active Knowledge Navigation for Retrieval-Augmented Generation [50.16741209529908]
NaviRAGは、パッシブセグメント検索からアクティブな知識ナビゲーションに移行する新しいフレームワークである。
NaviRAGは従来のRAGベースラインよりも検索リコールとエンドツーエンドの応答性能を一貫して改善することを示す。
論文 参考訳(メタデータ) (2026-04-14T14:07:01Z) - FS-Researcher: Test-Time Scaling for Long-Horizon Research Tasks with File-System-Based Agents [53.03492387564392]
我々はFS-Researcherを紹介した。FS-Researcherはファイルシステムベースのフレームワークで、永続的なワークスペースを通じてコンテキストウィンドウを超えて深い研究をスケールする。
Context Builderエージェントはインターネットを閲覧し、構造化されたノートを書き、ソースを階層的な知識ベースにアーカイブする。
その後、レポートライターエージェントが最終レポートセクションをセクションごとに構成し、知識ベースを事実のソースとして扱う。
論文 参考訳(メタデータ) (2026-02-02T03:00:19Z) - WebWeaver: Structuring Web-Scale Evidence with Dynamic Outlines for Open-Ended Deep Research [73.58638285105971]
本稿では,AIエージェントが膨大なWebスケール情報を洞察に富むレポートに合成しなければならない複雑な課題であるtextbfopen-ended Deep Research (OEDR) に取り組む。
人間の研究プロセスをエミュレートする新しいデュアルエージェントフレームワークである textbfWebWeaver を紹介する。
私たちのフレームワークは、DeepResearch Bench、DeepConsult、DeepResearchGymなど、主要なOEDRベンチマークにまたがる最先端の新たなベンチマークを確立しています。
論文 参考訳(メタデータ) (2025-09-16T17:57:21Z) - Test-time Corpus Feedback: From Retrieval to RAG [21.517949407443453]
Retrieval-Augmented Generation (RAG) は知識集約型NLPタスクの標準フレームワークとして登場した。
ほとんどのRAGパイプラインは、検索と推論を独立したコンポーネントとして扱い、ドキュメントを一度取り出し、さらに相互作用することなく回答を生成する。
情報検索(IR)とNLPのコミュニティにおける最近の研究は、フィードバックを取り入れた適応的検索とランキング手法を導入して、このギャップを埋め始めている。
論文 参考訳(メタデータ) (2025-08-21T10:57:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。