論文の概要: An Interactive Paradigm for Deep Research
- arxiv url: http://arxiv.org/abs/2605.24266v1
- Date: Fri, 22 May 2026 22:37:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:17.835512
- Title: An Interactive Paradigm for Deep Research
- Title(参考訳): ディープリサーチのためのインタラクティブパラダイム
- Authors: Lin Ai, Victor S. Bursztyn, Xiang Chen, Julia Hirschberg, Saayan Mitra,
- Abstract要約: Steerable deEp Research のフレームワークである SteER について述べる。
それぞれの決定ポイントにおいて、SteERはコストベネフィットの定式化を使用して、ユーザの入力を一時停止するか、あるいは自律的に進行するかを決定する。
最先端のオープンソースとプロプライエタリなベースラインを最大で22.80%向上させ、幅やバランスなどの品質指標を導き、対のアライメント判断の85%以上でヒトの読者に好まれる。
- 参考スコア(独自算出の注目度): 19.845800516571188
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recent advances in large language models (LLMs) have enabled deep research systems that synthesize comprehensive, report-style answers to open-ended queries by combining retrieval, reasoning, and generation. Yet most frameworks rely on rigid workflows with one-shot scoping and long autonomous runs, offering little room for course correction if user intent shifts mid-process. We present SteER, a framework for Steerable deEp Research that introduces interpretable, mid-process control into long-horizon research workflows. At each decision point, SteER uses a cost-benefit formulation to determine whether to pause for user input or to proceed autonomously. It combines diversity-aware planning with utility signals that reward alignment, novelty, and coverage, and maintains a live persona model that evolves throughout the session. SteER outperforms state-of-the-art open-source and proprietary baselines by up to 22.80\% on alignment, leads on quality metrics such as breadth and balance, and is preferred by human readers in 85\%+ of pairwise alignment judgments. We also introduce a persona-query benchmark and data-generation pipeline. To our knowledge, this is the first work to advance deep research with an interactive, interpretable control paradigm, paving the way for controllable, user-aligned agents in long-form tasks.
- Abstract(参考訳): 大規模言語モデル(LLM)の最近の進歩により、検索、推論、生成を組み合わせることで、包括的なレポートスタイルの回答をオープンなクエリに合成するディープリサーチシステムを実現している。
しかし、ほとんどのフレームワークは、ワンショットのスコープと長時間の自律実行を備えた厳格なワークフローに依存しており、ユーザの意図がプロセスの途中でシフトした場合のコース修正の余地はほとんどない。
Steerable deEp Research のフレームワークである SteER について述べる。
それぞれの決定ポイントにおいて、SteERはコストベネフィットの定式化を使用して、ユーザの入力を一時停止するか、あるいは自律的に進行するかを決定する。
多様性を意識した計画と、アライメント、ノベルティ、カバレッジに報いるユーティリティシグナルを組み合わせることで、セッションを通じて進化するライブペルソナモデルを維持する。
SteERは、最先端のオープンソースとプロプライエタリのベースラインを最大22.80 %のアライメントで上回り、幅やバランスなどの品質指標を導き、85 %以上のペアアライメント判断でヒトの読者に好まれる。
また、ペルソナクエリベンチマークとデータ生成パイプラインも導入する。
我々の知る限り、これは対話的で解釈可能な制御パラダイムで深い研究を進め、長期的タスクにおける制御可能なユーザー整合エージェントへの道を開く最初の試みである。
関連論文リスト
- Personalized Deep Research: A User-Centric Framework, Dataset, and Hybrid Evaluation for Knowledge Discovery [36.57361069825463]
動的ユーザコンテキストをコア検索・推論ループに統合するPDR(Personalized Deep Research)を導入する。
PDRは、ユーザープロファイルモデリングを反復的なクエリ開発、二重ステージ(プライベート/パブリック)検索、コンテキスト認識合成と統合する。
これにより、研究サブゴールとユーザの意図を自律的に調整し、エビデンス収集の停止基準を最適化することができる。
論文 参考訳(メタデータ) (2026-05-11T13:14:54Z) - Deep Research for Recommender Systems [74.44288812684448]
本稿では,従来の項目リストを包括的,ユーザ中心のレポートに置き換える,推薦のための新しいディープリサーチパラダイムを提案する。
我々はこのパラダイムをRecPilotという,項目空間を自律的に探索するユーザトラジェクトリシミュレーションエージェントと,ユーザ決定を支援するための一貫性のある解釈可能なレポートに合成する自己進化レポート生成エージェントという,2つのコアコンポーネントからなるマルチエージェントフレームワークを通じてインスタンス化する。
論文 参考訳(メタデータ) (2026-03-08T12:33:04Z) - AgentCPM-Report: Interleaving Drafting and Deepening for Open-Ended Deep Research [85.51475655916026]
AgentCPM-Reportは軽量だが高性能なローカルソリューションで、人間の記述プロセスを反映したフレームワークで構成されている。
我々のフレームワークは、モデルがアウトラインを動的に修正できるWARP(Writeing As Reasoning Policy)を使用している。
DeepResearch Bench、DeepConsult、DeepResearch Gymの実験は、AgentCPM-Reportが主要なクローズドソースシステムより優れていることを示した。
論文 参考訳(メタデータ) (2026-02-06T09:45:04Z) - IntentRL: Training Proactive User-intent Agents for Open-ended Deep Research via Reinforcement Learning [54.21689544323704]
Deep Research (DR)エージェントは、パラメトリック知識を超えてLarge Language Models (LLM)を拡張する。
リアルタイムの会話アシスタントとは異なり、DRは計算に高価で時間を要する。
IntentRLは、長期研究を始める前に、潜在ユーザ意図を明らかにするためにプロアクティブエージェントを訓練するフレームワークである。
論文 参考訳(メタデータ) (2026-02-03T12:43:09Z) - A Hierarchical Tree-based approach for creating Configurable and Static Deep Research Agent (Static-DRA) [0.0]
本稿では,階層木に基づく静的ワークフローに基づく新しいソリューションである静的ディープリサーチエージェント(Static-DRA)を紹介する。
コアコントリビューションは、DepthとBreadthという2つのユーザチューニング可能なパラメータの統合である。
エージェントのアーキテクチャは、スーパーバイザ、インディペンデント、およびWorkerエージェントで構成され、効果的なマルチホップ情報検索を促進する。
論文 参考訳(メタデータ) (2025-12-03T15:37:13Z) - SelfAI: Building a Self-Training AI System with LLM Agents [79.10991818561907]
SelfAIは、高レベルの研究目的を標準化された実験構成に変換するためのUser Agentを組み合わせた、一般的なマルチエージェントプラットフォームである。
実験マネージャは、連続的なフィードバックのための構造化知識ベースを維持しながら、異種ハードウェアをまたいだ並列かつフォールトトレラントなトレーニングを編成する。
回帰、コンピュータビジョン、科学計算、医用画像、薬物発見ベンチマークなどを通じて、SelfAIは一貫して高いパフォーマンスを達成し、冗長な試行を減らしている。
論文 参考訳(メタデータ) (2025-11-29T09:18:39Z) - SFR-DeepResearch: Towards Effective Reinforcement Learning for Autonomously Reasoning Single Agents [93.26456498576181]
本稿では,ディープリサーチのためのネイティブ自律単エージェントモデルの開発に焦点をあてる。
我々の最良の変種であるSFR-DR-20Bは、HumanityのLast Examベンチマークで28.7%に達する。
論文 参考訳(メタデータ) (2025-09-08T02:07:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。