論文の概要: The PROPER Approach to Proactivity: Benchmarking and Advancing Knowledge Gap Navigation
- arxiv url: http://arxiv.org/abs/2601.09926v2
- Date: Fri, 16 Jan 2026 05:43:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-19 14:30:44.053034
- Title: The PROPER Approach to Proactivity: Benchmarking and Advancing Knowledge Gap Navigation
- Title(参考訳): Proactive に対する ProPER アプローチ:知識ギャップナビゲーションのベンチマークと改善
- Authors: Kirandeep Kaur, Vinayak Gupta, Aditya Gupta, Chirag Shah,
- Abstract要約: ほとんどの言語ベースのアシスタントはリアクティブなQ&Aパラダイムに従っており、ユーザは自身のニーズを明示的に表現する必要がある。
次元生成エージェント(DGA)と応答生成エージェント(RGA)を組み合わせた新しい2エージェントアーキテクチャであるProPerを紹介する。
RGAは明示的および暗黙的な次元のバランスをとり、タイムリーかつ積極的な介入でパーソナライズされた応答を調整する。
以上の結果から,ProPerはすべての領域における品質スコアと勝利率を改善し,シングルターン評価において最大84%,マルチターンインタラクションにおいて一貫した優位性を実現した。
- 参考スコア(独自算出の注目度): 17.97529450470058
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Most language-based assistants follow a reactive ask-and-respond paradigm, requiring users to explicitly state their needs. As a result, relevant but unexpressed needs often go unmet. Existing proactive agents attempt to address this gap either by eliciting further clarification, preserving this burden, or by extrapolating future needs from context, often leading to unnecessary or mistimed interventions. We introduce ProPer, Proactivity-driven Personalized agents, a novel two-agent architecture consisting of a Dimension Generating Agent (DGA) and a Response Generating Agent (RGA). DGA, a fine-tuned LLM agent, leverages explicit user data to generate multiple implicit dimensions (latent aspects relevant to the user's task but not considered by the user) or knowledge gaps. These dimensions are selectively filtered using a reranker based on quality, diversity, and task relevance. RGA then balances explicit and implicit dimensions to tailor personalized responses with timely and proactive interventions. We evaluate ProPer across multiple domains using a structured, gap-aware rubric that measures coverage, initiative appropriateness, and intent alignment. Our results show that ProPer improves quality scores and win rates across all domains, achieving up to 84% gains in single-turn evaluation and consistent dominance in multi-turn interactions.
- Abstract(参考訳): ほとんどの言語ベースのアシスタントはリアクティブなQ&Aパラダイムに従っており、ユーザは自身のニーズを明確に表現する必要がある。
結果として、関連性はあるものの、表現されていないニーズはしばしば無意味になる。
既存の活動的エージェントは、さらなる明確化を導き、この負担を保ち、あるいは将来のニーズを文脈から外挿することでこのギャップに対処しようとする。
本稿では,ProPer,Proactive-driven Personalized Agent,DGA(Dimension Generating Agent)とRGA(Re Response Generating Agent)を組み合わせた新しい2エージェントアーキテクチャを紹介する。
微調整のLLMエージェントであるDGAは、明示的なユーザデータを利用して、複数の暗黙の次元(ユーザのタスクに関連するが、ユーザによっては考慮されていない)や知識ギャップを生成する。
これらの次元は、品質、多様性、タスク関連性に基づいて、リランカを使用して選択的にフィルタリングされる。
RGAは明示的および暗黙的な次元のバランスをとり、タイムリーかつ積極的な介入でパーソナライズされた応答を調整する。
ProPerは複数のドメインにまたがって,カバー範囲,イニシアティブの適切性,意図のアライメントを計測する,構造化されたギャップ対応ルーブリックを用いて評価する。
以上の結果から,ProPerはすべての領域における品質スコアと勝利率を改善し,シングルターン評価において最大84%,マルチターンインタラクションにおいて一貫した優位性を実現した。
関連論文リスト
- MAC: A Multi-Agent Framework for Interactive User Clarification in Multi-turn Conversations [46.70182219204539]
本稿では,ユーザのあいまいさを解決するための対話型マルチエージェントフレームワークを提案する。
MultiWOZ 2.4の実証的な評価は、両レベルでの明確化がタスク成功率7.8%(54.5~62.3)を増加させ、必要なユーザ情報を事前に抽出し、繰り返しを最小化することで、対話のターン数(6.53~4.86)を減少させることを示した。
論文 参考訳(メタデータ) (2025-12-15T10:02:50Z) - Adaptive Multi-Agent Response Refinement in Conversational Systems [33.2240994465021]
大規模言語モデル (LLM) は人間のような応答を生成することで会話システムにおいて顕著な成功を収めた。
特にパーソナライズや特定の知識を考慮に入れる必要がある場合、それらは不足する可能性がある。
本稿では,各エージェントが各アスペクトに対して特定の役割を割り当てられるマルチエージェントフレームワークによる応答の精細化を提案する。
論文 参考訳(メタデータ) (2025-11-11T14:48:34Z) - Interactive Agents to Overcome Ambiguity in Software Engineering [61.40183840499932]
AIエージェントは、あいまいで不明確なユーザー指示に基づいて、タスクを自動化するためにますますデプロイされている。
不安定な仮定をし、明確な質問をしないことは、最適以下の結果につながる可能性がある。
対話型コード生成設定において,LLMエージェントが不明瞭な命令を処理する能力について,プロプライエタリモデルとオープンウェイトモデルを評価して検討する。
論文 参考訳(メタデータ) (2025-02-18T17:12:26Z) - Towards more Contextual Agents: An extractor-Generator Optimization Framework [0.0]
LLM(Large Language Model)ベースのエージェントは、幅広い汎用アプリケーションにわたる複雑なタスクの解決に顕著な成功を収めている。
しかしながら、それらのパフォーマンスは、専門産業や研究領域のようなコンテキスト固有のシナリオで劣化することが多い。
この課題に対処するため,本研究では,LLMエージェントの文脈適応性を高めるための体系的アプローチを提案する。
論文 参考訳(メタデータ) (2025-02-18T15:07:06Z) - Divide-and-Conquer: Tree-structured Strategy with Answer Distribution Estimator for Goal-Oriented Visual Dialogue [30.126882554391837]
Answer Distribution Estimator(TSADE)を用いた樹木構造戦略
本稿では,現在の候補オブジェクトの半数を各ラウンドで除外することで,質問生成をガイドする木構造戦略(TSADE)を提案する。
提案手法は,従来のエルゴディックな質問生成手法と比較して,繰り返し質問やラウンドの少ないタスク指向の精度をエージェントが達成できることを実験的に実証する。
論文 参考訳(メタデータ) (2025-02-09T08:16:09Z) - Improving Retrieval-Augmented Generation through Multi-Agent Reinforcement Learning [88.55095746156428]
Retrieval-augmented Generation (RAG) は、外部知識を大規模言語モデルに組み込むために広く利用されている。
標準的なRAGパイプラインは、クエリ書き換え、文書検索、文書フィルタリング、回答生成など、いくつかのコンポーネントで構成されている。
本稿では,複数コンポーネントからなる複雑なRAGパイプラインを多エージェント協調作業として扱うことを提案する。
論文 参考訳(メタデータ) (2025-01-25T14:24:50Z) - ELOQ: Resources for Enhancing LLM Detection of Out-of-Scope Questions [52.33835101586687]
本研究では,検索した文書が意味的に類似しているように見えるスコープ外質問について検討するが,答えるために必要な情報がない。
本稿では,閉経後の文書から多様なスコープ外質問を自動的に生成するための,幻覚に基づくELOQを提案する。
論文 参考訳(メタデータ) (2024-10-18T16:11:29Z) - Towards Human-Level Understanding of Complex Process Engineering Schematics: A Pedagogical, Introspective Multi-Agent Framework for Open-Domain Question Answering [0.0]
化学・プロセス産業では、プロセス・フロー・ダイアグラム(PFD)とパイプ・アンド・インスツルメンテーション・ダイアグラム(P&ID)が設計、建設、保守に不可欠である。
生成型AIの最近の進歩は、ビジュアル質問回答(VQA)のプロセス図の理解と解釈の約束を示している。
本稿では,階層的かつマルチエージェントなRetrieval Augmented Generation(RAG)フレームワークを用いた,セキュアでオンプレミスなエンタープライズソリューションを提案する。
論文 参考訳(メタデータ) (2024-08-24T19:34:04Z) - Tell Me More! Towards Implicit User Intention Understanding of Language
Model Driven Agents [110.25679611755962]
現在の言語モデル駆動エージェントは、しばしば効果的なユーザ参加のメカニズムを欠いている。
Intention-in-Interaction (IN3) は明示的なクエリを通してユーザの暗黙の意図を検査するための新しいベンチマークである。
私たちは、タスクの曖昧さを積極的に評価し、ユーザの意図を問う強力なモデルであるMistral-Interactを経験的に訓練し、それらを実行可能な目標へと洗練させます。
論文 参考訳(メタデータ) (2024-02-14T14:36:30Z) - Self-RAG: Learning to Retrieve, Generate, and Critique through
Self-Reflection [74.51523859064802]
我々は、自己回帰検索拡張生成(Self-RAG)と呼ばれる新しいフレームワークを導入する。
自己RAGは、検索と自己回帰によってLMの品質と事実性を高める。
様々なタスクセットにおいて、最先端のLCMや検索強化モデルよりも大幅に優れています。
論文 参考訳(メタデータ) (2023-10-17T18:18:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。