論文の概要: RECAP: REwriting Conversations for Intent Understanding in Agentic Planning
- arxiv url: http://arxiv.org/abs/2509.04472v1
- Date: Fri, 29 Aug 2025 20:45:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-08 14:27:25.308104
- Title: RECAP: REwriting Conversations for Intent Understanding in Agentic Planning
- Title(参考訳): RECAP:エージェントプランニングにおけるインテント理解のための会話の書き直し
- Authors: Kushan Mitra, Dan Zhang, Hannah Kim, Estevam Hruschka,
- Abstract要約: 現実世界の対話は曖昧、不明確、動的であることが多い。
従来の分類に基づくアプローチは、オープンな設定で一般化するのに苦労する。
提案するRECAPは,意図の書き直しを評価・進めるための新しいベンチマークである。
- 参考スコア(独自算出の注目度): 14.28070179801169
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding user intent is essential for effective planning in conversational assistants, particularly those powered by large language models (LLMs) coordinating multiple agents. However, real-world dialogues are often ambiguous, underspecified, or dynamic, making intent detection a persistent challenge. Traditional classification-based approaches struggle to generalize in open-ended settings, leading to brittle interpretations and poor downstream planning. We propose RECAP (REwriting Conversations for Agent Planning), a new benchmark designed to evaluate and advance intent rewriting, reframing user-agent dialogues into concise representations of user goals. RECAP captures diverse challenges such as ambiguity, intent drift, vagueness, and mixed-goal conversations. Alongside the dataset, we introduce an LLM-based evaluator that assesses planning utility given the rewritten intent. Using RECAP, we develop a prompt-based rewriting approach that outperforms baselines. We further demonstrate that fine-tuning two DPO-based rewriters yields additional utility gains. Our results highlight intent rewriting as a critical and tractable component for improving agent planning in open-domain dialogue systems.
- Abstract(参考訳): ユーザ意図を理解することは、会話アシスタント、特に複数のエージェントをコーディネートする大規模言語モデル(LLM)を利用した効果的なプランニングに不可欠である。
しかし、現実世界の対話はしばしば曖昧で、仕様が不明確で、動的であり、意図の検出は永続的な課題である。
従来の分類に基づくアプローチは、オープンエンドな設定での一般化に苦慮し、不安定な解釈と下流の計画に繋がる。
本稿では,RECAP(Rewriting Conversations for Agent Planning)を提案する。
RECAPは曖昧さ、意図の漂流、曖昧さ、混合目標の会話といった様々な課題を捉えている。
データセットの他に、書き換え意図から計画ユーティリティを評価するLCMベースの評価器を導入する。
RECAPを用いて,ベースラインよりも優れたプロンプトベースの書き換え手法を開発した。
さらに、微調整された2つのDPOベースの書き換え器は、さらなるユーティリティーゲインをもたらすことを実証する。
本研究は,オープンドメイン対話システムにおけるエージェント計画の改善のための重要かつトラクタブルなコンポーネントとして,インテント書き換えを強調した。
関連論文リスト
- ChatSOP: An SOP-Guided MCTS Planning Framework for Controllable LLM Dialogue Agents [52.7201882529976]
対話エージェントの制御性を高めるため,SOP誘導モンテカルロ木探索(MCTS)計画フレームワークを提案する。
これを実現するために、GPT-4oを用いた半自動ロールプレイシステムを用いて、SOPアノテーション付きマルチシナリオ対話からなるデータセットをキュレートする。
また、SOP予測のための教師付き微調整と思考の連鎖推論を統合する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-07-04T12:23:02Z) - Ask-before-Plan: Proactive Language Agents for Real-World Planning [68.08024918064503]
プロアクティブエージェントプランニングでは、ユーザエージェントの会話とエージェント環境のインタラクションに基づいて、言語エージェントが明確化のニーズを予測する必要がある。
本稿では,明確化,実行,計画の3つのエージェントからなる新しいマルチエージェントフレームワーク,Clarification-Execution-Planning(textttCEP)を提案する。
論文 参考訳(メタデータ) (2024-06-18T14:07:28Z) - Unsupervised End-to-End Task-Oriented Dialogue with LLMs: The Power of the Noisy Channel [9.082443585886127]
タスク指向の対話システムは一般的に、APIと対話するためにターンレベルのアノテーションを必要とする。
ラベルなしデータとスキーマ定義は、完全に教師なしの作業タスク指向対話システムを構築するのに十分である。
本稿では,ターンレベルのアノテーションを潜在変数として推論する予測最大化(EM)を用いた革新的なアプローチを提案する。
論文 参考訳(メタデータ) (2024-04-23T16:51:26Z) - Tell Me More! Towards Implicit User Intention Understanding of Language
Model Driven Agents [110.25679611755962]
現在の言語モデル駆動エージェントは、しばしば効果的なユーザ参加のメカニズムを欠いている。
Intention-in-Interaction (IN3) は明示的なクエリを通してユーザの暗黙の意図を検査するための新しいベンチマークである。
私たちは、タスクの曖昧さを積極的に評価し、ユーザの意図を問う強力なモデルであるMistral-Interactを経験的に訓練し、それらを実行可能な目標へと洗練させます。
論文 参考訳(メタデータ) (2024-02-14T14:36:30Z) - Target-Guided Dialogue Response Generation Using Commonsense and Data
Augmentation [32.764356638437214]
ターゲット誘導応答生成のための新しい手法を提案する。
また,既存の対話データセットをターゲット誘導生成のために再利用する手法を提案する。
我々の作業は、一般的に、対話システムの設計者が、システムが生み出す会話をより制御できるようにします。
論文 参考訳(メタデータ) (2022-05-19T04:01:40Z) - Improved Goal Oriented Dialogue via Utterance Generation and Look Ahead [5.062869359266078]
ディープテキスト・トゥ・テキスト・ニューラルモデルをトレーニングし、ラベルなし対話データから連続したユーザ発話を生成することにより、インテント予測を改善することができる。
本稿では,ユーザの発話生成を用いて意図予測を時間内に改善する新しいルックアヘッド手法を提案する。
論文 参考訳(メタデータ) (2021-10-24T11:12:48Z) - Structural Pre-training for Dialogue Comprehension [51.215629336320305]
本稿では,SPIDER, Structure Pre-trained DialoguE Readerについて述べる。
対話のような特徴をシミュレートするために,元のLM目的に加えて,2つの訓練目標を提案する。
広く使われている対話ベンチマークの実験結果から,新たに導入した自己教師型タスクの有効性が検証された。
論文 参考訳(メタデータ) (2021-05-23T15:16:54Z) - Personalized Query Rewriting in Conversational AI Agents [7.086654234990377]
本稿では,ユーザの歴史的に成功したインタラクションをメモリとして活用し,クエリ書き換え手法を提案する。
ニューラルネットワークモデルとポインタジェネレータネットワークに階層的な注意を払い、上述したユーザ記憶を用いたクエリ書き換えタスクにおいて、より優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2020-11-09T20:45:39Z) - Generalizable and Explainable Dialogue Generation via Explicit Action
Learning [33.688270031454095]
条件付き応答生成は、タスク完了と言語品質を最適化するための効果的なアプローチとして機能する。
潜在行動学習は、各発話を潜在表現にマッピングするために導入される。
このアプローチはトレーニングデータに過度に依存する傾向があるため、一般化能力は制限される。
提案手法は、ベンチマークマルチドメインデータセットであるMultiWOZにおいて、潜在アクションベースラインよりも優れている。
論文 参考訳(メタデータ) (2020-10-08T04:37:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。