論文の概要: IntPro: A Proxy Agent for Context-Aware Intent Understanding via Retrieval-conditioned Inference
- arxiv url: http://arxiv.org/abs/2603.03325v1
- Date: Tue, 10 Feb 2026 07:20:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 01:20:08.153442
- Title: IntPro: A Proxy Agent for Context-Aware Intent Understanding via Retrieval-conditioned Inference
- Title(参考訳): IntPro: 検索条件付き推論によるコンテキスト認識インテント理解のためのプロキシエージェント
- Authors: Guanming Liu, Meng Wu, Peng Zhang, Yu Zhang, Yubo Shu, Xianliang Huang, Kainan Tu, Ning Gu, Liuxin Zhang, Qianying Wang, Tun Lu,
- Abstract要約: IntProは、検索条件付きインテント推論を通じて個々のユーザへの適応を学ぶプロキシエージェントである。
IntProは、効果的なコンテキスト認識推論機能によって、パフォーマンスを強く理解することを示す。
- 参考スコア(独自算出の注目度): 22.214499732123173
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) have become integral to modern Human-AI collaboration workflows, where accurately understanding user intent serves as a crucial step for generating satisfactory responses. Context-aware intent understanding, which involves inferring user intentions from situational environments, is inherently challenging because it requires reasoning over both the immediate context and the user's underlying motivations that drive their behavior. Moreover, existing approaches often treat intent understanding as a static recognition task, overlooking users' accumulated intent patterns that could provide valuable references for more accurate and generalizable understanding. To address this gap, we propose IntPro, a proxy agent that learns to adapt to individual users via retrieval-conditioned intent inference. We design intent explanations that abstract how contextual signals connect to expressed intents, and store them in an individual intent history library for retrieval. We train IntPro through supervised fine-tuning on retrieval-conditioned trajectories and multi-turn Group Relative Policy Optimization (GRPO) with tool-aware reward functions, enabling the agent to learn when to leverage historical intent patterns and when to infer directly. Experiments across three diverse scenarios (Highlight-Intent, MIntRec2.0, and Weibo Post-Sync) demonstrate that IntPro achieves strong intent understanding performance with effective context-aware reasoning capabilities across different scenarios and model types.
- Abstract(参考訳): 大規模言語モデル(LLM)は、ユーザ意図を正確に理解することが、満足な応答を生成するための重要なステップである、現代のヒューマン-AIコラボレーションワークフローに不可欠なものになっている。
状況環境からユーザの意図を推論するコンテキスト認識の意図理解は、その振る舞いを駆動するユーザの基本的モチベーションと直近のコンテキストの両方を推論する必要があるため、本質的に困難である。
さらに、既存のアプローチでは、インテント理解を静的認識タスクとして扱うことが多く、ユーザの蓄積したインテントパターンを見渡すことで、より正確で一般化可能な理解のための貴重な参照を提供することができる。
このギャップに対処するために,検索条件付きインテント推論により個々のユーザへの適応を学習するプロキシエージェントであるIntProを提案する。
我々は、文脈的信号が表現された意図とどのように結びつくかを抽象化した意図記述を設計し、それらを個々の意図履歴ライブラリーに格納して検索する。
検索条件付きトラジェクトリの教師付き微調整とツール対応報酬関数を用いたマルチターングループ相対ポリシー最適化(GRPO)により、エージェントがいつ、いつ、いつ、いつ、いつ、直接推論するかを学習できるようにする。
さまざまなシナリオ(Highlight-Intent、MIntRec2.0、Weibo Post-Sync)にわたる実験では、IntProは、さまざまなシナリオやモデルタイプにまたがる効果的なコンテキスト認識推論機能を備えた、強力な意図的理解パフォーマンスを実現している。
関連論文リスト
- Trajectory2Task: Training Robust Tool-Calling Agents with Synthesized Yet Verifiable Data for Complex User Intents [52.30603055218294]
Trajectory2Taskは,3つの現実的なユーザシナリオの下で大規模なツール使用を研究するための,検証可能なデータ生成パイプラインである。
有効なツールコールトラジェクトリを、制御されたインテント適応を伴うユーザ向けタスクに変換する。
我々は、生成された複雑なユーザシナリオタスクに対して、7つの最先端のLCMをベンチマークし、頻繁な障害を観察する。
論文 参考訳(メタデータ) (2026-01-28T00:36:13Z) - CLEAR-KGQA: Clarification-Enhanced Ambiguity Resolution for Knowledge Graph Question Answering [13.624962763072899]
KGQAシステムは通常、ユーザクエリは曖昧であると仮定するが、これは現実世界のアプリケーションではめったに行われない仮定である。
本稿では,対話的明確化を通じて,エンティティのあいまいさ(類似した名前を持つエンティティの区別など)と意図のあいまいさ(ユーザクエリの異なる解釈を明確にするなど)を動的に扱う新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-13T17:34:35Z) - Collaborative Instance Object Navigation: Leveraging Uncertainty-Awareness to Minimize Human-Agent Dialogues [54.81155589931697]
協調インスタンスオブジェクトナビゲーション(CoIN)は、エージェントがターゲットインスタンスに関する不確実性を積極的に解決する新しいタスク設定である。
未認識者に対するエージェント・ユーザインタラクション(AIUTA)の新たな学習自由化手法を提案する。
まず、オブジェクト検出時に、セルフクエチオナーモデルがエージェント内で自己対話を開始し、完全かつ正確な観察記述を得る。
インタラクショントリガーモジュールは、人間に質問するか、継続するか、ナビゲーションを停止するかを決定する。
論文 参考訳(メタデータ) (2024-12-02T08:16:38Z) - Spatio-Temporal Context Prompting for Zero-Shot Action Detection [13.22912547389941]
本稿では,視覚言語モデルの豊富な知識を効果的に活用し,対人インタラクションを実現する手法を提案する。
同時に複数の人物による異なる行動を認識するという課題に対処するために,興味あるトークンスポッティング機構を設計する。
提案手法は,従来の手法に比べて優れた結果を得ることができ,さらにマルチアクションビデオに拡張することができる。
論文 参考訳(メタデータ) (2024-08-28T17:59:05Z) - Frontend Diffusion: Exploring Intent-Based User Interfaces through Abstract-to-Detailed Task Transitions [1.845645938093348]
ユーザスケッチから高品質なWebサイトを生成するエンドツーエンドツールであるFrontend Diffusionを紹介した。
複雑なタスクにおける人的介入やコミュニケーションコストを低減するために,タスク遷移の可能性を示す。
論文 参考訳(メタデータ) (2024-07-16T20:24:35Z) - Tell Me More! Towards Implicit User Intention Understanding of Language
Model Driven Agents [110.25679611755962]
現在の言語モデル駆動エージェントは、しばしば効果的なユーザ参加のメカニズムを欠いている。
Intention-in-Interaction (IN3) は明示的なクエリを通してユーザの暗黙の意図を検査するための新しいベンチマークである。
私たちは、タスクの曖昧さを積極的に評価し、ユーザの意図を問う強力なモデルであるMistral-Interactを経験的に訓練し、それらを実行可能な目標へと洗練させます。
論文 参考訳(メタデータ) (2024-02-14T14:36:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。