論文の概要: Proactive Instance Navigation with Comparative Judgment for Ambiguous User Queries
- arxiv url: http://arxiv.org/abs/2605.06223v2
- Date: Fri, 08 May 2026 13:20:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 16:31:23.133098
- Title: Proactive Instance Navigation with Comparative Judgment for Ambiguous User Queries
- Title(参考訳): 曖昧なユーザクエリに対する比較判断を用いたアクティブなインスタンスナビゲーション
- Authors: Junhyuk Kwon, Seungjoon Lee, Hyejin Park, Kyle Min, Jungseul Ok,
- Abstract要約: 比較判断(ProCompNav)を用いた能動型インスタンスナビゲーションを提案する。
ProCompNavはまず候補プールを構築し、比較判定によってターゲットを識別する。
CoIN-Benchでは、ProCompNavはインタラクティブなベースラインよりも、最小限の入力と非インタラクティブなベースラインを詳細な説明で改善する。
- 参考スコア(独自算出の注目度): 24.694719593521594
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Natural-language instance navigation becomes challenging when the initial user request does not uniquely specify the target instance. A practical agent should reduce the user's burden by actively asking only the information needed to distinguish the target from similar distractors, rather than requiring a detailed description upfront. Existing approaches often fall short of this goal: they may stop at the first plausible candidate before sufficiently exploring alternatives, or, even after collecting multiple candidates, ask about the target's attributes derived from individual candidates rather than questions selected to distinguish candidates in the pool. As a result, despite the dialogue, the agent may still fail to distinguish the target from distractors, leading to premature decisions and lengthy user responses. We propose Proactive Instance Navigation with Comparative Judgment (ProCompNav), a two-stage framework that first constructs a candidate pool and then identifies the target through comparative judgment. At each round, ProCompNav extracts an attribute-value pair that splits the current pool, asks a binary yes/no question, and prunes all inconsistent candidates at once. This reframes disambiguation from open-ended target description to pool-level discriminative questioning, where each question is chosen to narrow the candidate set. On CoIN-Bench, ProCompNav improves Success Rate over interactive baselines with the same minimal input and non-interactive baselines with detailed descriptions, while substantially reducing Response Length. ProCompNav also achieves state-of-the-art Success Rate on TextNav, suggesting that comparative judgment is broadly useful for instance-level navigation among similar distractors.
- Abstract(参考訳): 自然言語のインスタンスナビゲーションは、初期ユーザ要求がターゲットインスタンスをユニークに指定していない場合に困難になる。
具体的エージェントは、詳細な説明を事前に必要とせず、ターゲットを類似の邪魔者から区別するために必要な情報のみを積極的に求めることで、ユーザの負担を軽減するべきである。
既存のアプローチは、しばしばこの目標に欠ける: 選択肢を十分に探求する前に、最初の妥当な候補に立ち寄る、あるいは、複数の候補を集めた後でも、プールの候補者を区別するために選択された質問よりも、個々の候補から派生したターゲットの属性について尋ねる。
結果として、対話にも拘わらず、エージェントは依然として標的を邪魔者と区別することができず、早急な判断と長いユーザーの反応につながる可能性がある。
提案するProactive Instance Navigation with Comparison Judgment(ProCompNav)は,まず候補プールを構築し,そのターゲットを比較判定により識別する2段階のフレームワークである。
各ラウンドでProCompNavは属性値のペアを抽出し、現在のプールを分割し、バイナリーのyes/noを問う。
これにより、オープンエンドのターゲット記述からプールレベルの差別的質問への曖昧さが再定義され、各質問が候補セットを狭めるために選択される。
CoIN-Benchでは、ProCompNavは、最小限の入力と非インタラクティブのベースラインでインタラクティブなベースラインよりも成功率を向上させると同時に、レスポンス長を大幅に削減する。
ProCompNavはTextNavの最先端の成功率も達成している。
関連論文リスト
- Benchmarking Interaction, Beyond Policy: a Reproducible Benchmark for Collaborative Instance Object Navigation [54.6417539730783]
Question-Asking Navigation (QAsk-Nav)は、CoIN(Collaborative Instance Object Navigation)の最初の再現可能なベンチマークである。
光コナブ(Light-CoNav)は,従来のモジュール方式よりも3倍小さく,70倍高速な協調ナビゲーションのための軽量統一モデルである。
論文 参考訳(メタデータ) (2026-03-31T21:45:00Z) - Pathways of Thoughts: Multi-Directional Thinking for Long-form Personalized Question Answering [57.12316804290369]
ユーザ固有の情報ニーズに質問応答システムを適用するためには,パーソナライゼーションが不可欠である。
本稿では,タスク固有の微調整を必要とせず,任意の大規模言語モデル (LLM) に適用可能な推論段階の方法として,思考の経路 (PoT) を提案する。
PoTは競争ベースラインを一貫して上回り、13.1%の相対的な改善を達成している。
論文 参考訳(メタデータ) (2025-09-23T14:44:46Z) - Divide-and-Conquer: Tree-structured Strategy with Answer Distribution Estimator for Goal-Oriented Visual Dialogue [30.126882554391837]
Answer Distribution Estimator(TSADE)を用いた樹木構造戦略
本稿では,現在の候補オブジェクトの半数を各ラウンドで除外することで,質問生成をガイドする木構造戦略(TSADE)を提案する。
提案手法は,従来のエルゴディックな質問生成手法と比較して,繰り返し質問やラウンドの少ないタスク指向の精度をエージェントが達成できることを実験的に実証する。
論文 参考訳(メタデータ) (2025-02-09T08:16:09Z) - Collaborative Instance Object Navigation: Leveraging Uncertainty-Awareness to Minimize Human-Agent Dialogues [54.81155589931697]
協調インスタンスオブジェクトナビゲーション(CoIN)は、エージェントがターゲットインスタンスに関する不確実性を積極的に解決する新しいタスク設定である。
未認識者に対するエージェント・ユーザインタラクション(AIUTA)の新たな学習自由化手法を提案する。
まず、オブジェクト検出時に、セルフクエチオナーモデルがエージェント内で自己対話を開始し、完全かつ正確な観察記述を得る。
インタラクショントリガーモジュールは、人間に質問するか、継続するか、ナビゲーションを停止するかを決定する。
論文 参考訳(メタデータ) (2024-12-02T08:16:38Z) - Answering Ambiguous Questions via Iterative Prompting [84.3426020642704]
オープンドメインの質問応答では、質問のあいまいさのため、複数の妥当な回答が存在する可能性がある。
ひとつのアプローチは、すべての有効な回答を直接予測することですが、これは、妥当性と多様性のバランスに苦労する可能性があります。
本稿では,あいまいな疑問に答える既存手法の欠陥に対処するため,AmbigPromptを提案する。
論文 参考訳(メタデータ) (2023-07-08T04:32:17Z) - Exploring Dense Retrieval for Dialogue Response Selection [42.89426092886912]
本研究では,高密度検索モデルを用いて,大規模コーパスや非並列コーパスから直接適切な応答を選択する方法を提案する。
再ランク設定では、その単純さを考えると、その優位性はかなり驚きます。フルランク設定では、私たちは、そのような評価を最初に行うことを強調できます。
論文 参考訳(メタデータ) (2021-10-13T10:10:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。