論文の概要: DSCD-Nav: Dual-Stance Cooperative Debate for Object Navigation
- arxiv url: http://arxiv.org/abs/2601.21409v2
- Date: Sat, 31 Jan 2026 05:43:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.002507
- Title: DSCD-Nav: Dual-Stance Cooperative Debate for Object Navigation
- Title(参考訳): DSCD-Nav:オブジェクトナビゲーションのためのデュアルスタンス協調議論
- Authors: Weitao An, Qi Liu, Chenghao Xu, Jiayi Chai, Xu Yang, Kun Wei, Cheng Deng,
- Abstract要約: 本研究では,姿勢に基づくクロスチェックとエビデンス対応仲裁に代えて,Dual-Stance Cooperative Debate Navigation (DSCD-Nav)を提案する。
HM3Dv1、HM3Dv2、MP3Dの実験では、探索冗長性を低減しつつ、成功と経路効率が一貫した改善を示した。
- 参考スコア(独自算出の注目度): 63.439158093945956
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Adaptive navigation in unfamiliar indoor environments is crucial for household service robots. Despite advances in zero-shot perception and reasoning from vision-language models, existing navigation systems still rely on single-pass scoring at the decision layer, leading to overconfident long-horizon errors and redundant exploration. To tackle these problems, we propose Dual-Stance Cooperative Debate Navigation (DSCD-Nav), a decision mechanism that replaces one-shot scoring with stance-based cross-checking and evidence-aware arbitration to improve action reliability under partial observability. Specifically, given the same observation and candidate action set, we explicitly construct two stances by conditioning the evaluation on diverse and complementary objectives: a Task-Scene Understanding (TSU) stance that prioritizes goal progress from scene-layout cues, and a Safety-Information Balancing (SIB) stance that emphasizes risk and information value. The stances conduct a cooperative debate and make policy by cross-checking their top candidates with cue-grounded arguments. Then, a Navigation Consensus Arbitration (NCA) agent is employed to consolidate both sides' reasons and evidence, optionally triggering lightweight micro-probing to verify uncertain choices, preserving NCA's primary intent while disambiguating. Experiments on HM3Dv1, HM3Dv2, and MP3D demonstrate consistent improvements in success and path efficiency while reducing exploration redundancy.
- Abstract(参考訳): 不慣れな屋内環境における適応ナビゲーションは、家庭用サービスロボットにとって不可欠である。
ゼロショット認識の進歩と視覚言語モデルからの推論にもかかわらず、既存のナビゲーションシステムは依然として決定層でのシングルパススコアに依存しており、長い水平誤差と冗長な探索を過信している。
これらの問題に対処するため、我々は、一発採点をスタンスベースのクロスチェックとエビデンス対応仲裁に置き換える決定機構であるDual-Stance Cooperative Debate Navigation (DSCD-Nav)を提案する。
具体的には、同じ観察と候補行動セットを考慮し、多様かつ相補的な目的に対する評価を条件づけることにより、2つのスタンスを明示的に構築する: タスク・シーン理解(TSU)スタンスで、シーン・レイアウトからゴールの進行を優先する。
これらのスタンスは協力的な議論を行い、トップ候補をクエグラウンドの議論で相互にチェックすることで政策を立てる。
そして、両者の理由と証拠を統合するために、ナビゲーション合意仲裁(NCA)エージェントが使用され、任意に軽量なマイクロプローブをトリガーして不確実な選択を検証し、NAAの主要な意図を曖昧に保ちながら保存する。
HM3Dv1、HM3Dv2、MP3Dの実験では、探索冗長性を低減しつつ、成功と経路効率が一貫した改善を示した。
関連論文リスト
- AERR-Nav: Adaptive Exploration-Recovery-Reminiscing Strategy for Zero-Shot Object Navigation [12.039265264982928]
AERR-Navはゼロショットオブジェクトナビゲーションフレームワークで、ロボットの環境に基づいて状態を動的に調整する。
AERR-Navはゼロショット法で最先端の性能を達成する。
論文 参考訳(メタデータ) (2026-03-18T13:31:44Z) - DecoVLN: Decoupling Observation, Reasoning, and Correction for Vision-and-Language Navigation [49.233063630722334]
長距離ナビゲーションにおけるロバストなストリーミング認識と閉ループ制御のためのフレームワークであるDecoVLNを提案する。
本稿では,統合されたスコアリング関数を反復的に最適化することにより,過去の候補プールからフレームを選択する適応的精錬機構を提案する。
また,コンプレックスエラーを軽減するために,状態-作用ペアレベルの補正手法を導入する。
論文 参考訳(メタデータ) (2026-03-13T16:24:37Z) - TP-MDDN: Task-Preferenced Multi-Demand-Driven Navigation with Autonomous Decision-Making [90.18833928208333]
Task-Preferenced Multi-Demand-Driven Navigation (TP-MDDN)は、複数のサブオンデマンドと明示的なタスク嗜好を含む長距離ナビゲーションのための新しいベンチマークである。
空間記憶のために,3次元点雲蓄積と2次元意味マッピングを組み合わせたMASMapを設計した。
本手法は,認識精度とナビゲーションの堅牢性の両方において,最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2025-11-21T13:12:13Z) - Expand Your SCOPE: Semantic Cognition over Potential-Based Exploration for Embodied Visual Navigation [6.993095391722284]
エージェントは限られた知識で未知の環境を探索しなければならないため、身体的視覚ナビゲーションは依然として困難な課題である。
既存のゼロショット研究では、ゴール指向動作をサポートするメモリ機構を組み込むことで、長期計画性能が向上することが示されている。
ゼロショットフレームワークであるセマンティック・コグニション・オーバー・ポテンシャルベース探索(SCOPE)を提案する。
論文 参考訳(メタデータ) (2025-11-12T03:23:09Z) - BiTAA: A Bi-Task Adversarial Attack for Object Detection and Depth Estimation via 3D Gaussian Splatting [14.918777539580978]
本稿では,3次元ガウス平板上に構築したビタスク対逆攻撃BiTAAについて述べる。
具体的には、フルイメージとパッチ設定の両方をサポートするデュアルモデルアタックフレームワークを導入する。
また,クロスタスク転送メトリクスと実世界評価を併用した統合評価プロトコルを提案する。
論文 参考訳(メタデータ) (2025-09-24T06:27:15Z) - DORAEMON: Decentralized Ontology-aware Reliable Agent with Enhanced Memory Oriented Navigation [55.888688171010365]
DORAEMONは、人間のナビゲーション機能を模倣したVentralとDorsal Streamsで構成される、認知にインスパイアされたフレームワークである。
我々は,DORAEMONをHM3D,MP3D,GOATのデータセット上で評価し,成功率(SR)と成功度(SPL)の測定値の両方で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-05-28T04:46:13Z) - RSRNav: Reasoning Spatial Relationship for Image-Goal Navigation [57.197881161006904]
近年のイメージゴールナビゲーション(ImageNav)手法は,目標と自我中心の画像の意味的特徴を別々に捉え,知覚行動ポリシーを学習している。
本稿では,目標と現在の観測値の空間的関係をナビゲーションガイダンスとして考慮する,シンプルで効果的な手法であるRSRNavを提案する。
論文 参考訳(メタデータ) (2025-04-25T00:22:17Z) - Convergence of Communications, Control, and Machine Learning for Secure
and Autonomous Vehicle Navigation [78.60496411542549]
接続された自動運転車(CAV)は、交通事故におけるヒューマンエラーを低減し、道路効率を向上し、様々なタスクを実行する。これらのメリットを享受するためには、CAVが目標とする目的地へ自律的にナビゲートする必要がある。
本稿では,通信理論,制御理論,機械学習の収束を利用して,効果的なCAVナビゲーションを実現する手法を提案する。
論文 参考訳(メタデータ) (2023-07-05T21:38:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。