論文の概要: REST: Receding Horizon Explorative Steiner Tree for Zero-Shot Object-Goal Navigation
- arxiv url: http://arxiv.org/abs/2603.18624v1
- Date: Thu, 19 Mar 2026 08:43:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-20 17:19:06.038761
- Title: REST: Receding Horizon Explorative Steiner Tree for Zero-Shot Object-Goal Navigation
- Title(参考訳): REST: ゼロショットのオブジェクト指向ナビゲーションのための水平探索ステイナツリーの継承
- Authors: Shuqi Xiao, Maani Ghaffari, Chengzhong Xu, Hui Kong,
- Abstract要約: ゼロショットオブジェクトゴールナビゲーション(ZSON)では、タスク固有のトレーニングなしでターゲットオブジェクトを見つけるために未知の環境をナビゲートする必要がある。
textitREST(Receding Horizon Explorative Steiner Tree)は、オンラインRGB-Dストリームから明示的なオープンな3Dマップを構築する、トレーニング不要のフレームワークです。
- 参考スコア(独自算出の注目度): 31.04470860657085
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Zero-shot object-goal navigation (ZSON) requires navigating unknown environments to find a target object without task-specific training. Prior hierarchical training-free solutions invest in scene understanding (\textit{belief}) and high-level decision-making (\textit{policy}), yet overlook the design of \textit{option}, i.e., a subgoal candidate proposed from evolving belief and presented to policy for selection. In practice, options are reduced to isolated waypoints scored independently: single destinations hide the value gathered along the journey; an unstructured collection obscures the relationships among candidates. Our insight is that the option space should be a \textit{tree of paths}. Full paths expose en-route information gain that destination-only scoring systematically neglects; a tree of shared segments enables coarse-to-fine LLM reasoning that dismisses or pursues entire branches before examining individual leaves, compressing the combinatorial path space into an efficient hierarchy. We instantiate this insight in \textbf{REST} (Receding Horizon Explorative Steiner Tree), a training-free framework that (1) builds an explicit open-vocabulary 3D map from online RGB-D streams; (2) grows an agent-centric tree of safe and informative paths as the option space via sampling-based planning; and (3) textualizes each branch into a spatial narrative and selects the next-best path through chain-of-thought LLM reasoning. Across the Gibson, HM3D, and HSSD benchmarks, REST consistently ranks among the top methods in success rate while achieving the best or second-best path efficiency, demonstrating a favorable efficiency-success balance.
- Abstract(参考訳): ゼロショットオブジェクトゴールナビゲーション(ZSON)では、タスク固有のトレーニングなしでターゲットオブジェクトを見つけるために未知の環境をナビゲートする必要がある。
以前の階層的な訓練のないソリューションは、シーン理解(\textit{belief})とハイレベルな意思決定(\textit{policy})に投資するが、しかし \textit{option}の設計を見落としている。
実際には、選択肢は独立したウェイポイントに縮小される。単一の目的地は、旅程に沿って集められた価値を隠蔽し、構造化されていないコレクションは、候補間の関係を曖昧にする。
私たちの洞察では、オプション空間はパスのtextit{tree} であるべきです。
共有セグメントのツリーは、個々の葉を調べる前に枝全体を排除または追尾し、組合せ経路空間を効率的な階層に圧縮する粗いLLM推論を可能にする。
この知見は,(1)オンラインRGB-Dストリームから明示的なオープン語彙の3Dマップを構築するトレーニングフリーフレームワークであるtextbf{REST} (Receding Horizon Explorative Steiner Tree) や,(2)サンプリングベースの計画を通じて安全な情報経路のエージェント中心のツリーをオプション空間として成長させ,(3) 各ブランチをテキスト化して空間的物語化し,LLM推論を通じて次の最良経路を選択する,といった方法で実現されている。
Gibson、HM3D、HSSDベンチマーク全体において、RESTは成功率のトップメソッドの1つとして一貫してランク付けされている。
関連論文リスト
- ReasonNavi: Human-Inspired Global Map Reasoning for Zero-Shot Embodied Navigation [53.95797153529148]
身体的エージェントは、主に部分的な自我中心の観測に依存するため、効率的なナビゲーションに苦しむことが多い。
本稿では,マルチモーダル大規模言語モデル(MLLM)と決定論的プランナを結合することにより,この理由に基づくパラダイムを運用する,人間にインスパイアされたフレームワークであるReasonNaviを紹介する。
論文 参考訳(メタデータ) (2026-01-26T19:09:20Z) - LLM-guided Hierarchical Retrieval [54.73080745446999]
LATTICEは階層的な検索フレームワークであり、LLMは対数探索の複雑さで大きなコーパスを推論し、ナビゲートすることができる。
LLM誘導探索における中心的な課題は、モデルの関連性判断がノイズが多く、文脈に依存し、階層性に気付かないことである。
我々のフレームワークは、推論集約型BRIGHTベンチマークで最先端のゼロショット性能を実現する。
論文 参考訳(メタデータ) (2025-10-15T07:05:17Z) - IPPON: Common Sense Guided Informative Path Planning for Object Goal Navigation [33.979481250363584]
本稿では,新しい情報経路計画法と3次元オブジェクト確率マッピング手法を提案する。
マッピングモジュールはセマンティックセグメンテーションとベイズフィルタによって関心対象の確率を計算する。
我々のプランナーはゼロショットアプローチに従っているが、2023年のHabitat ObjectNav Challengeにおいて、Path Length(SPL)とSoft SPLが重み付けしたSuccessによって測定された最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-10-25T17:11:33Z) - SG-Nav: Online 3D Scene Graph Prompting for LLM-based Zero-shot Object Navigation [83.4599149936183]
既存のゼロショットオブジェクトナビゲーション手法は、空間的に閉じたオブジェクトのテキストでLCMをプロンプトする。
本稿では,3次元シーングラフを用いて観察されたシーンを表現することを提案する。
我々は,MP3D,HM3D,RoboTHOR環境において,SG-Navが従来のゼロショット法を10%以上のSRで上回る大規模な実験を行った。
論文 参考訳(メタデータ) (2024-10-10T17:57:19Z) - LLM-A*: Large Language Model Enhanced Incremental Heuristic Search on Path Planning [91.95362946266577]
経路計画はロボット工学と自律航法における基本的な科学的問題である。
A*やその変種のような伝統的なアルゴリズムは、パスの妥当性を保証することができるが、状態空間が大きくなるにつれて、計算とメモリの非効率が著しく低下する。
本稿では, A* の正確なパスフィニング能力と LLM のグローバルな推論能力とを相乗的に組み合わせた LLM ベースの経路計画法を提案する。
このハイブリッドアプローチは、特に大規模シナリオにおいて、パス妥当性の完全性を維持しながら、時間と空間の複雑さの観点からパスフィニング効率を向上させることを目的としている。
論文 参考訳(メタデータ) (2024-06-20T01:24:30Z) - Hierarchical Spatial Proximity Reasoning for Vision-and-Language Navigation [1.2473780585666772]
多くのVision-and-Language Navigation (VLN)アルゴリズムは、視覚的常識の欠如と限られた推論能力のために不正確な決定をする傾向がある。
本稿では,階層的空間近接の知識基盤構築を支援するために,階層的空間近接推論(HSPR)手法を提案する。
我々は、REVERIE、SOON、R2R、R4Rなどの公開データセットで実験を行い、我々のアプローチを検証する。
論文 参考訳(メタデータ) (2024-03-18T07:51:22Z) - Path Choice Matters for Clear Attribution in Path Methods [84.29092710376217]
重要でない特徴に対する高い属性を割り当てるtextbfConcentration Principleを導入する。
次に、モデルに依存しないインタプリタである textbfSAMP を提示し、ほぼ最適経路を効率的に探索する。
また、厳密性と最適性を改善するために、無限小制約(IC)と運動量戦略(MS)を提案する。
論文 参考訳(メタデータ) (2024-01-19T01:11:44Z) - VoroNav: Voronoi-based Zero-shot Object Navigation with Large Language
Model [28.79971953667143]
VoroNavは、リアルタイムで構築されたセマンティックマップから探索経路と計画ノードを抽出する意味探索フレームワークである。
トポロジカルおよびセマンティック情報を活用することで、VoroNavは大きな言語モデルで容易に解釈できるパスとイメージのテキストベースの記述を設計する。
論文 参考訳(メタデータ) (2024-01-05T08:05:07Z) - Find a Way Forward: a Language-Guided Semantic Map Navigator [53.69229615952205]
本稿では,新たな視点で言語誘導ナビゲーションの問題に対処する。
ロボットが自然言語の指示を実行し、地図観測に基づいて目標位置へ移動できるようにする。
提案手法は特に長距離ナビゲーションの場合において顕著な性能向上をもたらす。
論文 参考訳(メタデータ) (2022-03-07T07:40:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。