Fugu-MT 論文翻訳(概要): TravExplorer: Cross-Floor Embodied Exploration via Traversability-Aware 3-D Planning

論文の概要: TravExplorer: Cross-Floor Embodied Exploration via Traversability-Aware 3-D Planning

arxiv url: http://arxiv.org/abs/2605.19958v1
Date: Tue, 19 May 2026 15:11:29 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-20 15:03:09.466385
Title: TravExplorer: Cross-Floor Embodied Exploration via Traversability-Aware 3-D Planning
Title（参考訳）: TravExplorer: トラバーサビリティを考慮した3次元計画によるクロスフロア・エボダイド探査
Authors: Han Zheng, Zhe Chen, Yudong Huang, Haoran Liu, Jinghao Wang, Ming Yang, Tong Qin,
Abstract要約: この記事では、クロスフロアで具体化された探索フレームワークであるTravExplorerを紹介します。ゼロショットセマンティックガイダンスとトラバーサビリティを意識した3Dプランニングを結合する。ユニツリーGo2の現実世界での50の試行は、シングルフロアとクロスフロアの屋内環境におけるオープンボキャブラリターゲット探索をさらに検証している。
参考スコア（独自算出の注目度）: 17.54520943622758
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Zero-shot Object Navigation (ZSON) has shown promise for open-vocabulary target search in unseen environments, yet most existing systems remain tied to planar representations and single-floor assumptions. These assumptions become inadequate in real buildings, where navigation involves floors, stairs, landings, and vertically overlapping spaces. This article presents TravExplorer, a cross-floor embodied exploration framework that couples zero-shot semantic guidance with traversability-aware 3-D planning. TravExplorer maintains a unified volumetric map that distinguishes occupied structures from robot-reachable support surfaces and extracts traversable frontiers from connected support surfaces, including floors, stairs, and landings. A FOV-aware active perception strategy further resolves incomplete observations during cross-floor traversal. To reduce semantic-reasoning latency, a lightweight guidance module aligns a probabilistic instance map from online open-vocabulary segmentation with a spatial value map from fast image-to-text matching. Based on these geometric and semantic memories, a hierarchical planner performs target-aware frontier touring over object hypotheses, traversable frontiers, and stair landmarks, and generates executable cross-floor motions through foothold-guided 3-D search and vertically constrained local trajectory optimization. Experiments over 4,195 simulated episodes on HM3D and MP3D demonstrate consistent advantages over representative ObjectNav baselines. Fifty real-world trials on a Unitree Go2 further validate open-vocabulary target search across single-floor and cross-floor indoor environments without prior maps or human intervention. The code will be released at https://github.com/wuyi2121/TravExplorer.
Abstract（参考訳）: Zero-shot Object Navigation (ZSON) は、未知の環境でのオープン語彙のターゲット探索を約束しているが、既存のシステムのほとんどは、平面表現やシングルフロアの仮定に縛られている。これらの仮定は、床、階段、着陸、垂直に重なる空間を含む実際の建物では不十分である。この記事では、ゼロショットセマンティックガイダンスとトラバーサビリティを意識した3Dプランニングを併用した、クロスフロア・エボデード探索フレームワークであるTravExplorerを紹介します。 TravExplorerは、占有された構造物をロボットが到達可能な支持面から区別し、フロア、階段、着陸を含む接続された支持面から移動可能なフロンティアを抽出する統一されたボリュームマップを維持している。 FOV対応能動知覚戦略は、クロスフロア・トラバース中の不完全な観察をさらに解決する。セマンティック推論のレイテンシを低減するために、軽量ガイダンスモジュールは、オンラインのオープン語彙セグメンテーションから確率的なインスタンスマップを高速な画像とテキストのマッチングから空間値マップに整列する。これらの幾何学的・意味的記憶に基づいて、階層的プランナーは、対象仮説、トラバース可能なフロンティア、階段のランドマークを探索し、足場誘導3次元探索と垂直に制約された局所軌道最適化により実行可能なクロスフロア運動を生成する。 HM3DとMP3Dでの4,195回以上のシミュレーション実験は、代表的ObjectNavベースラインに対して一貫した優位性を示している。ユニツリーGo2の現実世界での50の試行は、事前の地図や人間の介入なしに、シングルフロアとクロスフロアの屋内環境をまたいだオープンボキャブラリの探索をさらに検証する。コードはhttps://github.com/wuyi2121/TravExplorer.comでリリースされる。

関連論文リスト

OmniVLN: Omnidirectional 3D Perception and Token-Efficient LLM Reasoning for Visual-Language Navigation across Air and Ground Platforms [33.40889181799252]
言語誘導型エンボディナビゲーションでは、エージェントがオブジェクト参照命令を解釈し、複数の部屋を探索し、参照されたターゲットをローカライズし、それに対する信頼できる動きを実行する必要がある。 OmniVLNは、全方位3次元知覚とトークン効率の高い階層的推論を、空中と地上の両方で組み合わせたゼロショット視覚言語ナビゲーションフレームワークである。実験により、提案した階層インタフェースは空間参照精度を77.27%から93.18%に改善し、マルチルームの乱雑な設定で累積的なプロンプトトークンを61.7%削減し、フラットで最大11.68%のナビゲーション成功率向上を実現した。
論文参考訳（メタデータ） (2026-03-18T04:26:30Z)
Seeing Where to Deploy: Metric RGB-Based Traversability Analysis for Aerial-to-Ground Hidden Space Inspection [48.120690574682875]
本稿では,RGBを用いた幾何学的意味的再構成と,空中から地上への隠れ空間検査のためのトラベル可能性解析フレームワークを提案する。テザリングされたUAV-UGVプラットフォームでの実験では、隠れた空間シナリオにおける信頼性の高いデプロイメントゾーンの識別が示されている。
論文参考訳（メタデータ） (2026-03-15T22:20:59Z)
WildOS: Open-Vocabulary Object Search in the Wild [12.098091049832965]
この研究は、長距離でオープンなオブジェクト検索のための統一システムWildOSを提示する。基礎モデルに基づく視覚モジュール ExploRFM を用いて、グラフのフロンティアノードをスコアリングする。また、オープン語彙ターゲットクエリの粗い局所化のための粒子フィルタに基づく手法も導入する。
論文参考訳（メタデータ） (2026-02-22T19:14:00Z)
FOM-Nav: Frontier-Object Maps for Object Goal Navigation [65.76906445210112]
FOM-Navはフロンティアオブジェクトマップと視覚言語モデルによる探索効率を高めるフレームワークである。 FOM-Navをトレーニングするために,実環境から大規模ナビゲーションデータセットを自動構築する。 FOM-NavはMP3DとHM3Dのベンチマーク、特にナビゲーション効率の指標SPLで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2025-11-30T18:16:09Z)
PLANA3R: Zero-shot Metric Planar 3D Reconstruction via Feed-Forward Planar Splatting [56.188624157291024]
提案するPLANA3Rは,提案しない2次元画像から平面3次元再構成を計測するためのポーズレスフレームワークである。トレーニング中に3次元平面アノテーションを必要とする以前のフィードフォワード法とは異なり、PLANA3Rは明確な平面監督なしで平面3次元構造を学習する。本研究は,複数の室内環境データセットに対するPLANA3Rの有効性を検証するとともに,領域外屋内環境への強力な一般化を実証する。
論文参考訳（メタデータ） (2025-10-21T15:15:33Z)
RAVEN: Resilient Aerial Navigation via Open-Set Semantic Memory and Behavior Adaptation [20.730528223747967]
RAVENは、非構造化屋外環境での空中セマンティックナビゲーションのための3Dメモリベースの行動ツリーフレームワークである。空間的に一貫したセマンティックなボクセル線マップを永続記憶として使用し、長期計画を可能にし、純粋に反応性のある振る舞いを避ける。 RAVENは、シミュレーションのベースラインを85.25%上回り、屋外フィールドテストにおける空中ロボットへの展開を通じて実世界の適用性を実証している。
論文参考訳（メタデータ） (2025-09-28T01:43:25Z)
Move to Understand a 3D Scene: Bridging Visual Grounding and Exploration for Efficient and Versatile Embodied Navigation [54.04601077224252]
身近なシーン理解には、視覚空間情報の理解だけでなく、3D物理世界における次の探索場所の決定も必要である。アンダーラインテキストbf3D視覚言語学習は、エンボディエージェントが環境を効果的に探索し理解することを可能にする。モデルの汎用性は、カテゴリ、言語記述、参照イメージなど、多様な入力モダリティを使ったナビゲーションを可能にする。
論文参考訳（メタデータ） (2025-07-05T14:15:52Z)
Object Goal Navigation with Recursive Implicit Maps [92.6347010295396]
対象目標ナビゲーションのための暗黙的な空間マップを提案する。提案手法は, 挑戦的なMP3Dデータセット上での技量を著しく上回る。我々は、実際のロボットにモデルをデプロイし、実際のシーンでオブジェクトゴールナビゲーションの結果を奨励する。
論文参考訳（メタデータ） (2023-08-10T14:21:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。