論文の概要: StepNav: Structured Trajectory Priors for Efficient and Multimodal Visual Navigation
- arxiv url: http://arxiv.org/abs/2602.02590v1
- Date: Sun, 01 Feb 2026 06:45:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.102466
- Title: StepNav: Structured Trajectory Priors for Efficient and Multimodal Visual Navigation
- Title(参考訳): StepNav: 効率的なマルチモーダルビジュアルナビゲーションのための構造化軌道
- Authors: Xubo Luo, Aodi Wu, Haodong Han, Xue Wan, Wei Zhang, Leizheng Shu, Ruisuo Wang,
- Abstract要約: StepNavは、生成モデルとリアルタイムナビゲーションプランのギャップを埋める新しいフレームワークである。
構造化されていないノイズを物理的に位置付けされた候補に置き換えることで、StepNavはより安全で効率的なプランを、はるかに少ないステップで生成する。
シミュレーションと実世界のベンチマークの両方の実験では、最先端のジェネレーティブプランナーよりも堅牢性、効率、安全性が一貫した改善が示されている。
- 参考スコア(独自算出の注目度): 3.1545852313258442
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Visual navigation is fundamental to autonomous systems, yet generating reliable trajectories in cluttered and uncertain environments remains a core challenge. Recent generative models promise end-to-end synthesis, but their reliance on unstructured noise priors often yields unsafe, inefficient, or unimodal plans that cannot meet real-time requirements. We propose StepNav, a novel framework that bridges this gap by introducing structured, multimodal trajectory priors derived from variational principles. StepNav first learns a geometry-aware success probability field to identify all feasible navigation corridors. These corridors are then used to construct an explicit, multi-modal mixture prior that initializes a conditional flow-matching process. This refinement is formulated as an optimal control problem with explicit smoothness and safety regularization. By replacing unstructured noise with physically-grounded candidates, StepNav generates safer and more efficient plans in significantly fewer steps. Experiments in both simulation and real-world benchmarks demonstrate consistent improvements in robustness, efficiency, and safety over state-of-the-art generative planners, advancing reliable trajectory generation for practical autonomous navigation. The code has been released at https://github.com/LuoXubo/StepNav.
- Abstract(参考訳): 視覚ナビゲーションは自律システムの基本であるが、乱雑で不確実な環境で信頼性の高い軌道を生成することは、依然として重要な課題である。
最近の生成モデルは、エンドツーエンドの合成を約束するが、非構造的なノイズ先行への依存は、しばしば、リアルタイムの要求を満たすことができない安全でない、非効率な計画をもたらす。
本稿では,このギャップを埋める新しいフレームワークであるStepNavを提案する。
StepNavはまずジオメトリを意識した成功確率場を学習し、実現可能なすべての航法路を特定する。
これらの廊下は、条件付きフローマッチングプロセスを初期化する前に、明示的なマルチモーダル混合を構築するために使用される。
この改良は、明確な滑らかさと安全性の正則化を伴う最適制御問題として定式化されている。
構造化されていないノイズを物理的に位置付けされた候補に置き換えることで、StepNavはより安全で効率的なプランを、はるかに少ないステップで生成する。
シミュレーションと実世界のベンチマークの両方の実験では、最先端のジェネレーティブプランナーよりも堅牢性、効率、安全性が一貫して改善され、実用的な自律ナビゲーションのための信頼性の高い軌道生成が進んだ。
コードはhttps://github.com/LuoXubo/StepNav.comで公開されている。
関連論文リスト
- SaferPath: Hierarchical Visual Navigation with Learned Guidance and Safety-Constrained Control [9.692780954657229]
ビジュアルナビゲーションはモバイルロボットの中核機能であるが、エンド・ツー・エンドの学習ベースの手法は、目に見えない、散らかった、狭い環境での一般化と安全性に苦しむことが多い。
本稿では,既存のエンド・ツー・エンドモデルから学習したガイダンスを活用し,安全性に制約のある最適化制御モジュールを通じて改良した階層型ビジュアルナビゲーションフレームワークであるSaferPathを提案する。
論文 参考訳(メタデータ) (2026-03-02T14:17:37Z) - ONRAP: Occupancy-driven Noise-Resilient Autonomous Path Planning [4.58403099322105]
本稿では, 占有グリッドで動作する実践的, 実装に優しいプランナを提案する。
これはエゴ中心で、運動的に実現可能なパスを生成し、静的かつダイナミックな障害物を安全にナビゲートする。
重度局所化と知覚雑音を用いたシミュレーションにおいて,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2026-02-14T03:27:46Z) - Risk-Aware Obstacle Avoidance Algorithm for Real-Time Applications [0.6299766708197881]
本研究は,車両経路に沿った障害物の確率論的モデリングと,自律表面容器のスムーズな軌道最適化を統合したハイブリッド型リスク対応ナビゲーションアーキテクチャを提案する。
提案手法は、運転安全性と自律性の向上を示し、不確実かつダイナミックな環境下でのリスク対応型自動運転車のミッションのための有望なソリューションとして確立する。
論文 参考訳(メタデータ) (2026-02-09T21:15:33Z) - FlowConsist: Make Your Flow Consistent with Real Trajectory [99.22869983378062]
現在の高速フロートレーニングパラダイムには,2つの根本的な問題がある,と我々は主張する。
ランダムにペアリングされたノイズデータサンプルから構築された条件付き速度は、系統的な軌跡ドリフトを導入する。
本研究では,高速フローにおける軌道整合性を実現するためのトレーニングフレームワークであるFlowConsistを提案する。
論文 参考訳(メタデータ) (2026-02-06T03:24:23Z) - ReasonNavi: Human-Inspired Global Map Reasoning for Zero-Shot Embodied Navigation [53.95797153529148]
身体的エージェントは、主に部分的な自我中心の観測に依存するため、効率的なナビゲーションに苦しむことが多い。
本稿では,マルチモーダル大規模言語モデル(MLLM)と決定論的プランナを結合することにより,この理由に基づくパラダイムを運用する,人間にインスパイアされたフレームワークであるReasonNaviを紹介する。
論文 参考訳(メタデータ) (2026-01-26T19:09:20Z) - VLA-AN: An Efficient and Onboard Vision-Language-Action Framework for Aerial Navigation in Complex Environments [12.689250855332569]
VLA-ANは、複雑な環境での自律ドローンナビゲーションに特化したフレームワークである。
既存の大型航法モデルの4つの大きな制限に対処する。
シングルタスクの成功率は98.1%に達する。
論文 参考訳(メタデータ) (2025-12-17T10:02:55Z) - ResAD: Normalized Residual Trajectory Modeling for End-to-End Autonomous Driving [64.42138266293202]
ResADは正規化された残留軌道モデリングフレームワークである。
学習タスクを再編成し、慣性参照からの残留偏差を予測する。
NAVSIMベンチマークでは、ResADはバニラ拡散ポリシーを用いて最先端のPDMS 88.6を達成している。
論文 参考訳(メタデータ) (2025-10-09T17:59:36Z) - QUAV: Quantum-Assisted Path Planning and Optimization for UAV Navigation with Obstacle Avoidance [2.048164304914359]
本研究は量子近似最適化アルゴリズム(QAOA)に基づく量子支援型UAV経路計画フレームワークであるQUIVを紹介する。
理論解析により, QuaV は最適化条件の下で, エッジ数に対する回路深さの線形スケーリングを実現することを示した。
その結果、QUIVは実現可能で効率的な軌道を生成し、将来のドローンナビゲーションシステムにおける量子アプローチの可能性を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-08-29T06:59:21Z) - DAgger Diffusion Navigation: DAgger Boosted Diffusion Policy for Vision-Language Navigation [73.80968452950854]
Vision-Language Navigation in Continuous Environments (VLN-CE) は、エージェントが自由形式の3D空間を通して自然言語の指示に従う必要がある。
既存のVLN-CEアプローチは通常、2段階のウェイポイント計画フレームワークを使用する。
本稿では,エンドツーエンド最適化VLN-CEポリシとしてDAgger Diffusion Navigation (DifNav)を提案する。
論文 参考訳(メタデータ) (2025-08-13T02:51:43Z) - DORAEMON: Decentralized Ontology-aware Reliable Agent with Enhanced Memory Oriented Navigation [55.888688171010365]
DORAEMONは、人間のナビゲーション機能を模倣したVentralとDorsal Streamsで構成される、認知にインスパイアされたフレームワークである。
我々は,DORAEMONをHM3D,MP3D,GOATのデータセット上で評価し,成功率(SR)と成功度(SPL)の測定値の両方で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-05-28T04:46:13Z) - ETPNav: Evolving Topological Planning for Vision-Language Navigation in
Continuous Environments [56.194988818341976]
視覚言語ナビゲーションは、エージェントが環境中をナビゲートするための指示に従う必要があるタスクである。
本研究では,1)環境を抽象化し,長距離航法計画を生成する能力,2)連続環境における障害物回避制御能力の2つの重要なスキルに焦点を当てたETPNavを提案する。
ETPNavは、R2R-CEとRxR-CEデータセットの先行技術よりも10%以上、20%改善されている。
論文 参考訳(メタデータ) (2023-04-06T13:07:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。