論文の概要: An Open-Source LiDAR and Monocular Off-Road Autonomous Navigation Stack
- arxiv url: http://arxiv.org/abs/2604.03096v1
- Date: Fri, 03 Apr 2026 15:19:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.507198
- Title: An Open-Source LiDAR and Monocular Off-Road Autonomous Navigation Stack
- Title(参考訳): オープンソースLiDARと単眼オフロード自律ナビゲーションスタック
- Authors: Rémi Marsal, Quentin Picard, Adrien Poiré, Sébastien Kerbourc'h, Thibault Toralba, Clément Yver, Alexandre Chapoutot, David Filliat,
- Abstract要約: タスク固有のトレーニングを使わずに,LiDARとモノクル3次元認識の両方をサポートするオープンソースのナビゲーションスタックを提案する。
単分子配置では、ゼロショット深度予測とメートル法深度再スケーリングをスパースSLAM測定を用いて組み合わせる。
結果として得られるポイントクラウドは、コストマップベースの計画のためのロボット中心の2.5D高度マップを生成するために使用される。
- 参考スコア(独自算出の注目度): 35.094251140860756
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Off-road autonomous navigation demands reliable 3D perception for robust obstacle detection in challenging unstructured terrain. While LiDAR is accurate, it is costly and power-intensive. Monocular depth estimation using foundation models offers a lightweight alternative, but its integration into outdoor navigation stacks remains underexplored. We present an open-source off-road navigation stack supporting both LiDAR and monocular 3D perception without task-specific training. For the monocular setup, we combine zero-shot depth prediction (Depth Anything V2) with metric depth rescaling using sparse SLAM measurements (VINS-Mono). Two key enhancements improve robustness: edge-masking to reduce obstacle hallucination and temporal smoothing to mitigate the impact of SLAM instability. The resulting point cloud is used to generate a robot-centric 2.5D elevation map for costmap-based planning. Evaluated in photorealistic simulations (Isaac Sim) and real-world unstructured environments, the monocular configuration matches high-resolution LiDAR performance in most scenarios, demonstrating that foundation-model-based monocular depth estimation is a viable LiDAR alternative for robust off-road navigation. By open-sourcing the navigation stack and the simulation environment, we provide a complete pipeline for off-road navigation as well as a reproducible benchmark. Code available at https://github.com/LARIAD/Offroad-Nav.
- Abstract(参考訳): オフロード自律ナビゲーションは、不安定な地形における堅牢な障害物検出のために、信頼性の高い3次元認識を要求する。
LiDARは正確だが、高価で電力集約性が高い。
基礎モデルを用いた単眼深度推定は軽量な代替手段を提供するが、アウトドアナビゲーションスタックへの統合は未検討のままである。
タスク固有のトレーニングを使わずに,LiDARとモノクル3次元認識の両方をサポートするオープンソースオフロードナビゲーションスタックを提案する。
モノクルセットアップでは、ゼロショット深度予測(Depth Anything V2)と、スパースSLAM測定(VINS-Mono)を用いたメートル法深度再スケーリングを併用する。
2つの重要な強化は、障害幻覚を軽減するエッジマスキングと、SLAM不安定性の影響を軽減するための時間的平滑化である。
結果として得られるポイントクラウドは、コストマップベースの計画のためのロボット中心の2.5D高度マップを生成するために使用される。
フォトリアリスティックシミュレーション(Isaac Sim)と実世界の非構造環境で評価されたモノクロ構成は、ほとんどのシナリオにおいて高分解能LiDAR性能と一致し、基礎モデルに基づくモノクロ深度推定が堅牢なオフロードナビゲーションのLiDAR代替手段であることを示す。
ナビゲーションスタックとシミュレーション環境をオープンソース化することにより、オフロードナビゲーションのための完全なパイプラインと再現可能なベンチマークを提供する。
コードはhttps://github.com/LARIAD/Offroad-Nav.comで公開されている。
関連論文リスト
- STONE Dataset: A Scalable Multi-Modal Surround-View 3D Traversability Dataset for Off-Road Robot Navigation [20.183016318362558]
STONEはオフロードナビゲーションのための大規模マルチモーダルデータセットである。
データセットは昼夜、草原、農地、建設現場、湖など幅広い環境と環境をカバーしている。
ボクセルレベルの3次元トレーサビリティ予測のベンチマークを確立し,単一モードとマルチモードの両方で強力なベースラインを提供する。
論文 参考訳(メタデータ) (2026-03-10T04:26:00Z) - Traversability Aware Autonomous Navigation for Multi-Modal Mobility Morphobot (M4) [0.0]
この論文は、M4ロボットプラットフォームのためのトラバーサビリティ対応ナビゲーションフレームワークを提示する。
CNNベースのモデルが標高マップを処理し、走行可能性スコアを推定し、経路計画のためのナビゲーションコストに変換する。
カスタムのA*プランナーは、これらのコストを幾何学的距離とエネルギー消費と組み合わせて、貿易の適度な距離が増加する経路を見つける。
論文 参考訳(メタデータ) (2025-12-07T17:28:34Z) - NOVA: Navigation via Object-Centric Visual Autonomy for High-Speed Target Tracking in Unstructured GPS-Denied Environments [56.35569661650558]
我々はNOVAというオブジェクト中心のフレームワークを導入し、ロバストな目標追跡と衝突認識ナビゲーションを可能にした。
グローバルマップを構築するのではなく、NOVAはターゲットの参照フレーム内での知覚、推定、制御を定式化する。
我々は,都市迷路や森林の小道,間欠的なGPS損失を伴う建物内の繰り返し遷移など,現実の挑戦的なシナリオにまたがってNOVAを検証する。
論文 参考訳(メタデータ) (2025-06-23T14:28:30Z) - Prompting Depth Anything for 4K Resolution Accurate Metric Depth Estimation [108.04354143020886]
本稿では、深度基礎モデルにプロンプトを導入し、Prompt Depth Anythingと呼ばれる計量深度推定のための新しいパラダイムを作成する。
低コストのLiDARを用いて、Depth Anythingモデルによる正確なメートル法深度出力を導出し、最大4K解像度を達成する。
論文 参考訳(メタデータ) (2024-12-18T16:32:12Z) - Angle Robustness Unmanned Aerial Vehicle Navigation in GNSS-Denied
Scenarios [66.05091704671503]
本稿では、ポイントツーポイントナビゲーションタスクにおける飛行偏差に対処する新しい角度ナビゲーションパラダイムを提案する。
また、Adaptive Feature Enhance Module、Cross-knowledge Attention-guided Module、Robust Task-oriented Head Moduleを含むモデルを提案する。
論文 参考訳(メタデータ) (2024-02-04T08:41:20Z) - Advancing Self-supervised Monocular Depth Learning with Sparse LiDAR [22.202192422883122]
本稿では,自己教師付き単分子深度学習を推進するための2段階ネットワークを提案する。
本モデルでは,単色画像特徴と疎LiDAR特徴を融合させて初期深度マップを推定する。
我々のモデルは、下流タスクのモノクロ3Dオブジェクト検出において、最先端のスパース-LiDAR法(Pseudo-LiDAR++)を68%以上向上させる。
論文 参考訳(メタデータ) (2021-09-20T15:28:36Z) - LiDARTouch: Monocular metric depth estimation with a few-beam LiDAR [40.98198236276633]
視覚に基づく深度推定は、自律システムにおいて重要な特徴である。
このような単分子配置では、1つまたは複数の高価なLiDARから追加の入力で濃密な深さが得られる。
本稿では,単眼カメラと軽量LiDARを組み合わせることで,距離深度を高密度に推定する新しい手法を提案する。
論文 参考訳(メタデータ) (2021-09-08T12:06:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。