論文の概要: Pathfinder for Low-altitude Aircraft with Binary Neural Network
- arxiv url: http://arxiv.org/abs/2409.08824v2
- Date: Mon, 23 Sep 2024 01:29:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-07 21:09:04.527459
- Title: Pathfinder for Low-altitude Aircraft with Binary Neural Network
- Title(参考訳): 2成分ニューラルネットワークを用いた低高度航空機用パスファインダ
- Authors: Kaijie Yin, Tian Gao, Hui Kong,
- Abstract要約: 以前のグローバルトポロジマップ(例えば、OpenStreetMap, OSM)は、地上移動ロボットによる自律的マッピングの性能を高めることができる。
本稿では,低高度航空機が搭載する空中センサを用いたOSMメーカを提案する。
OSMメーカーの中核は、LiDARとカメラデータに基づく、新しい効率的なパスファインダーアプローチである。
- 参考スコア(独自算出の注目度): 28.33728489506935
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A prior global topological map (e.g., the OpenStreetMap, OSM) can boost the performance of autonomous mapping by a ground mobile robot. However, the prior map is usually incomplete due to lacking labeling in partial paths. To solve this problem, this paper proposes an OSM maker using airborne sensors carried by low-altitude aircraft, where the core of the OSM maker is a novel efficient pathfinder approach based on LiDAR and camera data, i.e., a binary dual-stream road segmentation model. Specifically, a multi-scale feature extraction based on the UNet architecture is implemented for images and point clouds. To reduce the effect caused by the sparsity of point cloud, an attention-guided gated block is designed to integrate image and point-cloud features. For enhancing the efficiency of the model, we propose a binarization streamline to each model component, including a variant of vision transformer (ViT) architecture as the encoder of the image branch, and new focal and perception losses to optimize the model training. The experimental results on two datasets demonstrate that our pathfinder method achieves SOTA accuracy with high efficiency in finding paths from the low-level airborne sensors, and we can create complete OSM prior maps based on the segmented road skeletons. Code and data are available at:https://github.com/IMRL/Pathfinder}{https://github.com/IMRL/Pathfinder.
- Abstract(参考訳): 従来のグローバルなトポロジマップ(例えば、OpenStreetMap, OSM)は、地上移動ロボットによる自律的マッピングの性能を高めることができる。
しかしながら、前者の地図は部分的な経路のラベル付けが欠けているため、通常は不完全である。
そこで本研究では,低高度航空機が搭載する空中センサを用いたOSMメーカを提案する。このOSMメーカのコアは,LiDARとカメラデータ,すなわちバイナリデュアルストリーム道路セグメンテーションモデルに基づく,新たな効率的なパスファインダーアプローチである。
具体的には、UNetアーキテクチャに基づくマルチスケールの機能抽出を、画像と点クラウド向けに実装する。
点雲の空間性による影響を低減するため、注目誘導ゲートブロックは、画像と点雲の特徴を統合するように設計されている。
モデルの効率を向上させるために,画像ブランチのエンコーダとして視覚変換器(ViT)アーキテクチャの変種と,モデルトレーニングを最適化するための新たな焦点・知覚損失を含む,各モデルコンポーネントに対するバイナライゼーションの合理化を提案する。
2つの実験結果から, パスファインダ法は低レベル空中センサからの経路探索において高い効率でSOTA精度を実現し, セグメント化された道路骨格に基づいてOSM前の完全な地図を作成することができることを示した。
コードとデータは、https://github.com/IMRL/Pathfinder}{https://github.com/IMRL/Pathfinderで入手できる。
関連論文リスト
- TopoSD: Topology-Enhanced Lane Segment Perception with SDMap Prior [70.84644266024571]
我々は、標準定義地図(SDMaps)を見るために知覚モデルを訓練することを提案する。
我々はSDMap要素をニューラル空間マップ表現やインスタンストークンにエンコードし、先行情報のような補完的な特徴を組み込む。
レーンセグメント表現フレームワークに基づいて、モデルはレーン、中心線、およびそれらのトポロジを同時に予測する。
論文 参考訳(メタデータ) (2024-11-22T06:13:42Z) - OSMLoc: Single Image-Based Visual Localization in OpenStreetMap with Geometric and Semantic Guidances [11.085165252259042]
OSMLocは、脳にインスパイアされた単一画像の視覚的位置決め手法であり、精度、堅牢性、一般化能力を改善するための意味的および幾何学的ガイダンスを備えている。
提案したOSMLOCを検証するため,世界規模のクロスエリアとクロスコンディション(CC)のベンチマークを収集し,広範な評価を行う。
論文 参考訳(メタデータ) (2024-11-13T14:59:00Z) - GenMapping: Unleashing the Potential of Inverse Perspective Mapping for Robust Online HD Map Construction [20.1127163541618]
我々はGenMappingというユニバーサルマップ生成フレームワークを設計した。
このフレームワークは、主および二重補助枝を含む三進的なシナジーアーキテクチャで構築されている。
実験結果の網羅的な配列から,提案手法はセマンティックマッピングとベクトル化マッピングの両方において最先端の手法を超越し,高速な推論速度を維持した。
論文 参考訳(メタデータ) (2024-09-13T10:15:28Z) - P2P-Bridge: Diffusion Bridges for 3D Point Cloud Denoising [81.92854168911704]
私たちは、Diffusion Schr"odingerブリッジをポイントクラウドに適応させる新しいフレームワークを通じて、ポイントクラウドを飾るタスクに取り組みます。
オブジェクトデータセットの実験では、P2P-Bridgeは既存のメソッドよりも大幅に改善されている。
論文 参考訳(メタデータ) (2024-08-29T08:00:07Z) - PointRegGPT: Boosting 3D Point Cloud Registration using Generative Point-Cloud Pairs for Training [90.06520673092702]
生成点クラウドペアを用いた3Dポイントクラウドの登録をトレーニングのために促進するPointRegGPTを提案する。
我々の知る限り、これは屋内のクラウド登録のためのリアルなデータ生成を探求する最初の生成的アプローチである。
論文 参考訳(メタデータ) (2024-07-19T06:29:57Z) - NNPP: A Learning-Based Heuristic Model for Accelerating Optimal Path Planning on Uneven Terrain [5.337162499594818]
本稿では,この縮小された検索空間内でのみ最適な経路をAstarのような基礎アルゴリズムで見つけることができるNNPPモデルを提案する。
NNPPモデルは、多くの事前注釈付き最適経路のデモから、スタート地点とゴール地点に関する情報とマップ表現を学習する。
新規地図上での経路計画のテキストカラー化が可能である。
論文 参考訳(メタデータ) (2023-08-09T08:31:05Z) - UnLoc: A Universal Localization Method for Autonomous Vehicles using
LiDAR, Radar and/or Camera Input [51.150605800173366]
UnLocは、全ての気象条件におけるマルチセンサー入力によるローカライズのための、新しい統一型ニューラルネットワークアプローチである。
本手法は,Oxford Radar RobotCar,Apollo SouthBay,Perth-WAの各データセットで広く評価されている。
論文 参考訳(メタデータ) (2023-07-03T04:10:55Z) - I2P-Rec: Recognizing Images on Large-scale Point Cloud Maps through
Bird's Eye View Projections [18.7557037030769]
位置認識は、完全な自律性を達成するための、自動運転車にとって重要な技術である。
クロスモーダルデータを同じモダリティに変換することで,I2P-Rec法を提案する。
トレーニングデータの小さなセットだけで、I2P-Recはポイントクラウドマップ上のモノクロ画像とステレオ画像のローカライズ時に、80%と90%でトップ1%のリコール率を達成する。
論文 参考訳(メタデータ) (2023-03-02T07:56:04Z) - Unleash the Potential of Image Branch for Cross-modal 3D Object
Detection [67.94357336206136]
画像分岐のポテンシャルを2つの側面から解き放つことを目的として,新しい3Dオブジェクト検出器UPIDetを提案する。
まず、UPIDetは正規化された局所座標写像推定と呼ばれる新しい2次元補助タスクを導入する。
第2に,イメージブランチのトレーニング目標から逆転する勾配によって,ポイントクラウドバックボーンの表現能力を向上できることを見出した。
論文 参考訳(メタデータ) (2023-01-22T08:26:58Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - Road Segmentation on low resolution Lidar point clouds for autonomous
vehicles [3.6020689500145653]
道路分割作業の精度に及ぼす高密度点雲のサブサンプリング画像による表現の影響を評価する。
LIDARの球面座標を既存のLoDNNアーキテクチャの入力チャネルとして用いる。
論文 参考訳(メタデータ) (2020-05-27T00:38:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。