論文の概要: Landmark Stereo Dataset for Landmark Recognition and Moving Node
Localization in a Non-GPS Battlefield Environment
- arxiv url: http://arxiv.org/abs/2402.12320v1
- Date: Mon, 19 Feb 2024 17:49:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-20 15:08:31.674203
- Title: Landmark Stereo Dataset for Landmark Recognition and Moving Node
Localization in a Non-GPS Battlefield Environment
- Title(参考訳): 非gps戦場におけるランドマーク認識と移動ノード定位のためのランドマークステレオデータセット
- Authors: Ganesh Sapkota, Sanjay Madria
- Abstract要約: 移動部隊や防衛部隊の仮想座標を得るために,無線ベースのアンカーノードの代わりにランドマークアンカーを用いる新たな戦略を提案する。
提案手法は,Yolov5モデルを用いたランドマーク認識と,効率的なステレオマッチングアルゴリズムを用いたランドマーク距離推定を実現する。
- 参考スコア(独自算出の注目度): 1.19658449368018
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we have proposed a new strategy of using the landmark anchor
node instead of a radio-based anchor node to obtain the virtual coordinates
(landmarkID, DISTANCE) of moving troops or defense forces that will help in
tracking and maneuvering the troops along a safe path within a GPS-denied
battlefield environment. The proposed strategy implements landmark recognition
using the Yolov5 model and landmark distance estimation using an efficient
Stereo Matching Algorithm. We consider that a moving node carrying a low-power
mobile device facilitated with a calibrated stereo vision camera that captures
stereo images of a scene containing landmarks within the battlefield region
whose locations are stored in an offline server residing within the device
itself. We created a custom landmark image dataset called MSTLandmarkv1 with 34
landmark classes and another landmark stereo dataset of those 34 landmark
instances called MSTLandmarkStereov1. We trained the YOLOv5 model with
MSTLandmarkv1 dataset and achieved 0.95 mAP @ 0.5 IoU and 0.767 mAP @ [0.5:
0.95] IoU. We calculated the distance from a node to the landmark utilizing the
bounding box coordinates and the depth map generated by the improved SGM
algorithm using MSTLandmarkStereov1. The tuple of landmark IDs obtained from
the detection result and the distances calculated by the SGM algorithm are
stored as the virtual coordinates of a node. In future work, we will use these
virtual coordinates to obtain the location of a node using an efficient
trilateration algorithm and optimize the node position using the appropriate
optimization method.
- Abstract(参考訳): そこで本研究では,無線ベースのアンカーノードではなく,ランドマークアンカーノードを用いて移動部隊や防衛部隊の仮想座標(陸路,距離)を取得し,gpsで防御された戦場環境内の安全な経路に沿って部隊を追跡し、操る新たな戦略を提案する。
提案手法は,yolov5モデルを用いたランドマーク認識と,効率的なステレオマッチングアルゴリズムを用いたランドマーク距離推定を実現する。
低消費電力のモバイルデバイスを搭載した移動ノードは、キャリブレーションされたステレオビジョンカメラを用いて、デバイス自体に存在するオフラインサーバに格納された戦場領域内のランドマークを含むシーンのステレオ画像をキャプチャする。
私たちは、カスタムランドマークデータセットmstlandmarkv1を作り、34のランドマーククラスと、その34のランドマークインスタンスの別のランドマークステレオデータセット、mstlandmarkstereov1を作成しました。
YOLOv5モデルをMSTLandmarkv1データセットでトレーニングし,0.95 mAP @ 0.5 IoUと0.767 mAP @ [0.5: 0.95] IoUを達成した。
我々は,MSTLandmarkStereov1を用いた改良SGMアルゴリズムにより生成された境界ボックス座標と深度マップを用いて,ノードからランドマークまでの距離を計算した。
検出結果から得られたランドマークIDのタプルとSGMアルゴリズムによって算出された距離をノードの仮想座標として記憶する。
今後の研究では,これらの仮想座標を用いて効率的な三角アルゴリズムを用いてノードの位置を求め,適切な最適化手法を用いてノード位置を最適化する。
関連論文リスト
- Landmark-based Localization using Stereo Vision and Deep Learning in
GPS-Denied Battlefield Environment [1.19658449368018]
本稿では、受動カメラセンサのみを用いた非GPS戦場環境におけるローカライズのための新しいフレームワークを提案する。
提案手法では,距離推定にカスタムキャリブレーションされたステレオカメラと,実世界のランドマーク認識のためのデータセットを用いて訓練および微調整を行うYOLOv8sモデルを用いる。
実験の結果,提案手法は既存のアンカーベースDV-Hopアルゴリズムよりも優れた性能を示し,ローカライゼーション誤差(RMSE)の点で最も効率的な視覚ベースアルゴリズムと競合することがわかった。
論文 参考訳(メタデータ) (2024-02-19T21:20:56Z) - FocusTune: Tuning Visual Localization through Focus-Guided Sampling [61.79440120153917]
FocusTuneは、視覚的ローカライゼーションアルゴリズムの性能を改善するための焦点誘導サンプリング技術である。
ACEの魅力ある低ストレージと計算要求を維持しながら、FocusTuneは最先端のパフォーマンスを改善したり、一致させたりします。
ハイパフォーマンスとローコンピュートとストレージの要件の組み合わせは、特にモバイルロボティクスや拡張現実といった分野のアプリケーションには有望だ。
論文 参考訳(メタデータ) (2023-11-06T04:58:47Z) - V-DETR: DETR with Vertex Relative Position Encoding for 3D Object
Detection [73.37781484123536]
DETRフレームワークを用いた点雲のための高性能な3次元物体検出器を提案する。
限界に対処するため,新しい3次元相対位置(3DV-RPE)法を提案する。
挑戦的なScanNetV2ベンチマークで例外的な結果を示す。
論文 参考訳(メタデータ) (2023-08-08T17:14:14Z) - Combining geolocation and height estimation of objects from street level
imagery [5.887281983256354]
道路レベルRGB画像からの多クラス物体位置推定と高さ推定を組み合わせたパイプラインを提案する。
提案手法は、カスタムトレーニングされた畳み込みニューラルネットワークで検出された画像平面内の物体の座標とともに画像メタデータを使用する。
論文 参考訳(メタデータ) (2023-05-14T19:40:02Z) - Neural Implicit Dense Semantic SLAM [83.04331351572277]
本稿では,屋内シーンのメモリ効率,高密度な3次元形状,セマンティックセマンティックセグメンテーションをオンラインで学習する新しいRGBD vSLAMアルゴリズムを提案する。
私たちのパイプラインは、従来の3Dビジョンベースのトラッキングとループクローズとニューラルフィールドベースのマッピングを組み合わせたものです。
提案アルゴリズムはシーン認識を大幅に向上させ,様々なロボット制御問題を支援する。
論文 参考訳(メタデータ) (2023-04-27T23:03:52Z) - Satellite Image Based Cross-view Localization for Autonomous Vehicle [59.72040418584396]
本稿では,市販の高精細衛星画像を使用可能な地図として利用することにより,良好な精度でクロスビュー車両のローカライゼーションを実現することができることを示す。
本手法はKITTIとFord Multi-AVの季節データセットを地上ビューとして,Google Mapsを衛星ビューとして検証した。
論文 参考訳(メタデータ) (2022-07-27T13:16:39Z) - Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文 参考訳(メタデータ) (2021-08-12T15:22:33Z) - From Voxel to Point: IoU-guided 3D Object Detection for Point Cloud with
Voxel-to-Point Decoder [79.39041453836793]
We present an Intersection-over-Union (IoU) guided two-stage 3D object detector with a voxel-to-point decoder。
本稿では,Voxel based Region Proposal Network (RPN) からマップビュー機能に加えて,点特徴を抽出する残余のvoxel-to-pointデコーダを提案する。
そこで本研究では,推定したIoUと改良された提案ボックスをより関連性の高いローカライゼーション信頼度として整列する,簡便で効率的な手法を提案する。
論文 参考訳(メタデータ) (2021-08-08T14:30:13Z) - Object Tracking and Geo-localization from Street Images [4.5958644027273685]
本稿では,低フレームレートのストリートビデオから交通標識を検出・位置情報化するフレームワークを提案する。
提案システムは、カメラに対する各符号の位置オフセットを予測するRetinaNet(GPS-RetinaNet)の修正版を用いている。
提案したデータセットは、幅広い道路から収集された多様な環境群をカバーする。
論文 参考訳(メタデータ) (2021-07-13T17:32:04Z) - Automated 3D cephalometric landmark identification using computerized
tomography [1.4349468613117398]
頭蓋骨の形状を代用する3次元頭蓋骨計測のランドマークの同定は、頭蓋骨計測の基本的なステップである。
近年,ディープラーニング(dl)を用いた2次元頭部画像の自動ランドマーク作成が大きな成功を収めているが,80以上のランドマークに対する3次元ランドマークは,まだ満足のいくレベルには達していない。
本論文では,匿名化されたランドマークデータセットと対のCTデータを取り除いた,半教師付き3次元ランドマーク用DL法を提案する。
論文 参考訳(メタデータ) (2020-12-16T07:29:32Z) - Evaluation of 3D CNN Semantic Mapping for Rover Navigation [0.6882042556551609]
火星環境の正確な3次元セマンティックマップを生成する手法を提案する。
このアルゴリズムは、ローバーに搭載されたカメラによって取得されたステレオ画像を入力として使用する。
我々は、ESA Katwijk Beach Planetary Roverデータセットに対するアプローチを評価した。
論文 参考訳(メタデータ) (2020-06-17T10:24:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。