論文の概要: Dual Pose-Graph Semantic Localization for Vision-Based Autonomous Drone Racing
- arxiv url: http://arxiv.org/abs/2604.15168v1
- Date: Thu, 16 Apr 2026 15:47:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.989718
- Title: Dual Pose-Graph Semantic Localization for Vision-Based Autonomous Drone Racing
- Title(参考訳): ビジョンベース自律型ドローンレースにおけるデュアルポーズグラフのセマンティックな位置決め
- Authors: David Perez-Saura, Miguel Fernandez-Cortizas, Alvaro J. Gaona, Pascual Campoy,
- Abstract要約: 既存の視覚SLAMシステムは、運動のぼやけと、レーシングダイナミクスに固有の機能不安定に悩まされている。
本稿では,ロバストなローカライゼーションのためのセマンティック検出とオドメトリーを融合した二重ポーズグラフアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous drone racing demands robust real-time localization under extreme conditions: high-speed flight, aggressive maneuvers, and payload-constrained platforms that often rely on a single camera for perception. Existing visual SLAM systems, while effective in general scenarios, struggle with motion blur and feature instability inherent to racing dynamics, and do not exploit the structured nature of racing environments. In this work, we present a dual pose-graph architecture that fuses odometry with semantic detections for robust localization. A temporary graph accumulates multiple gate observations between keyframes and optimizes them into a single refined constraint per landmark, which is then promoted to a persistent main graph. This design preserves the information richness of frequent detections while preventing graph growth from degrading real-time performance. The system is designed to be sensor-agnostic, although in this work we validate it using monocular visual-inertial odometry and visual gate detections. Experimental evaluation on the TII-RATM dataset shows a 56% to 74% reduction in ATE compared to standalone VIO, while an ablation study confirms that the dual-graph architecture achieves 10% to 12% higher accuracy than a single-graph baseline at identical computational cost. Deployment in the A2RL competition demonstrated that the system performs real-time onboard localization during flight, reducing the drift of the odometry baseline by up to 4.2 m per lap.
- Abstract(参考訳): 自律型ドローンレースは、高速飛行、アグレッシブな操縦、そして認識のために1台のカメラにしばしば依存するペイロード制限されたプラットフォームなど、極端な条件下での堅牢なリアルタイムローカライゼーションを要求する。
既存の視覚SLAMシステムは、一般的なシナリオでは有効であるが、運動のぼやけと、レーシングのダイナミクスに固有の特徴的不安定さに悩まされており、レース環境の構造的性質を生かしていない。
本研究では,ロバストなローカライゼーションのためのセマンティック検出とオドメトリーを融合した二重ポーズグラフアーキテクチャを提案する。
一時グラフはキーフレーム間の複数のゲート観測を蓄積し、それらをランドマークごとに1つの洗練された制約に最適化する。
この設計では、頻繁な検出の情報豊かさを保ちながら、グラフの成長がリアルタイムのパフォーマンスを劣化させるのを防ぐ。
このシステムはセンサに依存しないように設計されているが、本研究では、単眼の視覚-慣性眼球計測と視覚ゲート検出を用いて評価する。
また,TII-RATMデータセットを用いた評価では,スタンドアロンのVIOに比べてATEが56%から74%減少し,二重グラフアーキテクチャが同一計算コストで単グラフベースラインよりも10%から12%高い精度で達成されていることを確認した。
A2RLコンペティションの展開により、システムは飛行中にリアルタイムのオンボードローカライゼーションを実行し、オドメトリーのベースラインのドリフトを1周あたり4.2mまで低減した。
関連論文リスト
- H-RINS: Hierarchical Tightly-coupled Radar-Inertial Navigation via Smoothing and Mapping [2.3821762993135507]
ミリ波レーダーは、視覚的に劣化した環境で堅牢な知覚を提供する。
レーダー慣性状態推定は本質的にドリフトの影響を受けやすい。
本稿では,密結合型階層型レーダ慣性係数グラフフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-14T20:30:49Z) - Robust Tightly-Coupled Filter-Based Monocular Visual-Inertial State Estimation and Graph-Based Evaluation for Autonomous Drone Racing [5.29147071389637]
自律型ドローンレースのための堅牢な視覚-慣性推定フレームワークを提案する。
ADR-VINS は平均 RMS 変換 0.134 m, ADR-FGO は 0.060 m である。
最後に,ADR-FGOによる飛行後評価について述べる。
論文 参考訳(メタデータ) (2026-03-03T08:43:49Z) - A2VISR: An Active and Adaptive Ground-Aerial Localization System Using Visual Inertial and Single-Range Fusion [17.59898575353575]
これは、地上と航空の協調システムを用いて、散在した環境下での飛行ロボットのロケライズロバスト性を高めるための実践的なアプローチである。
我々は、アクティブビジョン、単一配列、慣性計測、光学フローを統合した地上局地化フレームワークをより包括的に改善する。
提案手法は、平均根平均平方誤差が約0.09mであり、損失とセンサ故障を捕捉するためのレジリエンスを維持しながら、ロバストなオンラインローカライゼーションを実現する。
論文 参考訳(メタデータ) (2025-12-18T10:07:06Z) - Expert Switching for Robust AAV Landing: A Dual-Detector Framework in Simulation [0.0]
2人のYOLOv8専門家が、HelipadCatデータセットのスケール特化バージョンでトレーニングされている。
推論の間、どちらの専門家も並列に操作し、幾何学的なゲーティング機構は、AAVの視点と最も一致した予測を持つ専門家を選択する。
その結果, 単検出器ベースラインに比べてアライメント, 着陸精度, 全体的なロバスト性は著しく向上した。
論文 参考訳(メタデータ) (2025-12-16T03:41:59Z) - Detecting Anomalies in Dynamic Graphs via Memory enhanced Normality [39.476378833827184]
動的グラフにおける異常検出は、グラフ構造と属性の時間的進化によって大きな課題となる。
時空間記憶強調グラフオートエンコーダ(STRIPE)について紹介する。
STRIPEは、AUCスコアが5.8%改善し、トレーニング時間が4.62倍速く、既存の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2024-03-14T02:26:10Z) - Recurrent Vision Transformers for Object Detection with Event Cameras [62.27246562304705]
本稿では,イベントカメラを用いた物体検出のための新しいバックボーンであるリカレントビジョントランス (RVT) を提案する。
RVTは、イベントベースのオブジェクト検出で最先端のパフォーマンスに到達するために、ゼロからトレーニングすることができる。
私たちの研究は、イベントベースのビジョンを超えた研究に役立ち得る効果的なデザイン選択に、新たな洞察をもたらします。
論文 参考訳(メタデータ) (2022-12-11T20:28:59Z) - Correlating sparse sensing for large-scale traffic speed estimation: A
Laplacian-enhanced low-rank tensor kriging approach [76.45949280328838]
本稿では,Laplacian enhanced Low-rank tensor (LETC) フレームワークを提案する。
次に,提案したモデルをネットワークワイド・クリグにスケールアップするために,複数の有効な数値手法を用いて効率的な解アルゴリズムを設計する。
論文 参考訳(メタデータ) (2022-10-21T07:25:57Z) - Vision in adverse weather: Augmentation using CycleGANs with various
object detectors for robust perception in autonomous racing [70.16043883381677]
自律レースでは、天気は突然変化し、認識が著しく低下し、非効率な操作が引き起こされる。
悪天候の検知を改善するために、ディープラーニングベースのモデルは通常、そのような状況下でキャプチャされた広範なデータセットを必要とする。
本稿では,5つの最先端検出器のうち4つの性能向上を図るために,自動レース(CycleGANを用いた)における合成悪条件データセットを用いた手法を提案する。
論文 参考訳(メタデータ) (2022-01-10T10:02:40Z) - Spatio-temporal Modeling for Large-scale Vehicular Networks Using Graph
Convolutional Networks [110.80088437391379]
SMARTと呼ばれるグラフベースのフレームワークが提案され、大規模な地理的領域にわたるV2I通信遅延の統計をモデル化し、追跡する。
深層Q-networksアルゴリズムと統合したグラフ畳み込みネットワークを用いたグラフ再構築型手法を開発する。
その結果,提案手法は,モデル化の精度と効率と,大規模車両ネットワークにおける遅延性能を有意に向上させることが示された。
論文 参考訳(メタデータ) (2021-03-13T06:56:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。