論文の概要: Self-supervised Domain Adaptation for Visual 3D Pose Estimation of Nano-drone Racing Gates by Enforcing Geometric Consistency
- arxiv url: http://arxiv.org/abs/2603.02936v1
- Date: Tue, 03 Mar 2026 12:46:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.858444
- Title: Self-supervised Domain Adaptation for Visual 3D Pose Estimation of Nano-drone Racing Gates by Enforcing Geometric Consistency
- Title(参考訳): 幾何学的整合性強化によるナノッドレースゲートの視覚的3次元位置推定のための自己教師付きドメイン適応
- Authors: Nicholas Carlotti, Michele Antonazzi, Elia Cereda, Mirko Nava, Nicola Basilico, Daniele Palossi, Alessandro Giusti,
- Abstract要約: シミュレーションデータに基づいて事前学習した畳み込みニューラルネットワークを用いて,ナノクワッドロータの前方のドローンレースゲートの相対的なポーズを視覚的に推定する作業を検討する。
ゲートの前方に任意の軌道を飛行するドローンによって収集された実画像のみを用いた教師なし領域適応(UDA)手法を提案する。
- 参考スコア(独自算出の注目度): 43.497514957094275
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the task of visually estimating the relative pose of a drone racing gate in front of a nano-quadrotor, using a convolutional neural network pre-trained on simulated data to regress the gate's pose. Due to the sim-to-real gap, the pre-trained model underperforms in the real world and must be adapted to the target domain. We propose an unsupervised domain adaptation (UDA) approach using only real image sequences collected by the drone flying an arbitrary trajectory in front of a gate; sequences are annotated in a self-supervised fashion with the drone's odometry as measured by its onboard sensors. On this dataset, a state consistency loss enforces that two images acquired at different times yield pose predictions that are consistent with the drone's odometry. Results indicate that our approach outperforms other SoA UDA approaches, has a low mean absolute error in position (x=26, y=28, z=10 cm) and orientation ($ψ$=13${^{\circ}}$), an improvement of 40% in position and 37% in orientation over a baseline. The approach's effectiveness is appreciable with as few as 10 minutes of real-world flight data and yields models with an inference time of 30.4ms (33 fps) when deployed aboard the Crazyflie 2.1 Brushless nano-drone.
- Abstract(参考訳): シミュレーションデータに基づいて事前学習した畳み込みニューラルネットワークを用いて,ナノクワッドロータの前方のドローンレースゲートの相対的なポーズを視覚的に推定する作業を検討する。
sim-to-realのギャップのため、事前訓練されたモデルは現実世界では性能が低く、ターゲット領域に適応しなければならない。
ゲート前で任意の軌道を飛行するドローンが収集する実画像のみを用いて,無人領域適応(UDA)アプローチを提案する。
このデータセットでは、状態整合性の喪失により、異なるタイミングで取得した2つの画像が、ドローンの計測値と一致したポーズを予測することが強制される。
その結果,本手法は他のSoA UDAアプローチよりも優れており,位置の絶対誤差が低い(x=26, y=28, z=10 cm)。
アプローチの有効性は、10分間の実際の飛行データで評価でき、クレイジーフリー2.1 ブルーシュレス ナノドロンの搭載時に30.4ms (33 fps)の推力を持つモデルが得られる。
関連論文リスト
- DroneKey++: A Size Prior-free Method and New Benchmark for Drone 3D Pose Estimation from Sequential Images [1.7188280334580195]
DroneKey++は、キーポイント検出、ドローン分類、および3Dポーズ推定を共同で実行する、事前フリーのフレームワークである。
データセットの制限に対処するため、6DroneSynという大規模な合成ベンチマークを構築し、7つのドローンモデルと88の屋外背景を50K以上の画像でカバーする。
実験の結果、DroneKey++はMAE 17.34 deg、MedAE 17.1 degはローテーション、MAE 0.135 m、MedAE 0.242 mが翻訳された。
論文 参考訳(メタデータ) (2026-02-05T21:41:20Z) - iGaussian: Real-Time Camera Pose Estimation via Feed-Forward 3D Gaussian Splatting Inversion [62.09575122593993]
iGaussianは2段階のフィードフォワードフレームワークで、直接3Dガウス変換によるリアルタイムカメラポーズ推定を実現する。
NeRF Synthetic, Mip-NeRF 360, T&T+DB データセットの実験結果から, 従来の手法に比べて大幅な性能向上が得られた。
論文 参考訳(メタデータ) (2025-11-18T05:22:22Z) - DroneKey: Drone 3D Pose Estimation in Image Sequences using Gated Key-representation and Pose-adaptive Learning [1.7188280334580195]
DroneKeyは、2Dキーポイント検出器とドローン用に設計された3Dポーズ推定器を組み合わせたフレームワークだ。
実験により,本手法はキーポイント検出において99.68%(OKS)のAPを達成し,既存手法より優れていることが示された。
3次元ポーズ推定では10.62degのMAE角,0.221mのRMSE,0.076mのMAE絶対値を得た。
論文 参考訳(メタデータ) (2025-08-25T07:40:31Z) - Self-Supervised Monocular Visual Drone Model Identification through Improved Occlusion Handling [17.368574409020475]
Ego-motion Estimation(エゴモーション推定)は、GPSで測定された環境で飛行するドローンにとって不可欠である。
本稿では,単眼ビデオとフライトコントローラのデータのみを用いて,ニューラルネットワークに基づくドローンモデルを訓練するための自己教師型学習手法を提案する。
従来のフィルタベースのVIOシステムに統合することで、ニューラルドローンモデルの価値を実証する。
論文 参考訳(メタデータ) (2025-04-30T14:38:01Z) - High-throughput Visual Nano-drone to Nano-drone Relative Localization using Onboard Fully Convolutional Networks [51.23613834703353]
相対的なドローンとドローンのローカライゼーションは、どんなSwarm操作でも基本的なビルディングブロックである。
我々は、新しいビジョンベース完全畳み込みニューラルネットワーク(FCNN)に基づく垂直統合システムを提案する。
その結果,水平画像座標で32~47%,垂直画像座標で18~55%,実世界の30k画像のデータセットでR2乗改善が得られた。
論文 参考訳(メタデータ) (2024-02-21T12:34:31Z) - A3D: Adaptive, Accurate, and Autonomous Navigation for Edge-Assisted
Drones [12.439787085435661]
本稿では,エッジサーバによるドローンナビゲーションフレームワークであるA3Dを提案する。
A3Dは、非適応的なソリューションと比較して、エンドツーエンドのレイテンシを28.06%削減し、フライト距離を27.28%まで拡張することができる。
論文 参考訳(メタデータ) (2023-07-19T10:23:28Z) - Collaborative Learning with a Drone Orchestrator [79.75113006257872]
インテリジェントな無線デバイス群は、ドローンの助けを借りて共有ニューラルネットワークモデルを訓練する。
提案したフレームワークは,トレーニングの大幅な高速化を実現し,ドローンホバリング時間の平均24%と87%の削減を実現している。
論文 参考訳(メタデータ) (2023-03-03T23:46:25Z) - Image Generation for Efficient Neural Network Training in Autonomous
Drone Racing [15.114944019221456]
自律型ドローンレースでは、未知の環境で完全に自律的に飛行することで、この課題を達成する必要がある。
色や幾何学に基づく従来の物体検出アルゴリズムは失敗する傾向がある。
本研究では,実際の背景画像とゲートのランダム化3次元レンダリングを組み合わせた半合成データセット生成手法を提案する。
論文 参考訳(メタデータ) (2020-08-06T12:07:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。