論文の概要: An End-to-end Flight Control Network for High-speed UAV Obstacle Avoidance based on Event-Depth Fusion
- arxiv url: http://arxiv.org/abs/2603.27181v1
- Date: Sat, 28 Mar 2026 07:57:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.831625
- Title: An End-to-end Flight Control Network for High-speed UAV Obstacle Avoidance based on Event-Depth Fusion
- Title(参考訳): 事象深度融合に基づく高速UAV障害物回避のためのエンドツーエンド飛行制御ネットワーク
- Authors: Dikai Shang, Jingyue Zhao, Shi Xu, Nanyang Ye, Lei Wang,
- Abstract要約: 本稿では,深度画像とイベントデータのレベル融合を特徴とするエンドツーエンド飛行制御ネットワークを提案する。
本手法は, 様々な場面で17m/sで70-80%の成功率を達成した。
- 参考スコア(独自算出の注目度): 6.267029265828005
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Achieving safe, high-speed autonomous flight in complex environments with static, dynamic, or mixed obstacles remains challenging, as a single perception modality is incomplete. Depth cameras are effective for static objects but suffer from motion blur at high speeds. Conversely, event cameras excel at capturing rapid motion but struggle to perceive static scenes. To exploit the complementary strengths of both sensors, we propose an end-to-end flight control network that achieves feature-level fusion of depth images and event data through a bidirectional crossattention module. The end-to-end network is trained via imitation learning, which relies on high-quality supervision. Building on this insight, we design an efficient expert planner using Spherical Principal Search (SPS). This planner reduces computational complexity from $O(n^2)$ to $O(n)$ while generating smoother trajectories, achieving over 80% success rate at 17m/s--nearly 20% higher than traditional planners. Simulation experiments show that our method attains a 70-80% success rate at 17 m/s across varied scenes, surpassing single-modality and unidirectional fusion models by 10-20%. These results demonstrate that bidirectional fusion effectively integrates event and depth information, enabling more reliable obstacle avoidance in complex environments with both static and dynamic objects.
- Abstract(参考訳): 単一の知覚モダリティが不完全であるため、静的、動的、または混合障害のある複雑な環境で安全で高速な自律飛行を実現することは依然として困難である。
奥行きカメラは静的物体に対して有効であるが、高速で動きがぼやけている。
逆に、イベントカメラは速い動きを捉えるのが得意だが、静的なシーンを知覚するのに苦労する。
両センサの相補的な強度を利用するために,双方向のクロスアテンションモジュールによる深度画像とイベントデータの特徴レベルの融合を実現するエンドツーエンドの飛行制御ネットワークを提案する。
エンドツーエンドのネットワークは、高品質な監視に依存する模倣学習によって訓練される。
この知見に基づいて、SPS(Spherical principal Search)を用いた効率的なエキスパートプランナを設計する。
このプランナーは計算複雑性を$O(n^2)$から$O(n)$に減らし、スムーズな軌道を発生させ、17m/sで80%以上の成功率を達成する。
シミュレーション実験により,本手法は17m/sで17m/sで70-80%成功し,一方向融合モデルと一方向融合モデルを10-20%超えた。
これらの結果は、双方向融合がイベント情報と深度情報を効果的に統合し、静的および動的オブジェクトの両方で複雑な環境においてより信頼性の高い障害物回避を可能にすることを示す。
関連論文リスト
- ImpedanceDiffusion: Diffusion-Based Global Path Planning for UAV Swarm Navigation with Generative Impedance Control [1.9182058480922208]
ImpedanceDiffusionは、乱雑な屋内環境における安全な群れナビゲーションのための階層的なフレームワークである。
このフレームワークは,RGB画像から直接幾何学的グローバルな軌跡を生成する。
安定なインピーダンスベース生成制御を維持しつつ、有界振動と飛行中の衝突のない92%の成功率を達成する。
論文 参考訳(メタデータ) (2026-03-10T00:06:55Z) - HAD: Hierarchical Asymmetric Distillation to Bridge Spatio-Temporal Gaps in Event-Based Object Tracking [80.07224739976911]
イベントカメラは例外的な時間分解能と範囲(モード)を提供する
RGBカメラは高解像度でリッチテクスチャを捉えるのに優れていますが、イベントカメラは例外的な時間分解能とレンジ(モダル)を提供します。
論文 参考訳(メタデータ) (2025-10-22T13:15:13Z) - Skyshield: Event-Driven Submillimetre Thin Obstacle Detection for Drone Flight Safety [22.778033892271555]
本稿では,イベント駆動型エンドツーエンドフレームワークであるSkyShieldについて紹介する。
提案手法では,U-Net アーキテクチャとDice-Contour 正規化損失を用いて精度の高い検出を行う。
論文 参考訳(メタデータ) (2025-08-13T00:26:35Z) - YOLOv8-SMOT: An Efficient and Robust Framework for Real-Time Small Object Tracking via Slice-Assisted Training and Adaptive Association [5.07987775511372]
本稿では,MVA 2025 "Finding Birds" Small Multi-Object Tracking Challenge (SMOT4SB)におけるチャンピオンシップ獲得ソリューションについて述べる。
トラッキング・バイ・検出のパラダイムを採用し、検出レベルとアソシエーションレベルの両方で目標とするイノベーションを実現している。
本手法はSMOT4SB公開テストセット上での最先端性能を実現し,SO-HOTAスコアの textbf55.205 に達する。
論文 参考訳(メタデータ) (2025-07-16T09:51:19Z) - NOVA: Navigation via Object-Centric Visual Autonomy for High-Speed Target Tracking in Unstructured GPS-Denied Environments [56.35569661650558]
我々はNOVAというオブジェクト中心のフレームワークを導入し、ロバストな目標追跡と衝突認識ナビゲーションを可能にした。
グローバルマップを構築するのではなく、NOVAはターゲットの参照フレーム内での知覚、推定、制御を定式化する。
我々は,都市迷路や森林の小道,間欠的なGPS損失を伴う建物内の繰り返し遷移など,現実の挑戦的なシナリオにまたがってNOVAを検証する。
論文 参考訳(メタデータ) (2025-06-23T14:28:30Z) - FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [92.4205087439928]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。
自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。
PSTは、画像基盤モデルとの遅延空間アライメントによるクロスモーダルな知識伝達を確立し、データ不足を効果的に軽減する。
FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
この組み合わせのアプローチにより、FUSEはターゲットデータセットに対する軽量デコーダ適応のみを必要とするユニバーサルなイメージイベントを構築することができる。
論文 参考訳(メタデータ) (2025-03-25T15:04:53Z) - Open-World Drone Active Tracking with Goal-Centered Rewards [62.21394499788672]
Drone Visual Active Trackingは、視覚的な観察に基づいてモーションシステムを制御することで、対象物を自律的に追跡することを目的としている。
DATは,世界初となるエア・ツー・グラウンド・トラッキング・ベンチマークである。
また,複雑なシナリオにおけるドローン追跡目標の性能向上を目的としたGC-VATを提案する。
論文 参考訳(メタデータ) (2024-12-01T09:37:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。