論文の概要: Efficient UAV trajectory prediction: A multi-modal deep diffusion framework
- arxiv url: http://arxiv.org/abs/2602.00107v1
- Date: Mon, 26 Jan 2026 13:14:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:32.940661
- Title: Efficient UAV trajectory prediction: A multi-modal deep diffusion framework
- Title(参考訳): 効率的なUAV軌道予測:多モード深部拡散フレームワーク
- Authors: Yuan Gao, Xinyu Guo, Wenjing Xie, Zifan Wang, Hongwen Yu, Gongyang Li, Shugong Xu,
- Abstract要約: LiDARとミリ波レーダ情報の融合に基づくマルチモーダルUAV軌道予測法を提案する。
提案手法は, マルチモーダルデータを有効利用し, 低高度経済における無人UAV軌道予測のための効率的な解を提供する。
- 参考スコア(独自算出の注目度): 26.678930486634602
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To meet the requirements for managing unauthorized UAVs in the low-altitude economy, a multi-modal UAV trajectory prediction method based on the fusion of LiDAR and millimeter-wave radar information is proposed. A deep fusion network for multi-modal UAV trajectory prediction, termed the Multi-Modal Deep Fusion Framework, is designed. The overall architecture consists of two modality-specific feature extraction networks and a bidirectional cross-attention fusion module, aiming to fully exploit the complementary information of LiDAR and radar point clouds in spatial geometric structure and dynamic reflection characteristics. In the feature extraction stage, the model employs independent but structurally identical feature encoders for LiDAR and radar. After feature extraction, the model enters the Bidirectional Cross-Attention Mechanism stage to achieve information complementarity and semantic alignment between the two modalities. To verify the effectiveness of the proposed model, the MMAUD dataset used in the CVPR 2024 UG2+ UAV Tracking and Pose-Estimation Challenge is adopted as the training and testing dataset. Experimental results show that the proposed multi-modal fusion model significantly improves trajectory prediction accuracy, achieving a 40% improvement compared to the baseline model. In addition, ablation experiments are conducted to demonstrate the effectiveness of different loss functions and post-processing strategies in improving model performance. The proposed model can effectively utilize multi-modal data and provides an efficient solution for unauthorized UAV trajectory prediction in the low-altitude economy.
- Abstract(参考訳): 低高度経済における無許可UAVの管理要件を満たすため,LiDARとミリ波レーダ情報の融合に基づく多モードUAV軌道予測手法を提案する。
マルチモーダル・ディープ・フュージョン・フレームワーク(Multi-Modal Deep Fusion Framework)と呼ばれるマルチモーダルUAV軌道予測のためのディープ・フュージョン・ネットワークが設計されている。
全体的なアーキテクチャは、空間幾何学的構造と動的反射特性において、LiDARとレーダーポイント雲の相補的な情報を完全に活用することを目的として、2つのモード特化特徴抽出ネットワークと双方向相互注意融合モジュールで構成されている。
特徴抽出段階では、モデルは独立しているが構造的に同一の特徴エンコーダをLiDARとレーダーに採用している。
特徴抽出の後、モデルは双方向のクロスアテンションメカニズムステージに入り、2つのモード間の情報相補性とセマンティックアライメントを達成する。
提案モデルの有効性を検証するため,CVPR 2024 UG2+ UAV Tracking and Pose-Estimation Challengeで使用されるMMAUDデータセットをトレーニングおよびテストデータセットとして採用した。
実験結果から,提案したマルチモーダル融合モデルにより軌道予測精度が向上し,ベースラインモデルよりも40%向上することが示唆された。
さらに, 異なる損失関数と後処理がモデル性能向上に有効であることを示すため, アブレーション実験を行った。
提案手法は, マルチモーダルデータを有効利用し, 低高度経済における無人UAV軌道予測のための効率的な解を提供する。
関連論文リスト
- DiffusionDriveV2: Reinforcement Learning-Constrained Truncated Diffusion Modeling in End-to-End Autonomous Driving [65.7087560656003]
エンドツーエンドの自動運転のための生成拡散モデルは、しばしばモード崩壊に悩まされる。
強化学習を利用して低品質モードを制約し,優れた軌道探索を行うDiffusionDriveV2を提案する。
これにより、そのコアであるガウス混合モデル固有の多重モード性を維持しながら、全体的な出力品質が大幅に向上する。
論文 参考訳(メタデータ) (2025-12-08T17:29:52Z) - A Tri-Modal Dataset and a Baseline System for Tracking Unmanned Aerial Vehicles [74.8162337823142]
MM-UAVはMulti-Modal UAV Trackingの最初の大規模ベンチマークである。
データセットは30以上の挑戦的なシナリオにまたがっており、1,321の同期マルチモーダルシーケンスと280万以上の注釈付きフレームがある。
データセットを伴って、我々は新しいマルチモーダルマルチUAV追跡フレームワークを提供する。
論文 参考訳(メタデータ) (2025-11-23T08:42:17Z) - Dual-Stream Diffusion for World-Model Augmented Vision-Language-Action Model [62.889356203346985]
本稿では,モダリティ競合を処理する世界モデル拡張VLAフレームワークである Dual-STream diffusion (DUST) を提案する。
DUSTは標準のVLAベースラインと暗黙のワールドモデリングメソッドよりも最大6%向上する。
Franka Research 3による実世界のタスクでは、DUSTは成功率のベースラインを13%上回っている。
論文 参考訳(メタデータ) (2025-10-31T16:32:12Z) - Collaborative-Distilled Diffusion Models (CDDM) for Accelerated and Lightweight Trajectory Prediction [14.108460337857645]
軌道予測は自律走行車(AV)とインテリジェントトランスポーテーションシステム(ITS)の基本課題である
拡散モデルは最近、確率的軌道予測において強い性能を示した。
本稿では, リアルタイムかつ軽量な軌道予測手法であるCDDMを提案する。
論文 参考訳(メタデータ) (2025-10-01T08:00:31Z) - CoPAD : Multi-source Trajectory Fusion and Cooperative Trajectory Prediction with Anchor-oriented Decoder in V2X Scenarios [13.568599065039459]
CoPADは協調軌道予測のための軽量なフレームワークである。
車両や道路インフラからの多ソース軌跡データに対する早期融合を効果的に行う。
実験によると、CoPADはDAIR-V2X-Seqデータセット上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-09-19T13:50:49Z) - DGE-YOLO: Dual-Branch Gathering and Attention for Accurate UAV Object Detection [0.46040036610482665]
DGE-YOLOは、マルチモーダル情報を効果的に融合するために設計された拡張YOLOベースの検出フレームワークである。
具体的には、モダリティ固有の特徴抽出のためのデュアルブランチアーキテクチャを導入し、モデルが赤外線と可視画像の両方を処理できるようにする。
セマンティック表現をさらに強化するために,空間規模をまたいだ特徴学習を向上する効率的なマルチスケールアテンション(EMA)機構を提案する。
論文 参考訳(メタデータ) (2025-06-29T14:19:18Z) - Resource-Efficient Beam Prediction in mmWave Communications with Multimodal Realistic Simulation Framework [57.994965436344195]
ビームフォーミングは、方向と強度を最適化して信号伝送を改善するミリ波通信において重要な技術である。
マルチモーダルセンシング支援ビーム予測は,ユーザ位置やネットワーク条件を予測するために,さまざまなセンサデータを使用して注目されている。
その有望な可能性にもかかわらず、マルチモーダルセンシング支援ビーム予測の採用は、高い計算複雑性、高いコスト、限られたデータセットによって妨げられている。
論文 参考訳(メタデータ) (2025-04-07T15:38:25Z) - DA-STGCN: 4D Trajectory Prediction Based on Spatiotemporal Feature Extraction [6.781509470656284]
本稿では,2つの注意機構を統合した革新的なグラフ畳み込みネットワークであるDA-STGCNを提案する。
本モデルでは,自己アテンションアプローチにより隣接行列を再構成し,ノード相関の捕捉性を高める。
その結果, 平均変位誤差 (Attention) と最終変位誤差 (FDE) の20%と30%の低減を実現し, 現行の4次元軌道予測法よりも顕著な改善が見られた。
論文 参考訳(メタデータ) (2025-03-05T03:42:49Z) - FSD-BEV: Foreground Self-Distillation for Multi-view 3D Object Detection [33.225938984092274]
本稿では,分散の相違を効果的に回避するFSD方式を提案する。
また2つのポイントクラウド拡張(PCI)戦略を設計し、ポイントクラウドの幅を補う。
マルチスケール・フォアグラウンド・エンハンスメント(MSFE)モジュールを開発し,マルチスケール・フォアグラウンドの特徴を抽出・融合する。
論文 参考訳(メタデータ) (2024-07-14T09:39:44Z) - Distributed Conditional Generative Adversarial Networks (GANs) for
Data-Driven Millimeter Wave Communications in UAV Networks [116.94802388688653]
無人航空機(UAV)無線ネットワークにおけるミリ波(mmWave)通信のための,データ駆動型空対地(A2G)チャネル推定手法を提案する。
実効的なチャネル推定手法を開発し、各UAVは、各ビームフォーミング方向に沿って条件付き生成対向ネットワーク(CGAN)を介してスタンドアロンチャネルモデルを訓練することができる。
分散CGANアーキテクチャに基づく協調的なフレームワークを開発し、各UAVがmmWaveチャネルの分布を協調的に学習できるようにする。
論文 参考訳(メタデータ) (2021-02-02T20:56:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。