論文の概要: 3D UAV Trajectory Estimation and Classification from Internet Videos via Language Model
- arxiv url: http://arxiv.org/abs/2603.09070v1
- Date: Tue, 10 Mar 2026 01:29:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.137108
- Title: 3D UAV Trajectory Estimation and Classification from Internet Videos via Language Model
- Title(参考訳): 言語モデルによるインターネット映像からの3次元UAV軌道推定と分類
- Authors: Haoxiang Lei, Daotong Wang, Shenghai Yuan, Jianbo Su,
- Abstract要約: インターネット規模のUAVビデオから直接UAV3Dトラジェクトリとカテゴリ情報を導出する新しいフレームワークを提案する。
提案手法は現状に近づき,現実の反UAVシナリオに対する堅牢性と適用性を強調した。
- 参考スコア(独自算出の注目度): 15.346439463483991
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reliable 3D trajectory estimation of unmanned aerial vehicles (UAVs) is a fundamental requirement for anti-UAV systems, yet the acquisition of large-scale and accurately annotated trajectory data remains prohibitively expensive. In this work, we present a novel framework that derives UAV 3D trajectories and category information directly from Internet-scale UAV videos, without relying on manual annotations. First, language-driven data acquisition is employed to autonomously discover and collect UAV-related videos, while vision-language reasoning progressively filters task-relevant segments. Second, a training-free cross-modal label generation module is introduced to infer 3D trajectory hypotheses and UAV type cues. Third, a physics-informed refinement process is designed to impose temporal smoothness and kinematic consistency on the estimated trajectories. The resulting video clips and trajectory annotations can be readily utilized for downstream anti-UAV tasks. To assess effectiveness and generalization, we conduct zero-shot transfer experiments on a public, well-annotated 3D UAV benchmark. Results reveal a clear data scaling behavior: as the amount of online video data increases, zero-shot transfer performance on the target dataset improves consistently, without any target-domain training. The proposed method closely approaches the current state-of-the-art, highlighting its robustness and applicability to real-world anti-UAV scenarios. Code and datasets will be released upon acceptance.
- Abstract(参考訳): 無人航空機(UAV)の信頼性の高い3次元軌道推定は、反UAVシステムの基本的な要件であるが、大規模かつ正確に注釈付けされた軌道データの取得は違法に高価である。
そこで本研究では,UAV 3Dトラジェクトリとカテゴリ情報を,手動のアノテーションに頼ることなく,インターネット規模のUAVビデオから直接引き出す新しいフレームワークを提案する。
第一に、言語によるデータ取得は、無人でUAV関連のビデオを発見し、収集するために使われ、一方視覚言語推論は、タスク関連セグメントを徐々にフィルタリングする。
第2に、3次元軌道仮説とUAV型キューを推定するために、トレーニングフリーなクロスモーダルラベル生成モジュールを導入する。
第三に、物理インフォームド・リファインメント・プロセスは、推定された軌道に時間的滑らかさと運動的一貫性を課すように設計されている。
結果として得られるビデオクリップとトラジェクトリアノテーションは、ダウンストリームのアンチUAVタスクに容易に利用できる。
提案手法の有効性と一般化を評価するため, パブリックな3D UAVベンチマークでゼロショット転送実験を行った。
オンラインビデオデータの量が増加するにつれて、ターゲットデータセット上のゼロショット転送性能は、ターゲットドメインのトレーニングを必要とせずに、一貫して改善される。
提案手法は現状に近づき,現実の反UAVシナリオに対する堅牢性と適用性を強調した。
コードとデータセットは受け入れ次第リリースされる。
関連論文リスト
- How Far are Modern Trackers from UAV-Anti-UAV? A Million-Scale Benchmark and New Baseline [74.4054700050366]
無人航空機(UAV)は広範囲のアプリケーションを提供するが、安全性とプライバシー侵害のリスクも大きい。
現在の反UAV研究は、主に固定地上カメラで撮影したRGB、赤外線(IR)、またはRGB-IRビデオに焦点を当てている。
本稿では,UAV-Anti-UAVと呼ばれるマルチモーダル視覚追跡タスクを提案する。
論文 参考訳(メタデータ) (2025-12-08T10:19:54Z) - Tracking the Unstable: Appearance-Guided Motion Modeling for Robust Multi-Object Tracking in UAV-Captured Videos [58.156141601478794]
マルチオブジェクトトラッキング(UAVT)は、ビデオのフレーム間で一貫したアイデンティティを維持しながら、複数のオブジェクトを追跡することを目的としている。
既存の手法は、通常、動作キューと外観を別々にモデル化し、それらの相互作用を見渡して、最適下追跡性能をもたらす。
本稿では、AMC行列とMTCモジュールの2つの主要コンポーネントを通して、外観と動きの手がかりを利用するAMOTを提案する。
論文 参考訳(メタデータ) (2025-08-03T12:06:47Z) - Unsupervised UAV 3D Trajectories Estimation with Sparse Point Clouds [18.48877348628721]
本稿では,時空間シーケンス処理を用いたコスト効率,教師なしUAV検出手法を提案する。
CVPR 2024 UG2+ Challengeの4位にランクインした。
我々は、研究コミュニティ.com/lianghanfang/UnLiDAR-UAV-Estのすべての設計、コード、サンプルデータをオープンソース化する予定です。
論文 参考訳(メタデータ) (2024-12-17T09:30:31Z) - VECTOR: Velocity-Enhanced GRU Neural Network for Real-Time 3D UAV Trajectory Prediction [2.1825723033513165]
シーケンスベースニューラルネットワークにおけるGRU(Gated Recurrent Units)を用いた新しいトラジェクトリ予測手法を提案する。
我々は、合成と実世界のUAV軌跡データの両方を使用し、幅広い飛行パターン、速度、機敏性を捉えています。
GRUベースのモデルは、平均二乗誤差(MSE)を2×10-8に抑えながら、最先端のRNNアプローチを著しく上回っている。
論文 参考訳(メタデータ) (2024-10-24T07:16:42Z) - Clustering-based Learning for UAV Tracking and Pose Estimation [0.0]
本研究は,UAV追跡と2種類のLiDARを用いたポーズ推定のためのクラスタリングに基づく学習検出手法であるCL-Detを開発する。
まず、Livox AviaデータとLiDAR 360データのタイムスタンプを調整し、その後、関心のあるオブジェクト(OOI)のポイントクラウドを環境から分離します。
提案手法は,CVPR 2024 UG2+ Challengeの最終リーダーボードにおいて,競争力のあるポーズ推定性能を示し,第5位にランクインする。
論文 参考訳(メタデータ) (2024-05-27T06:33:25Z) - BEV-MAE: Bird's Eye View Masked Autoencoders for Point Cloud
Pre-training in Autonomous Driving Scenarios [51.285561119993105]
自律運転におけるLiDARに基づく3Dオブジェクト検出のための,効率的なマスク付きオートエンコーダ事前学習フレームワークであるBEV-MAEを提案する。
具体的には、3Dエンコーダ学習特徴表現を導くために,鳥の目視(BEV)誘導マスキング戦略を提案する。
学習可能なポイントトークンを導入し、3Dエンコーダの一貫性のある受容的フィールドサイズを維持する。
論文 参考訳(メタデータ) (2022-12-12T08:15:03Z) - Trajectory Design for UAV-Based Internet-of-Things Data Collection: A
Deep Reinforcement Learning Approach [93.67588414950656]
本稿では,無人航空機(UAV)による3D環境におけるIoT(Internet-of-Things)システムについて検討する。
本稿では,TD3-TDCTMアルゴリズムの完成時間最小化のためのトラジェクトリ設計を提案する。
シミュレーションの結果,従来の3つの非学習ベースライン法よりもTD3-TDCTMアルゴリズムの方が優れていることが示された。
論文 参考訳(メタデータ) (2021-07-23T03:33:29Z) - Generating Synthetic Training Data for Deep Learning-Based UAV
Trajectory Prediction [11.241614693184323]
本稿では,無人航空機車(UAV)の合成軌道データを生成する手法を提案する。
実世界のUAV追跡データセットにおいて,RNNに基づく予測モデルが従来の参照モデルより優れていることを示す。
論文 参考訳(メタデータ) (2021-07-01T13:08:31Z) - Anti-UAV: A Large Multi-Modal Benchmark for UAV Tracking [59.06167734555191]
Unmanned Aerial Vehicle (UAV)は、商業とレクリエーションの両方に多くの応用を提供している。
我々は、UAVを追跡し、位置や軌道などの豊富な情報を提供するという課題を考察する。
300以上のビデオペアが580k以上の手動で注釈付きバウンディングボックスを含むデータセット、Anti-UAVを提案します。
論文 参考訳(メタデータ) (2021-01-21T07:00:15Z) - AutoTrajectory: Label-free Trajectory Extraction and Prediction from
Videos using Dynamic Points [92.91569287889203]
軌道抽出と予測のための新しいラベルなしアルゴリズムAutoTrajectoryを提案する。
動画中の移動物体をよりよく捉えるために,ダイナミックポイントを導入する。
ビデオ内の歩行者などの移動物体を表すインスタンスポイントに動的ポイントを集約する。
論文 参考訳(メタデータ) (2020-07-11T08:43:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。