論文の概要: Infrared UAV Target Tracking with Dynamic Feature Refinement and Global Contextual Attention Knowledge Distillation
- arxiv url: http://arxiv.org/abs/2512.04581v1
- Date: Thu, 04 Dec 2025 08:49:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-05 21:11:46.080081
- Title: Infrared UAV Target Tracking with Dynamic Feature Refinement and Global Contextual Attention Knowledge Distillation
- Title(参考訳): 動的特徴補正とグローバルコンテキスト注意知識蒸留による赤外線UAV目標追跡
- Authors: Houzhang Fang, Chenxing Wu, Kun Bai, Tianqi Chen, Xiaolin Wang, Xiyang Liu, Yi Chang, Luxin Yan,
- Abstract要約: 熱赤外画像に基づく無人航空機(UAV)の目標追跡は、反UAV用途において最も重要なセンシング技術の一つである。
我々は,赤外線UAV(IRUT)追跡のための特徴強調とグローバルなコンテキストアテンション知識蒸留を統合した,新しい動的特徴融合SiamDFFを提案する。
実際の赤外線UAVデータセットに対する実験により、提案手法は複雑な背景下で最先端のターゲットトラッカーより優れ、リアルタイムの追跡速度が達成できることが示された。
- 参考スコア(独自算出の注目度): 30.495249297864664
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Unmanned aerial vehicle (UAV) target tracking based on thermal infrared imaging has been one of the most important sensing technologies in anti-UAV applications. However, the infrared UAV targets often exhibit weak features and complex backgrounds, posing significant challenges to accurate tracking. To address these problems, we introduce SiamDFF, a novel dynamic feature fusion Siamese network that integrates feature enhancement and global contextual attention knowledge distillation for infrared UAV target (IRUT) tracking. The SiamDFF incorporates a selective target enhancement network (STEN), a dynamic spatial feature aggregation module (DSFAM), and a dynamic channel feature aggregation module (DCFAM). The STEN employs intensity-aware multi-head cross-attention to adaptively enhance important regions for both template and search branches. The DSFAM enhances multi-scale UAV target features by integrating local details with global features, utilizing spatial attention guidance within the search frame. The DCFAM effectively integrates the mixed template generated from STEN in the template branch and original template, avoiding excessive background interference with the template and thereby enhancing the emphasis on UAV target region features within the search frame. Furthermore, to enhance the feature extraction capabilities of the network for IRUT without adding extra computational burden, we propose a novel tracking-specific target-aware contextual attention knowledge distiller. It transfers the target prior from the teacher network to the student model, significantly improving the student network's focus on informative regions at each hierarchical level of the backbone network. Extensive experiments on real infrared UAV datasets demonstrate that the proposed approach outperforms state-of-the-art target trackers under complex backgrounds while achieving a real-time tracking speed.
- Abstract(参考訳): 熱赤外画像に基づく無人航空機(UAV)の目標追跡は、反UAV用途において最も重要なセンシング技術の一つである。
しかし、赤外線UAVターゲットは、しばしば弱い特徴と複雑な背景を示し、正確な追跡に重大な課題を生じさせる。
これらの問題に対処するため,我々は,赤外線UAV(IRUT)追跡のための機能拡張とグローバルなコンテキストアテンション知識蒸留を統合した,新しい動的特徴融合SiamDFFを提案する。
SiamDFFには、選択的ターゲット拡張ネットワーク(STEN)、動的空間特徴集約モジュール(DSFAM)、動的チャネル特徴集約モジュール(DCFAM)が組み込まれている。
STENは、テンプレートとサーチブランチの両方の重要な領域を適応的に拡張するために、強度対応のマルチヘッドクロスアテンションを採用している。
DSFAMは、局所的な詳細をグローバルな特徴と統合し、検索フレーム内の空間的注意誘導を活用することにより、マルチスケールのUAVターゲット機能を強化する。
DCFAMは、STENから生成された混合テンプレートをテンプレートブランチとオリジナルテンプレートに効果的に統合し、テンプレートとの過剰なバックグラウンド干渉を回避し、検索フレーム内のUAVターゲット領域の特徴を強調する。
さらに,IRUT用ネットワークの特徴抽出能力を高めるために,新たな追従型目標認識型コンテキストアテンション知識蒸留器を提案する。
教師ネットワークから学生モデルに先立ってターゲットを転送し、学生ネットワークがバックボーンネットワークの各階層レベルにおいて情報的領域に焦点を当てることを大幅に改善する。
実際の赤外線UAVデータセットに対する大規模な実験により、提案手法は複雑な背景下での最先端のターゲットトラッカーよりも、リアルタイムの追跡速度を達成できることを示した。
関連論文リスト
- AerialMind: Towards Referring Multi-Object Tracking in UAV Scenarios [64.51320327698231]
UAVシナリオにおける最初の大規模RMOTベンチマークであるAerialMindを紹介する。
我々は、革新的な半自動協調型エージェントベースラベリングアシスタントフレームワークを開発した。
また,視覚言語表現学習を協調的に強化する新しい手法であるHawkEyeTrackを提案する。
論文 参考訳(メタデータ) (2025-11-26T04:44:27Z) - A Tri-Modal Dataset and a Baseline System for Tracking Unmanned Aerial Vehicles [74.8162337823142]
MM-UAVはMulti-Modal UAV Trackingの最初の大規模ベンチマークである。
データセットは30以上の挑戦的なシナリオにまたがっており、1,321の同期マルチモーダルシーケンスと280万以上の注釈付きフレームがある。
データセットを伴って、我々は新しいマルチモーダルマルチUAV追跡フレームワークを提供する。
論文 参考訳(メタデータ) (2025-11-23T08:42:17Z) - CGTrack: Cascade Gating Network with Hierarchical Feature Aggregation for UAV Tracking [20.14331144617911]
本稿では,ネットワーク容量を拡大する明示的かつ暗黙的な手法を組み合わせた新しいUAVトラッカーであるCGTrackを紹介する。
3つの挑戦的なUAV追跡ベンチマークの実験は、CGTrackが高速に動作しながら最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2025-05-09T10:27:01Z) - Open-World Drone Active Tracking with Goal-Centered Rewards [62.21394499788672]
Drone Visual Active Trackingは、視覚的な観察に基づいてモーションシステムを制御することで、対象物を自律的に追跡することを目的としている。
DATは,世界初となるエア・ツー・グラウンド・トラッキング・ベンチマークである。
また,複雑なシナリオにおけるドローン追跡目標の性能向上を目的としたGC-VATを提案する。
論文 参考訳(メタデータ) (2024-12-01T09:37:46Z) - PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - Single-Point Supervised High-Resolution Dynamic Network for Infrared Small Target Detection [7.0456782736205685]
単一点教師付き高分解能ダイナミックネットワーク(SSHD-Net)を提案する。
単一点監視のみを用いて、最先端(SOTA)検出性能を実現する。
公開データセット NUDT-SIRST と IRSTD-1k の実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-08-04T09:44:47Z) - Multi-Scale Direction-Aware Network for Infrared Small Target Detection [2.661766509317245]
赤外小目標検出は、背景とターゲットを効果的に分離することが難しい問題に直面している。
我々は、赤外線小ターゲットの高周波方向特徴を統合するためのマルチスケール方向対応ネットワーク(MSDA-Net)を提案する。
MSDA-Netは、パブリックNUDT-SIRST、SIRST、IRSTD-1kデータセット上で、最先端(SOTA)結果を達成する。
論文 参考訳(メタデータ) (2024-06-04T07:23:09Z) - Global Context-Aware Progressive Aggregation Network for Salient Object
Detection [117.943116761278]
我々は,低レベルな外観特徴,高レベルな意味特徴,グローバルな文脈特徴を統合化するための新しいネットワークGCPANetを提案する。
提案手法は, 定量的かつ定性的に, 最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-02T04:26:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。