論文の概要: DCFG: Diverse Cross-Channel Fine-Grained Feature Learning and Progressive Fusion Siamese Tracker for Thermal Infrared Target Tracking
- arxiv url: http://arxiv.org/abs/2504.14311v1
- Date: Sat, 19 Apr 2025 14:24:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-30 01:29:54.401894
- Title: DCFG: Diverse Cross-Channel Fine-Grained Feature Learning and Progressive Fusion Siamese Tracker for Thermal Infrared Target Tracking
- Title(参考訳): DCFG:熱赤外ターゲットトラッキングのためのクロスチャネルファイングレード特徴学習とプログレッシブフュージョン・シームズ・トラッカー
- Authors: Ruoyan Xiong, Yuke Hou, Princess Retor Torboh, Hui He, Huanbin Zhang, Yue Zhang, Yanpin Wang, Huipan Guan, Shang Zhang,
- Abstract要約: 主目的特徴を抑えるためのチャネル間きめ細かい特徴学習ネットワーク。
効率的なインフォームフローを高めるチャネル再構成機構
特定のチャネル間の細粒度損失関数は、特徴群をターゲットの識別的再試行に向けて誘導する。
- 参考スコア(独自算出の注目度): 11.3097285242147
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To address the challenge of capturing highly discriminative features in ther-mal infrared (TIR) tracking, we propose a novel Siamese tracker based on cross-channel fine-grained feature learning and progressive fusion. First, we introduce a cross-channel fine-grained feature learning network that employs masks and suppression coefficients to suppress dominant target features, en-abling the tracker to capture more detailed and subtle information. The net-work employs a channel rearrangement mechanism to enhance efficient in-formation flow, coupled with channel equalization to reduce parameter count. Additionally, we incorporate layer-by-layer combination units for ef-fective feature extraction and fusion, thereby minimizing parameter redun-dancy and computational complexity. The network further employs feature redirection and channel shuffling strategies to better integrate fine-grained details. Second, we propose a specialized cross-channel fine-grained loss function designed to guide feature groups toward distinct discriminative re-gions of the target, thus improving overall target representation. This loss function includes an inter-channel loss term that promotes orthogonality be-tween channels, maximizing feature diversity and facilitating finer detail capture. Extensive experiments demonstrate that our proposed tracker achieves the highest accuracy, scoring 0.81 on the VOT-TIR 2015 and 0.78 on the VOT-TIR 2017 benchmark, while also outperforming other methods across all evaluation metrics on the LSOTB-TIR and PTB-TIR benchmarks.
- Abstract(参考訳): Ther-mal infrared(TIR)トラッキングにおける高度に識別可能な特徴を捉えることの課題に対処するため、我々は、チャネル間のきめ細かい特徴学習とプログレッシブ融合に基づく新しいシームズトラッカーを提案する。
まず,マスクと抑制係数を用いて主目的特徴を抑圧し,より詳細な情報と微妙な情報をトラッカーに付加するクロスチャネルきめ細かな特徴学習ネットワークを提案する。
ネットワークワークでは,効率的なインフォームフロー向上のためのチャネル再構成機構と,パラメータ数削減のためのチャネル等化が採用されている。
さらに、エフェクティブな特徴抽出と融合のための層間結合ユニットを導入し、パラメータの冗長性と計算複雑性を最小化する。
ネットワークはさらに機能リダイレクトとチャネルシャッフル戦略を採用し、きめ細かい詳細をうまく統合している。
第2に,特徴群を目標の識別的再配置に向けて誘導する専用チャネル細粒度損失関数を提案する。
この損失関数は、直交ベツイーンのチャネルを促進し、特徴の多様性を最大化し、より詳細なキャプチャを容易にするチャネル間損失項を含む。
VOT-TIR 2015では0.81、VOT-TIR 2017ベンチマークでは0.78、LSOTB-TIRとTB-TIRベンチマークではすべての評価指標で他の手法よりも高い成績を示した。
関連論文リスト
- FGSGT: Saliency-Guided Siamese Network Tracker Based on Key Fine-Grained Feature Information for Thermal Infrared Target Tracking [11.599952876425736]
そこで本稿では, キーきめ細かい特徴量に基づく新しいサリエンシ誘導型シームズネットワークトラッカーを提案する。
この設計は、浅い層から重要なグローバルな特徴を捉え、特徴の多様性を高め、きめ細かいインフォームの損失を最小限にする。
実験の結果,提案したトラッカーが最も精度が高く,成功率も高いことがわかった。
論文 参考訳(メタデータ) (2025-04-19T14:13:15Z) - MSCA-Net:Multi-Scale Context Aggregation Network for Infrared Small Target Detection [0.0]
本稿では、3つのキーコンポーネントを統合したMSCA-Netという新しいネットワークアーキテクチャを提案する。
MSEDAは、異なるスケールにわたる情報を適応的に集約するために、マルチスケールのフュージョンアテンション機構を使用している。
PCBAMは相関行列に基づく戦略によりグローバル特徴と局所特徴の相関を捉える。
論文 参考訳(メタデータ) (2025-03-21T14:42:31Z) - Distilling Channels for Efficient Deep Tracking [68.13422829310835]
本稿では,ディープトラッカーを容易にするための新しいチャネル蒸留法を提案する。
統合的な定式化は,特徴圧縮,応答マップ生成,モデル更新を統一エネルギー最小化問題に変換することができることを示す。
その結果、ディープトラッカーは正確で高速で、メモリ要求が低い。
論文 参考訳(メタデータ) (2024-09-18T08:09:20Z) - SCTransNet: Spatial-channel Cross Transformer Network for Infrared Small Target Detection [46.049401912285134]
赤外線小ターゲット検出(IRSTD)は近年,U字型ニューラルモデルから大きな恩恵を受けている。
既存のテクニックは、ターゲットが背景と高い類似性を持つ場合に苦労する。
本稿では,空間チャネルクロストランスネットワーク(SCTransNet)を提案する。
論文 参考訳(メタデータ) (2024-01-28T06:41:15Z) - Improved Dense Nested Attention Network Based on Transformer for
Infrared Small Target Detection [8.388564430699155]
深層学習に基づく赤外線小ターゲット検出は、複雑な背景と動的背景から小さなターゲットを分離する際、独特な利点をもたらす。
畳み込みニューラルネットワーク(CNN)の深さが増加するにつれて、赤外線小ターゲットの特徴は徐々に弱まる。
本稿では,トランスアーキテクチャに基づく高密度ネストアテンションネットワーク (IDNANet) を提案する。
論文 参考訳(メタデータ) (2023-11-15T07:29:24Z) - Joint Channel Estimation and Feedback with Masked Token Transformers in
Massive MIMO Systems [74.52117784544758]
本稿では,CSI行列内の固有周波数領域相関を明らかにするエンコーダデコーダに基づくネットワークを提案する。
エンコーダ・デコーダネットワーク全体がチャネル圧縮に使用される。
提案手法は,共同作業における現状のチャネル推定およびフィードバック技術より優れる。
論文 参考訳(メタデータ) (2023-06-08T06:15:17Z) - CATRO: Channel Pruning via Class-Aware Trace Ratio Optimization [61.71504948770445]
本稿では,CATRO (Class-Aware Trace Ratio Optimization) を用いた新しいチャネルプルーニング手法を提案する。
CATROは、他の最先端チャネルプルーニングアルゴリズムと同等の精度で、同様のコストまたは低コストで高い精度を達成できることを示す。
CATROは、クラス認識の特性のため、様々な分類サブタスクに適応的に効率の良いネットワークを創り出すのに適している。
論文 参考訳(メタデータ) (2021-10-21T06:26:31Z) - Group Fisher Pruning for Practical Network Compression [58.25776612812883]
本稿では,様々な複雑な構造に応用可能な汎用チャネルプルーニング手法を提案する。
我々は、単一チャネルと結合チャネルの重要性を評価するために、フィッシャー情報に基づく統一されたメトリクスを導出する。
提案手法は,結合チャネルを含む任意の構造をプルークするために利用できる。
論文 参考訳(メタデータ) (2021-08-02T08:21:44Z) - CE-FPN: Enhancing Channel Information for Object Detection [12.954675966833372]
特徴ピラミッドネットワーク(FPN)は,オブジェクト検出におけるマルチスケール特徴の抽出に有効なフレームワークである。
3つのシンプルで効果的なモジュールを備えた新しいチャネル強化ネットワーク(CE-FPN)を提示し、これらの問題を軽減します。
実験の結果, CE-FPNはMS COCOベンチマークの最先端FPN検出器と比較して, 競争性能が向上していることがわかった。
論文 参考訳(メタデータ) (2021-03-19T05:51:53Z) - Channel-wise Knowledge Distillation for Dense Prediction [73.99057249472735]
本稿では,学生ネットワークと教師ネットワークのチャンネルワイズ機能について提案する。
様々なネットワーク構造を持つ3つのベンチマークにおいて、一貫して優れた性能を実現している。
論文 参考訳(メタデータ) (2020-11-26T12:00:38Z) - Operation-Aware Soft Channel Pruning using Differentiable Masks [51.04085547997066]
本稿では,データ駆動型アルゴリズムを提案する。このアルゴリズムは,操作特性を利用して,ディープニューラルネットワークを異なる方法で圧縮する。
我々は大規模な実験を行い、出力ネットワークの精度で優れた性能を達成する。
論文 参考訳(メタデータ) (2020-07-08T07:44:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。