論文の概要: FGSGT: Saliency-Guided Siamese Network Tracker Based on Key Fine-Grained Feature Information for Thermal Infrared Target Tracking
- arxiv url: http://arxiv.org/abs/2504.14309v1
- Date: Sat, 19 Apr 2025 14:13:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-30 01:30:47.556288
- Title: FGSGT: Saliency-Guided Siamese Network Tracker Based on Key Fine-Grained Feature Information for Thermal Infrared Target Tracking
- Title(参考訳): FGSGT:熱赤外ターゲティングのためのキーファイングレード特徴情報に基づく衛生誘導シームズネットワークトラッカー
- Authors: Ruoyan Xiong, Huanbin Zhang, Shentao Wang, Hui He, Yuke Hou, Yue Zhang, Yujie Cui, Huipan Guan, Shang Zhang,
- Abstract要約: そこで本稿では, キーきめ細かい特徴量に基づく新しいサリエンシ誘導型シームズネットワークトラッカーを提案する。
この設計は、浅い層から重要なグローバルな特徴を捉え、特徴の多様性を高め、きめ細かいインフォームの損失を最小限にする。
実験の結果,提案したトラッカーが最も精度が高く,成功率も高いことがわかった。
- 参考スコア(独自算出の注目度): 11.599952876425736
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Thermal infrared (TIR) images typically lack detailed features and have low contrast, making it challenging for conventional feature extraction models to capture discriminative target characteristics. As a result, trackers are often affected by interference from visually similar objects and are susceptible to tracking drift. To address these challenges, we propose a novel saliency-guided Siamese network tracker based on key fine-grained feature infor-mation. First, we introduce a fine-grained feature parallel learning convolu-tional block with a dual-stream architecture and convolutional kernels of varying sizes. This design captures essential global features from shallow layers, enhances feature diversity, and minimizes the loss of fine-grained in-formation typically encountered in residual connections. In addition, we propose a multi-layer fine-grained feature fusion module that uses bilinear matrix multiplication to effectively integrate features across both deep and shallow layers. Next, we introduce a Siamese residual refinement block that corrects saliency map prediction errors using residual learning. Combined with deep supervision, this mechanism progressively refines predictions, ap-plying supervision at each recursive step to ensure consistent improvements in accuracy. Finally, we present a saliency loss function to constrain the sali-ency predictions, directing the network to focus on highly discriminative fi-ne-grained features. Extensive experiment results demonstrate that the pro-posed tracker achieves the highest precision and success rates on the PTB-TIR and LSOTB-TIR benchmarks. It also achieves a top accuracy of 0.78 on the VOT-TIR 2015 benchmark and 0.75 on the VOT-TIR 2017 benchmark.
- Abstract(参考訳): 熱赤外(TIR)画像は、一般的に詳細な特徴を欠き、コントラストが低いため、従来の特徴抽出モデルでは識別対象の特徴を捉えることは困難である。
結果として、トラッカーはしばしば視覚的に類似した物体からの干渉に影響され、ドリフトを追跡できない。
これらの課題に対処するため,我々は,重要な細粒度特徴量に基づく新しいサリエンシ誘導型シームズネットワークトラッカーを提案する。
まず,2重ストリームアーキテクチャと異なるサイズの畳み込みカーネルを備えた並列学習並列化ブロックを提案する。
この設計は、浅い層から重要なグローバルな特徴を捉え、特徴の多様性を高め、残留接続で通常発生する微細なインフォームの損失を最小限にする。
さらに,双線形行列乗算を用いて,深層と浅層の両方の機能を効果的に統合する多層機能融合モジュールを提案する。
次に、残差学習を用いて正解率マップ予測誤差を補正するシームズ残差補正ブロックを提案する。
深い監督と組み合わせることで、このメカニズムは予測を段階的に洗練し、再帰的な各ステップにおけるp-plyingの監督を行い、精度が一貫した改善を確実にする。
最後に,サリエンシの予測を制約するサリエンシ損失関数を提案する。
PTB-TIR と LSOTB-TIR のベンチマークにおいて,提案したトラッカーは高い精度と成功率を達成した。
また、VOT-TIR 2015ベンチマークでは0.78、VOT-TIR 2017ベンチマークでは0.75である。
関連論文リスト
- DCFG: Diverse Cross-Channel Fine-Grained Feature Learning and Progressive Fusion Siamese Tracker for Thermal Infrared Target Tracking [11.3097285242147]
主目的特徴を抑えるためのチャネル間きめ細かい特徴学習ネットワーク。
効率的なインフォームフローを高めるチャネル再構成機構
特定のチャネル間の細粒度損失関数は、特徴群をターゲットの識別的再試行に向けて誘導する。
論文 参考訳(メタデータ) (2025-04-19T14:24:37Z) - 10K is Enough: An Ultra-Lightweight Binarized Network for Infrared Small-Target Detection [48.074211420276605]
バイナリ化されたニューラルネットワーク(BNN)は、モデル圧縮における例外的な効率によって区別される。
両立赤外小ターゲット検出ネットワーク(BiisNet)を提案する。
BiisNetは二項化畳み込みのコア操作を保存し、完全精度の機能をネットワークの情報フローに統合する。
論文 参考訳(メタデータ) (2025-03-04T14:25:51Z) - Improved Dense Nested Attention Network Based on Transformer for
Infrared Small Target Detection [8.388564430699155]
深層学習に基づく赤外線小ターゲット検出は、複雑な背景と動的背景から小さなターゲットを分離する際、独特な利点をもたらす。
畳み込みニューラルネットワーク(CNN)の深さが増加するにつれて、赤外線小ターゲットの特徴は徐々に弱まる。
本稿では,トランスアーキテクチャに基づく高密度ネストアテンションネットワーク (IDNANet) を提案する。
論文 参考訳(メタデータ) (2023-11-15T07:29:24Z) - EFLNet: Enhancing Feature Learning for Infrared Small Target Detection [20.546186772828555]
単一フレームの赤外線小目標検出は難しい課題であると考えられている。
ターゲットと背景の極端に不均衡のため、境界ボックスの回帰は赤外線小ターゲットに対して非常に敏感である。
本稿では,これらの問題に対処する機能学習ネットワーク(EFLNet)を提案する。
論文 参考訳(メタデータ) (2023-07-27T09:23:22Z) - One-Stage Cascade Refinement Networks for Infrared Small Target
Detection [21.28595135499812]
SIRST(Single-frame InfraRed Small Target)検出は、固有の特性の欠如による課題である。
実世界の高解像度単一フレームターゲットのSIRST-V2データセットからなる赤外線小ターゲット検出のための新しい研究ベンチマークを提案する。
論文 参考訳(メタデータ) (2022-12-16T13:37:23Z) - DepthFormer: Exploiting Long-Range Correlation and Local Information for
Accurate Monocular Depth Estimation [50.08080424613603]
高精度な単分子深度推定には長距離相関が不可欠である。
我々は,このグローバルコンテキストを効果的な注意機構でモデル化するためにTransformerを活用することを提案する。
提案したモデルであるDepthFormerは、最先端のモノクル深度推定手法をはるかに超えている。
論文 参考訳(メタデータ) (2022-03-27T05:03:56Z) - RPT++: Customized Feature Representation for Siamese Visual Tracking [16.305972000224358]
視覚的トラッキングの性能向上は,有意な領域から抽出された特徴が,より認識可能な視覚的パターンを提供するため,限られていると我々は主張する。
タスク固有の視覚パターンを捉えるために,極性プーリングと極性プーリングという2つの特徴抽出器を提案する。
本稿では,タスク固有の特徴表現の有効性を,最近の進行トラッカーRTPに組み込むことで示す。
論文 参考訳(メタデータ) (2021-10-23T10:58:57Z) - MFGNet: Dynamic Modality-Aware Filter Generation for RGB-T Tracking [72.65494220685525]
可視データと熱データ間のメッセージ通信を促進するために,新しい動的モダリティ対応フィルタ生成モジュール(MFGNet)を提案する。
我々は、2つの独立ネットワークを持つ動的モダリティ対応フィルタを生成し、その可視フィルタとサーマルフィルタをそれぞれ、対応する入力特徴写像上で動的畳み込み演算を行う。
重閉塞,高速移動,外見による問題に対処するため,新たな方向認識型目標誘導型アテンション機構を活用することで,共同で局所的・グローバル検索を行うことを提案する。
論文 参考訳(メタデータ) (2021-07-22T03:10:51Z) - Unsupervised Scale-consistent Depth Learning from Video [131.3074342883371]
本研究では,単眼深度推定器SC-Depthを提案する。
スケール一貫性予測の能力により,我々の単分子学習深層ネットワークは簡単にORB-SLAM2システムに統合可能であることを示す。
提案したハイブリッドPseudo-RGBD SLAMは、KITTIにおいて魅力的な結果を示し、追加のトレーニングなしでKAISTデータセットにうまく一般化する。
論文 参考訳(メタデータ) (2021-05-25T02:17:56Z) - Deep Probabilistic Feature-metric Tracking [27.137827823264942]
画素単位の深度特徴写像と深度特徴量不確実性写像を学習するための新しいフレームワークを提案する。
CNNは、より高速で信頼性の高い収束のための深い初期ポーズを予測する。
実験により,TUM RGB-Dデータセットと3次元剛性物体追跡データセットの最先端性能が示された。
論文 参考訳(メタデータ) (2020-08-31T11:47:59Z) - Progressively Guided Alternate Refinement Network for RGB-D Salient
Object Detection [63.18846475183332]
我々は,RGB-Dの高次物体検出のための効率的かつコンパクトなディープネットワークを開発することを目指している。
そこで本研究では,改良のための改良ネットワークを提案する。
我々のモデルは、既存の最先端のアプローチよりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2020-08-17T02:55:06Z) - Object Tracking through Residual and Dense LSTMs [67.98948222599849]
LSTM(Long Short-Term Memory)リカレントニューラルネットワークに基づくディープラーニングベースのトラッカーが、強力な代替手段として登場した。
DenseLSTMはResidualおよびRegular LSTMより優れ、ニュアンセに対する高いレジリエンスを提供する。
ケーススタディは、他のトラッカーの堅牢性を高めるために残差ベースRNNの採用を支援する。
論文 参考訳(メタデータ) (2020-06-22T08:20:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。