論文の概要: A High-Performance Thermal Infrared Object Detection Framework with Centralized Regulation
- arxiv url: http://arxiv.org/abs/2505.10825v1
- Date: Fri, 16 May 2025 03:43:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-19 14:36:13.971251
- Title: A High-Performance Thermal Infrared Object Detection Framework with Centralized Regulation
- Title(参考訳): 集中制御による高性能熱赤外物体検出フレームワーク
- Authors: Jinke Li, Yue Wu, Xiaoyan Yang,
- Abstract要約: 本稿では,CRT-YOLO(CRT-YOLO)と呼ばれる,高効率な熱物体検出フレームワークについて述べる。
提案モデルでは,高効率なマルチスケール赤外アテンションモジュールを統合した。
2つのベンチマークデータセットで行った実験は、我々のCRT-YOLOモデルが従来の手法よりも大幅に優れていることを示した。
- 参考スコア(独自算出の注目度): 5.935808994536907
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Thermal Infrared (TIR) technology involves the use of sensors to detect and measure infrared radiation emitted by objects, and it is widely utilized across a broad spectrum of applications. The advancements in object detection methods utilizing TIR images have sparked significant research interest. However, most traditional methods lack the capability to effectively extract and fuse local-global information, which is crucial for TIR-domain feature attention. In this study, we present a novel and efficient thermal infrared object detection framework, known as CRT-YOLO, that is based on centralized feature regulation, enabling the establishment of global-range interaction on TIR information. Our proposed model integrates efficient multi-scale attention (EMA) modules, which adeptly capture long-range dependencies while incurring minimal computational overhead. Additionally, it leverages the Centralized Feature Pyramid (CFP) network, which offers global regulation of TIR features. Extensive experiments conducted on two benchmark datasets demonstrate that our CRT-YOLO model significantly outperforms conventional methods for TIR image object detection. Furthermore, the ablation study provides compelling evidence of the effectiveness of our proposed modules, reinforcing the potential impact of our approach on advancing the field of thermal infrared object detection.
- Abstract(参考訳): 熱赤外(TIR)技術は、物体から放射される赤外線を検知・測定するためにセンサーを使用し、幅広い用途で広く利用されている。
TIR画像を用いた物体検出技術の進歩は、大きな研究関心を呼んだ。
しかし,ほとんどの従来の手法では,TIR領域の特徴的注意を喚起する上で重要なローカル・グローバル情報を効果的に抽出・融合する能力が欠如している。
本研究では,CRT-YOLO(CRT-YOLO)と呼ばれる,高効率で効率的な熱赤外物体検出フレームワークを提案する。
提案モデルでは,高効率なマルチスケールアテンション (EMA) モジュールを統合する。
さらに、TIR機能のグローバルな規制を提供するCFP(Centralized Feature Pyramid)ネットワークを活用している。
2つのベンチマークデータセットで行った大規模な実験により、我々のCRT-YOLOモデルは、従来のTIR画像オブジェクト検出法よりも大幅に優れていることが示された。
さらに, アブレーション実験は, 提案モジュールの有効性を実証し, 熱赤外物体検出の進歩に対する我々のアプローチの潜在的影響を裏付けるものである。
関連論文リスト
- Multi-Domain Biometric Recognition using Body Embeddings [51.36007967653781]
身体埋め込みは中波長赤外線(MWIR)領域と長波長赤外線(LWIR)領域の顔埋め込みよりも優れていた。
我々は、IJB-MDFデータセット上でのベンチマーク結果を確立するために、ビジョントランスフォーマーアーキテクチャを活用している。
また, クロスエントロピーとトリプルト損失の単純な組み合わせで, VISデータにのみ事前訓練された体モデルを微調整することで, 最先端のmAPスコアが得られることを示す。
論文 参考訳(メタデータ) (2025-03-13T22:38:18Z) - Bringing RGB and IR Together: Hierarchical Multi-Modal Enhancement for Robust Transmission Line Detection [67.02804741856512]
高速かつ高精度なTL検出のために,RGBとIRデータを統合したHMMEN(Hierarchical Multi-Modal Enhancement Network)を提案する。
提案手法では,(1)階層的RGBおよびIR特徴写像を大まかに融合・拡張するMMEB,(2)デコーダ出力とIR特徴写像の不整合を変形可能な畳み込みを利用して補正するFAB,の2つの重要な構成要素を紹介する。
論文 参考訳(メタデータ) (2025-01-25T06:21:06Z) - Removal then Selection: A Coarse-to-Fine Fusion Perspective for RGB-Infrared Object Detection [20.12812979315803]
可視光(RGB)と熱赤外(IR)画像の両方を利用した物体検出が注目されている。
既存の多くのマルチモーダルオブジェクト検出手法は、RGBとIR画像をディープニューラルネットワークに直接入力する。
両モダリティから特徴を浄化・融合する新しい粗大な視点を提案する。
論文 参考訳(メタデータ) (2024-01-19T14:49:42Z) - Target-aware Dual Adversarial Learning and a Multi-scenario
Multi-Modality Benchmark to Fuse Infrared and Visible for Object Detection [65.30079184700755]
本研究は、物体検出のために異なるように見える赤外線と可視画像の融合の問題に対処する。
従来のアプローチでは、2つのモダリティの根底にある共通点を発見し、反復最適化またはディープネットワークによって共通空間に融合する。
本稿では、融合と検出の連立問題に対する二段階最適化の定式化を提案し、その後、核融合と一般的に使用される検出ネットワークのためのターゲット認識デュアル逆学習(TarDAL)ネットワークに展開する。
論文 参考訳(メタデータ) (2022-03-30T11:44:56Z) - Meta-UDA: Unsupervised Domain Adaptive Thermal Object Detection using
Meta-Learning [64.92447072894055]
赤外線(IR)カメラは、照明条件や照明条件が悪ければ頑丈である。
既存のUDA手法を改善するためのアルゴリズムメタ学習フレームワークを提案する。
KAISTおよびDSIACデータセットのための最先端熱検出器を作成した。
論文 参考訳(メタデータ) (2021-10-07T02:28:18Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z) - Exploring Thermal Images for Object Detection in Underexposure Regions
for Autonomous Driving [67.69430435482127]
アンダーエクスポージャー地域は、安全な自動運転のための周囲の完全な認識を構築するのに不可欠である。
サーマルカメラが利用可能になったことで、他の光学センサーが解釈可能な信号を捉えていない地域を探索するための重要な代替手段となった。
本研究は,可視光画像から熱画像へ学習を伝達するためのスタイル伝達手法を用いたドメイン適応フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-01T09:59:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。