論文の概要: ALSS-YOLO: An Adaptive Lightweight Channel Split and Shuffling Network for TIR Wildlife Detection in UAV Imagery
- arxiv url: http://arxiv.org/abs/2409.06259v1
- Date: Tue, 10 Sep 2024 07:02:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-11 18:50:07.716227
- Title: ALSS-YOLO: An Adaptive Lightweight Channel Split and Shuffling Network for TIR Wildlife Detection in UAV Imagery
- Title(参考訳): ALSS-YOLO:UAV画像におけるTIR野生生物検出のための適応型軽量チャネル分割・シャッフルネットワーク
- Authors: Ang He, Xiaobo Li, Ximei Wu, Chengyue Su, Jing Chen, Sheng Xu, Xiaobin Guo,
- Abstract要約: 熱赤外線カメラを搭載した無人航空機(UAV)は、夜間野生生物の密猟と戦う上で重要な役割を担っている。
現在のUAVに展開されている従来の軽量ネットワークは、ぼやけた小さなターゲットから特徴を引き出すのに苦労している。
我々は、TIR空中画像に最適化された効率的で軽量な検出器であるALSS-YOLOを開発した。
- 参考スコア(独自算出の注目度): 7.35275281315994
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unmanned aerial vehicles (UAVs) equipped with thermal infrared (TIR) cameras play a crucial role in combating nocturnal wildlife poaching. However, TIR images often face challenges such as jitter, and wildlife overlap, necessitating UAVs to possess the capability to identify blurred and overlapping small targets. Current traditional lightweight networks deployed on UAVs struggle to extract features from blurry small targets. To address this issue, we developed ALSS-YOLO, an efficient and lightweight detector optimized for TIR aerial images. Firstly, we propose a novel Adaptive Lightweight Channel Split and Shuffling (ALSS) module. This module employs an adaptive channel split strategy to optimize feature extraction and integrates a channel shuffling mechanism to enhance information exchange between channels. This improves the extraction of blurry features, crucial for handling jitter-induced blur and overlapping targets. Secondly, we developed a Lightweight Coordinate Attention (LCA) module that employs adaptive pooling and grouped convolution to integrate feature information across dimensions. This module ensures lightweight operation while maintaining high detection precision and robustness against jitter and target overlap. Additionally, we developed a single-channel focus module to aggregate the width and height information of each channel into four-dimensional channel fusion, which improves the feature representation efficiency of infrared images. Finally, we modify the localization loss function to emphasize the loss value associated with small objects to improve localization accuracy. Extensive experiments on the BIRDSAI and ISOD TIR UAV wildlife datasets show that ALSS-YOLO achieves state-of-the-art performance, Our code is openly available at https://github.com/helloworlder8/computer_vision.
- Abstract(参考訳): 熱赤外線カメラを搭載した無人航空機(UAV)は、夜間野生生物の密猟と戦う上で重要な役割を担っている。
しかし、TIR画像は、しばしばジッタや野生生物の重複といった課題に直面し、UAVがぼやけた小さな標的を識別する能力を持つ必要がある。
現在のUAVに展開されている従来の軽量ネットワークは、ぼやけた小さなターゲットから特徴を引き出すのに苦労している。
この問題に対処するため、TIR空中画像に最適化された効率的で軽量な検出器であるALSS-YOLOを開発した。
まず,Adaptive Lightweight Channel Split and Shuffling (ALSS)モジュールを提案する。
このモジュールは、特徴抽出を最適化するために適応的なチャネル分割戦略を採用し、チャネル間の情報交換を強化するためのチャネルシャッフル機構を統合する。
これにより、ジッタによって引き起こされるぼやけや重なり合うターゲットを扱うのに不可欠な、ぼやけた特徴の抽出が改善される。
次に,アダプティブプーリングとグループ畳み込みを用いた軽量協調注意モジュールを開発し,各次元にまたがる特徴情報を統合した。
このモジュールは、ジッタとターゲットの重なりに対する高い検出精度と堅牢性を維持しつつ、軽量な操作を保証する。
さらに,各チャネルの幅と高さを4次元のチャネル融合に集約する単一チャネルフォーカスモジュールを開発し,赤外線画像の特徴表現効率を向上させる。
最後に、局所化損失関数を変更し、小さなオブジェクトに関連付けられた損失値を強調し、局所化精度を向上させる。
BIRDSAIとISOD TIR UAVの野生生物データセットに関する大規模な実験は、ALSS-YOLOが最先端のパフォーマンスを達成したことを示している。
関連論文リスト
- LAM-YOLO: Drones-based Small Object Detection on Lighting-Occlusion Attention Mechanism YOLO [0.9062164411594178]
LAM-YOLOは、ドローンベースの画像に特化して設計されたオブジェクト検出モデルである。
我々は、異なる照明条件下での小さな目標の視認性を高めるために、光遮断注意機構を導入する。
次に、回帰損失関数として改良されたSIB-IoUを用いてモデル収束を加速し、局所化精度を向上させる。
論文 参考訳(メタデータ) (2024-11-01T10:00:48Z) - LR-Net: A Lightweight and Robust Network for Infrared Small Target Detection [2.6617665093172445]
我々は、革新的な軽量で堅牢なネットワーク(LR-Net)を提案する。
LR-Netは複雑な構造を放棄し、検出精度と資源消費のバランスをとる。
第3位は「ICPR 2024リソース制限赤外小ターゲット検出チャレンジトラック2:軽量赤外小ターゲット検出」である。
論文 参考訳(メタデータ) (2024-08-05T18:57:33Z) - Wavelet-based Bi-dimensional Aggregation Network for SAR Image Change Detection [53.842568573251214]
3つのSARデータセットによる実験結果から、我々のWBANetは現代最先端の手法を著しく上回っていることが明らかとなった。
我々のWBANetは、それぞれのデータセットで98.33%、96.65%、96.62%の正確な分類(PCC)を達成している。
論文 参考訳(メタデータ) (2024-07-18T04:36:10Z) - IRSAM: Advancing Segment Anything Model for Infrared Small Target Detection [55.554484379021524]
Infrared Small Target Detection (IRSTD) タスクは、自然画像と赤外線画像の間に顕著な領域ギャップがあるため、満足度の高い性能を達成するには不十分である。
IRSTDのためのIRSAMモデルを提案する。これはSAMのエンコーダデコーダアーキテクチャを改善し、赤外線小物体の特徴表現をより良く学習する。
論文 参考訳(メタデータ) (2024-07-10T10:17:57Z) - LIR: A Lightweight Baseline for Image Restoration [4.187190284830909]
画像復元作業の本質的な特徴は、多くの作品で見落とされがちである。
LIRと呼ばれる画像復元のための軽量ベースラインネットワークを提案し、画像の効率よく復元し、劣化を除去する。
我々のLIRは、Pak Signal-to-Noise Ratio (PSNR)における最先端構造類似度指標(SSIM)および最先端モデルに匹敵する性能を達成する。
論文 参考訳(メタデータ) (2024-02-02T12:39:47Z) - Dual Aggregation Transformer for Image Super-Resolution [92.41781921611646]
画像SRのための新しいトランスモデルDual Aggregation Transformerを提案する。
DATは、ブロック間およびブロック内二重方式で、空間次元とチャネル次元にまたがる特徴を集約する。
我々のDATは現在の手法を超越している。
論文 参考訳(メタデータ) (2023-08-07T07:39:39Z) - EFLNet: Enhancing Feature Learning for Infrared Small Target Detection [20.546186772828555]
単一フレームの赤外線小目標検出は難しい課題であると考えられている。
ターゲットと背景の極端に不均衡のため、境界ボックスの回帰は赤外線小ターゲットに対して非常に敏感である。
本稿では,これらの問題に対処する機能学習ネットワーク(EFLNet)を提案する。
論文 参考訳(メタデータ) (2023-07-27T09:23:22Z) - ABC: Attention with Bilinear Correlation for Infrared Small Target
Detection [4.7379300868029395]
CNNに基づく深層学習法は、赤外線小ターゲット(IRST)のセグメンテーションに有効ではない
バイリニア相関(ABC)を用いた注目モデルを提案する。
ABCはトランスアーキテクチャに基づいており、特徴抽出と融合のための新しいアテンション機構を備えた畳み込み線形核融合トランス (CLFT) モジュールを含んでいる。
論文 参考訳(メタデータ) (2023-03-18T03:47:06Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z) - AdaZoom: Adaptive Zoom Network for Multi-Scale Object Detection in Large
Scenes [57.969186815591186]
大規模なシーンの検出は、小さなオブジェクトと極端なスケールの変動のために難しい問題である。
本稿では,物体検出のための焦点領域を適応的に拡大するために,フレキシブルな形状と焦点長を有する選択的拡大器として,新しい適応型Zoom(AdaZoom)ネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-19T03:30:22Z) - A Single Stream Network for Robust and Real-time RGB-D Salient Object
Detection [89.88222217065858]
我々は、深度マップを用いて、RGBと深度の間の早期融合と中核融合を誘導する単一ストリームネットワークを設計する。
このモデルは、現在の最も軽量なモデルよりも55.5%軽く、32 FPSのリアルタイム速度で384倍の384ドルの画像を処理している。
論文 参考訳(メタデータ) (2020-07-14T04:40:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。