論文の概要: DEF-YOLO: Leveraging YOLO for Concealed Weapon Detection in Thermal Imagin
- arxiv url: http://arxiv.org/abs/2510.13326v1
- Date: Wed, 15 Oct 2025 09:13:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-16 20:13:28.589188
- Title: DEF-YOLO: Leveraging YOLO for Concealed Weapon Detection in Thermal Imagin
- Title(参考訳): DEF-YOLO:熱イマジンのウェポン検出用YOLO
- Authors: Divya Bhardwaj, Arnav Ramamoorthy, Poonam Goyal,
- Abstract要約: 熱画像における隠蔽兵器検出のための新しいアプローチとデータセットを提案する。
私たちのYOLOベースのアーキテクチャであるDEF-YOLOは、熱ビジョンにおける隠蔽兵器検出の独特な課題に合わせて、YOLOv8の重要な拡張と共に構築されています。
我々は,多種多様な隠蔽兵器のセットを特徴とし,幅広いシナリオを捉えた,大規模で大規模な熱画像認識ウェポンデータセット TICW を導入する。
- 参考スコア(独自算出の注目度): 1.6134566438137667
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Concealed weapon detection aims at detecting weapons hidden beneath a person's clothing or luggage. Various imaging modalities like Millimeter Wave, Microwave, Terahertz, Infrared, etc., are exploited for the concealed weapon detection task. These imaging modalities have their own limitations, such as poor resolution in microwave imaging, privacy concerns in millimeter wave imaging, etc. To provide a real-time, 24 x 7 surveillance, low-cost, and privacy-preserved solution, we opted for thermal imaging in spite of the lack of availability of a benchmark dataset. We propose a novel approach and a dataset for concealed weapon detection in thermal imagery. Our YOLO-based architecture, DEF-YOLO, is built with key enhancements in YOLOv8 tailored to the unique challenges of concealed weapon detection in thermal vision. We adopt deformable convolutions at the SPPF layer to exploit multi-scale features; backbone and neck layers to extract low, mid, and high-level features, enabling DEF-YOLO to adaptively focus on localization around the objects in thermal homogeneous regions, without sacrificing much of the speed and throughput. In addition to these simple yet effective key architectural changes, we introduce a new, large-scale Thermal Imaging Concealed Weapon dataset, TICW, featuring a diverse set of concealed weapons and capturing a wide range of scenarios. To the best of our knowledge, this is the first large-scale contributed dataset for this task. We also incorporate focal loss to address the significant class imbalance inherent in the concealed weapon detection task. The efficacy of the proposed work establishes a new benchmark through extensive experimentation for concealed weapon detection in thermal imagery.
- Abstract(参考訳): 武器検出は、人の衣服や荷物の下に隠された武器を検出することを目的としている。
隠された兵器検出タスクにはミリ波、マイクロ波、テラヘルツ、赤外線などの様々な画像モダリティが利用される。
これらの画像モダリティには、マイクロ波イメージングの解像度の低さ、ミリ波イメージングのプライバシー上の懸念など、独自の制限がある。
リアルタイム,24×7の監視,低コスト,プライバシ保護のソリューションを提供するため,ベンチマークデータセットが不足しているにも関わらず,サーマルイメージングを選択した。
熱画像における隠蔽兵器検出のための新しいアプローチとデータセットを提案する。
私たちのYOLOベースのアーキテクチャであるDEF-YOLOは、熱ビジョンにおける隠蔽兵器検出の独特な課題に合わせて、YOLOv8の重要な拡張と共に構築されています。
我々は、SPPF層における変形可能な畳み込みを利用して、バックボーン層とネック層が低、中、高レベルの特徴を抽出し、DEF-YOLOは、速度とスループットの多くを犠牲にすることなく、熱均質領域における物体の局所化に適応的に焦点を合わせることができる。
これらの単純で効果的なアーキテクチャ変更に加えて、様々な隠蔽兵器と広範囲のシナリオをキャプチャーする、大規模で大規模な熱画像認識兵器データセット TICW を導入している。
私たちの知る限りでは、これはこのタスクのための最初の大規模コントリビューションデータセットです。
また,隠蔽兵器検出タスクに内在する有意なクラス不均衡に対処するために,焦点損失を取り入れた。
提案手法の有効性は, 熱画像における隠蔽兵器検出のための広範囲な実験を通じて, 新たなベンチマークを確立するものである。
関連論文リスト
- SOTA: Spike-Navigated Optimal TrAnsport Saliency Region Detection in Composite-bias Videos [50.51658520045165]
Spike-d TrAnsport Saliency Region Detection (SOTA)は、スパイクカメラの強度を活用しつつ、空間次元と時間次元の両方のバイアスを緩和するフレームワークである。
本手法では,微妙なフレーム・ツー・フレームの変動を捉えるために,スパイクに基づくマイクロデビア(SM)を導入する。
SOTAは様々な条件にまたがる不整合を減らして予測を洗練させる。
論文 参考訳(メタデータ) (2025-05-01T08:30:40Z) - Enhanced Small Target Detection via Multi-Modal Fusion and Attention Mechanisms: A YOLOv5 Approach [1.90298817989995]
マルチモーダル画像融合とアテンション機構に基づく小さなターゲット検出手法を提案する。
この方法はYOLOv5を活用し、赤外線および可視光データと畳み込みアテンションモジュールを統合して検出性能を向上させる。
対UAVおよびVisdroneデータセットの実験結果は、我々のアプローチの有効性と実用性を示している。
論文 参考訳(メタデータ) (2025-04-15T15:02:10Z) - Mirror Target YOLO: An Improved YOLOv8 Method with Indirect Vision for Heritage Buildings Fire Detection [39.77603385164533]
ミラーターゲットヨロ(mita-YOLO)と呼ばれる間接視覚に基づく火災検知手法を提案する。
MITA-YOLOは間接視覚展開と拡張検出モジュールを統合している。
鏡角を用いて間接的なビューを達成し、不規則空間における可視性に制限のある問題を解決する。
論文 参考訳(メタデータ) (2024-11-21T10:23:00Z) - Effective and Efficient Adversarial Detection for Vision-Language Models via A Single Vector [97.92369017531038]
Diverse hArmful Responses (RADAR) を用いた新しい laRge-scale Adervsarial 画像データセットを構築した。
そこで我々は,視覚言語モデル (VLM) の隠れ状態から抽出した1つのベクトルを利用して,入力中の良質な画像に対して対向画像を検出する,新しいiN時間埋め込み型AdveRSarial Image Detectction (NEARSIDE) 法を開発した。
論文 参考訳(メタデータ) (2024-10-30T10:33:10Z) - SurANet: Surrounding-Aware Network for Concealed Object Detection via Highly-Efficient Interactive Contrastive Learning Strategy [55.570183323356964]
本稿では,隠蔽物体検出のための新しいSurrounding-Aware Network,すなわちSurANetを提案する。
周辺特徴の差分融合を用いて特徴写像のセマンティクスを強化し,隠蔽対象の強調を行う。
次に、周囲の特徴写像を対照的に学習することで隠蔽対象を識別するために、周囲のコントラストロスを適用した。
論文 参考訳(メタデータ) (2024-10-09T13:02:50Z) - YOLO-FEDER FusionNet: A Novel Deep Learning Architecture for Drone Detection [4.281091463408282]
YOLO-FEDER FusionNetと呼ばれる新しいディープラーニングアーキテクチャを導入する。
従来のアプローチとは異なり、YOLO-FEDER FusionNetは、汎用オブジェクト検出手法とカモフラージュオブジェクト検出技術の特殊強度を組み合わせることで、ドローン検出能力を向上している。
論文 参考訳(メタデータ) (2024-06-17T15:25:31Z) - MODIPHY: Multimodal Obscured Detection for IoT using PHantom Convolution-Enabled Faster YOLO [10.183459286746196]
YOLO Phantomは、史上最小のYOLOモデルのひとつです。
YOLO Phantomは最新のYOLOv8nモデルと同等の精度を実現し、パラメータとモデルサイズを同時に削減する。
実際の有効性は、高度な低照度カメラとRGBカメラを備えたIoTプラットフォーム上で実証され、AWSベースの通知エンドポイントにシームレスに接続される。
論文 参考訳(メタデータ) (2024-02-12T18:56:53Z) - Image-Based Fire Detection in Industrial Environments with YOLOv4 [53.180678723280145]
この研究は、AIが火災を検出し、認識し、画像ストリーム上のオブジェクト検出を使用して検出時間を短縮する可能性を検討する。
そこで我々は, YOLOv4オブジェクト検出器をベースとした複数のモデルのトレーニングと評価に使用されてきた複数の公開情報源から, 適切なデータを収集, ラベル付けした。
論文 参考訳(メタデータ) (2022-12-09T11:32:36Z) - Target-aware Dual Adversarial Learning and a Multi-scenario
Multi-Modality Benchmark to Fuse Infrared and Visible for Object Detection [65.30079184700755]
本研究は、物体検出のために異なるように見える赤外線と可視画像の融合の問題に対処する。
従来のアプローチでは、2つのモダリティの根底にある共通点を発見し、反復最適化またはディープネットワークによって共通空間に融合する。
本稿では、融合と検出の連立問題に対する二段階最適化の定式化を提案し、その後、核融合と一般的に使用される検出ネットワークのためのターゲット認識デュアル逆学習(TarDAL)ネットワークに展開する。
論文 参考訳(メタデータ) (2022-03-30T11:44:56Z) - Exploring Thermal Images for Object Detection in Underexposure Regions
for Autonomous Driving [67.69430435482127]
アンダーエクスポージャー地域は、安全な自動運転のための周囲の完全な認識を構築するのに不可欠である。
サーマルカメラが利用可能になったことで、他の光学センサーが解釈可能な信号を捉えていない地域を探索するための重要な代替手段となった。
本研究は,可視光画像から熱画像へ学習を伝達するためのスタイル伝達手法を用いたドメイン適応フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-01T09:59:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。