論文の概要: Enhanced Small Target Detection via Multi-Modal Fusion and Attention Mechanisms: A YOLOv5 Approach
- arxiv url: http://arxiv.org/abs/2504.11262v1
- Date: Tue, 15 Apr 2025 15:02:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-16 22:09:41.091312
- Title: Enhanced Small Target Detection via Multi-Modal Fusion and Attention Mechanisms: A YOLOv5 Approach
- Title(参考訳): マルチモーダル核融合とアテンション機構による小型目標検出の強化:YOLOv5アプローチ
- Authors: Xiaoxiao Ma, Junxiong Tong,
- Abstract要約: マルチモーダル画像融合とアテンション機構に基づく小さなターゲット検出手法を提案する。
この方法はYOLOv5を活用し、赤外線および可視光データと畳み込みアテンションモジュールを統合して検出性能を向上させる。
対UAVおよびVisdroneデータセットの実験結果は、我々のアプローチの有効性と実用性を示している。
- 参考スコア(独自算出の注目度): 1.90298817989995
- License:
- Abstract: With the rapid development of information technology, modern warfare increasingly relies on intelligence, making small target detection critical in military applications. The growing demand for efficient, real-time detection has created challenges in identifying small targets in complex environments due to interference. To address this, we propose a small target detection method based on multi-modal image fusion and attention mechanisms. This method leverages YOLOv5, integrating infrared and visible light data along with a convolutional attention module to enhance detection performance. The process begins with multi-modal dataset registration using feature point matching, ensuring accurate network training. By combining infrared and visible light features with attention mechanisms, the model improves detection accuracy and robustness. Experimental results on anti-UAV and Visdrone datasets demonstrate the effectiveness and practicality of our approach, achieving superior detection results for small and dim targets.
- Abstract(参考訳): 情報技術の急速な発展により、現代の戦争は知性にますます依存し、軍事的応用において小さな標的検出が重要となる。
効率的でリアルタイムな検出に対する需要の高まりは、干渉による複雑な環境における小さなターゲットを特定する上での課題を生み出している。
そこで本研究では,マルチモーダル画像融合とアテンション機構に基づく小さなターゲット検出手法を提案する。
この方法はYOLOv5を活用し、赤外線および可視光データと畳み込みアテンションモジュールを統合して検出性能を向上させる。
プロセスは、特徴点マッチングを使用したマルチモーダルデータセット登録から始まり、正確なネットワークトレーニングを保証する。
赤外線と可視光の特徴と注意機構を組み合わせることにより、検出精度と堅牢性を向上させる。
対UAVおよびVisdroneデータセットによる実験結果から,本手法の有効性と実用性を示し,小型・薄型目標に対して優れた検出結果が得られた。
関連論文リスト
- YOLO-MST: Multiscale deep learning method for infrared small target detection based on super-resolution and YOLO [0.18641315013048293]
本稿では,画像超解像技術とマルチスケール観測を組み合わせた深層学習赤外線小目標検出手法を提案する。
この手法の2つの公開データセットであるSIRSTとIRISでのmAP@0.5検出率は、それぞれ96.4%と99.5%に達した。
論文 参考訳(メタデータ) (2024-12-27T18:43:56Z) - Optimizing Multispectral Object Detection: A Bag of Tricks and Comprehensive Benchmarks [49.84182981950623]
RGBおよびTIR(熱赤外)変調を利用したマルチスペクトル物体検出は,課題として広く認識されている。
モダリティと堅牢な融合戦略の両方から特徴を効果的に抽出するだけでなく、スペクトルの相違といった問題に対処する能力も必要である。
本稿では,高パフォーマンス単一モードモデルのシームレスな最適化が可能な,効率的かつ容易にデプロイ可能なマルチスペクトルオブジェクト検出フレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-27T12:18:39Z) - Real-Time Detection for Small UAVs: Combining YOLO and Multi-frame Motion Analysis [0.8971132850029493]
無人航空機(UAV)検出技術は、セキュリティリスクの軽減と、軍用および民間の双方のアプリケーションにおけるプライバシーの保護において重要な役割を担っている。
従来の検出手法は、長距離で非常に小さなピクセルを持つUAVターゲットを識別する上で重要な課題に直面している。
我々は,YOLO(You Only Look Once)オブジェクト検出と多フレームモーション検出を併用したGlobal-Local YOLO-Motion(GL-YOMO)検出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-10T14:30:50Z) - Infrared Small Target Detection based on Adjustable Sensitivity Strategy and Multi-Scale Fusion [2.661766509317245]
調整可能な感度(AS)戦略とマルチスケール融合に基づく改良された赤外線小ターゲット検出手法を提案する。
具体的には、マルチスケール方向対応ネットワーク(MSDA-Net)に基づくマルチスケールモデル融合フレームワークを構築する。
このスキームは、PRCV 2024ワイドエリア赤外線小目標検出競技で優勝した。
論文 参考訳(メタデータ) (2024-07-29T15:22:02Z) - SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Target-aware Dual Adversarial Learning and a Multi-scenario
Multi-Modality Benchmark to Fuse Infrared and Visible for Object Detection [65.30079184700755]
本研究は、物体検出のために異なるように見える赤外線と可視画像の融合の問題に対処する。
従来のアプローチでは、2つのモダリティの根底にある共通点を発見し、反復最適化またはディープネットワークによって共通空間に融合する。
本稿では、融合と検出の連立問題に対する二段階最適化の定式化を提案し、その後、核融合と一般的に使用される検出ネットワークのためのターゲット認識デュアル逆学習(TarDAL)ネットワークに展開する。
論文 参考訳(メタデータ) (2022-03-30T11:44:56Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z) - AutoOD: Automated Outlier Detection via Curiosity-guided Search and
Self-imitation Learning [72.99415402575886]
外乱検出は重要なデータマイニングの課題であり、多くの実用的応用がある。
本稿では,最適なニューラルネットワークモデルを探すことを目的とした自動外乱検出フレームワークであるAutoODを提案する。
さまざまな実世界のベンチマークデータセットに対する実験結果から、AutoODが特定したディープモデルが最高のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2020-06-19T18:57:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。