論文の概要: Enhanced Detection of Tiny Objects in Aerial Images
- arxiv url: http://arxiv.org/abs/2509.17078v1
- Date: Sun, 21 Sep 2025 13:49:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-23 18:58:16.101665
- Title: Enhanced Detection of Tiny Objects in Aerial Images
- Title(参考訳): 空中画像におけるTiny物体の検出の高度化
- Authors: Kihyun Kim, Michalis Lazarou, Tania Stathaki,
- Abstract要約: 本稿では, YOLOv8上で容易に実装可能な3つの拡張戦略, 入力画像解像度調整, データ拡張, 注意機構を導入する。
画像サイズの拡大と拡張の適切な利用が、拡張につながることを実証する。
MoonNetは、小さなオブジェクトのベンチマークで最先端のパフォーマンスを達成することで、その適応性とポテンシャルを証明した。
- 参考スコア(独自算出の注目度): 8.565759591545179
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While one-stage detectors like YOLOv8 offer fast training speed, they often under-perform on detecting small objects as a trade-off. This becomes even more critical when detecting tiny objects in aerial imagery due to low-resolution targets and cluttered backgrounds. To address this, we introduce three enhancement strategies -- input image resolution adjustment, data augmentation, and attention mechanisms -- that can be easily implemented on YOLOv8. We demonstrate that image size enlargement and the proper use of augmentation can lead to enhancement. Additionally, we designed a Mixture of Orthogonal Neural-modules Network (MoonNet) pipeline which consists of attention-augmented CNNs. Two well-known attention modules, the Squeeze-and-Excitation Block (SE Block) and the Convolutional Block Attention Module (CBAM), were integrated into the backbone of YOLOv8 with an increased number of channels, and the MoonNet backbone obtained improved detection accuracy compared to the original YOLOv8. MoonNet further proved its adaptability and potential by achieving state-of-the-art performance on a tiny-object benchmark when integrated with the YOLC model. Our codes are available at: https://github.com/Kihyun11/MoonNet
- Abstract(参考訳): YOLOv8のような一段の検出器は高速な訓練速度を提供するが、小さな物体をトレードオフとして検出する能力は低い。
これは、低解像度のターゲットと散らかった背景のために、空中画像中の小さな物体を検出する際にさらに重要になる。
そこで我々は, YOLOv8上で容易に実装可能な3つの拡張戦略, 入力画像解像度調整, データ拡張, 注意機構を導入する。
画像サイズの拡大と拡張の適切な利用が、拡張につながることを実証する。
さらに、注意を増したCNNからなる直交神経モジュールネットワーク(MoonNet)パイプラインを設計した。
Squeeze-and-Excitation Block (SE Block) と Convolutional Block Attention Module (CBAM) の2つの注目モジュールがYOLOv8のバックボーンに統合されチャネル数が増加した。
MoonNetは、YOLCモデルに統合された場合、小さなオブジェクトのベンチマークで最先端のパフォーマンスを達成することで、その適応性と可能性をさらに証明した。
私たちのコードは、https://github.com/Kihyun11/MoonNetで利用可能です。
関連論文リスト
- A lightweight model FDM-YOLO for small target improvement based on YOLOv8 [0.0]
小さいターゲットは、低いピクセル数、複雑な背景、様々な射撃角度のために検出が困難である。
本稿では,小目標検出に焦点をあて,低計算制約下での物体検出手法について検討する。
論文 参考訳(メタデータ) (2025-03-06T14:06:35Z) - Strip R-CNN: Large Strip Convolution for Remote Sensing Object Detection [74.01846006894635]
本稿では,リモートセンシングオブジェクト検出において,大きなストリップ畳み込みが優れた特徴表現学習者であることを示す。
我々はStrip R-CNNと呼ばれる,シンプルで効率的でパワフルなネットワークアーキテクチャを構築した。
論文 参考訳(メタデータ) (2025-01-07T13:30:54Z) - SOD-YOLOv8 -- Enhancing YOLOv8 for Small Object Detection in Traffic Scenes [1.3812010983144802]
Small Object Detection YOLOv8 (SOD-YOLOv8) は、多数の小さなオブジェクトを含むシナリオ用に設計されている。
SOD-YOLOv8は小さなオブジェクト検出を大幅に改善し、様々なメトリクスで広く使われているモデルを上回っている。
ダイナミックな現実世界の交通シーンでは、SOD-YOLOv8は様々な状況で顕著な改善を示した。
論文 参考訳(メタデータ) (2024-08-08T23:05:25Z) - DASSF: Dynamic-Attention Scale-Sequence Fusion for Aerial Object Detection [6.635903943457569]
元のYOLOアルゴリズムは、異なるスケールのターゲットを認識する能力の弱いため、全体的な検出精度が低い。
本稿では,空中画像のターゲット検出のための動的アテンションスケール系列融合アルゴリズム(DASSF)を提案する。
DASSF法をYOLOv8nと比較すると,平均平均精度(mAP)は9.2%,2.4%増加した。
論文 参考訳(メタデータ) (2024-06-18T05:26:44Z) - YOLO-MS: Rethinking Multi-Scale Representation Learning for Real-time Object Detection [63.36722419180875]
YOLO-MSと呼ばれる効率的かつ高性能な物体検出器を提供する。
私たちは、他の大規模なデータセットに頼ることなく、MS COCOデータセット上でYOLO-MSをスクラッチからトレーニングします。
私たちの作業は、他のYOLOモデルのプラグイン・アンド・プレイモジュールとしても機能します。
論文 参考訳(メタデータ) (2023-08-10T10:12:27Z) - An advanced YOLOv3 method for small object detection [2.906551456030129]
本稿では,小型物体検出のための改良型YOLOv3アルゴリズムを提案する。
提案手法では,拡張畳み込みミッシュ(DCM)モジュールをYOLOv3のバックボーンネットワークに導入する。
YOLOv3のネックネットワークでは、畳み込みブロックアテンションモジュール(CBAM)とマルチレベル融合モジュールが導入されている。
論文 参考訳(メタデータ) (2022-12-06T07:58:21Z) - A lightweight and accurate YOLO-like network for small target detection
in Aerial Imagery [94.78943497436492]
小型ターゲット検出のためのシンプルで高速で効率的なネットワークであるYOLO-Sを提案する。
YOLO-SはDarknet20をベースとした小さな特徴抽出器と、バイパスと連結の両方を通じて接続をスキップする。
YOLO-Sはパラメータサイズが87%減少し、約半分のFLOPがYOLOv3となり、低消費電力の産業用アプリケーションに実用化された。
論文 参考訳(メタデータ) (2022-04-05T16:29:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。