論文の概要: Dual-Strategy Improvement of YOLOv11n for Multi-Scale Object Detection in Remote Sensing Images
- arxiv url: http://arxiv.org/abs/2603.13879v1
- Date: Sat, 14 Mar 2026 10:24:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:35.46378
- Title: Dual-Strategy Improvement of YOLOv11n for Multi-Scale Object Detection in Remote Sensing Images
- Title(参考訳): リモートセンシング画像におけるマルチスケール物体検出のためのYOLOv11nのデュアルストラテジー改善
- Authors: Shuaiyu Zhu, Sergey Ablameyko,
- Abstract要約: 本稿では,リモートセンシング画像におけるYOLOv11nモデルの検出精度の低下に対処する2つの改善手法を提案する。
金-YOLO構造をネックネットワークに組み込んでマルチスケールな特徴融合を実現する。
マルチSEAMヘッド検出ヘッドを組み合わせることで、小型・マルチスケールオブジェクトの表現と検出能力をさらに強化する。
- 参考スコア(独自算出の注目度): 0.7519872646378835
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Satellite remote sensing images pose significant challenges for object detection due to their high resolution, complex scenes, and large variations in target scales. To address the insufficient detection accuracy of the YOLOv11n model in remote sensing imagery, this paper proposes two improvement strategies. Method 1: (a) a Large Separable Kernel Attention (LSKA) mechanism is introduced into the backbone network to enhance feature extraction for small objects; (b) a Gold-YOLO structure is incorporated into the neck network to achieve multi-scale feature fusion, thereby improving the detection performance of objects at different scales. Method 2: (a) the Gold-YOLO structure is also integrated into the neck network; (b) a MultiSEAMHead detection head is combined to further strengthen the representation and detection capability for small and multi-scale objects. To verify the effectiveness of the proposed improvements, experiments are conducted on the DOTAv1 dataset. The results show that, while maintaining the lightweight advantage of the model, the proposed methods improve detection accuracy (mAP@0.5) by 1.3% and 1.8%, respectively, compared with the baseline YOLOv11n, demonstrating the effectiveness and practical value of the proposed approaches for object detection in remote sensing images.
- Abstract(参考訳): 衛星リモートセンシング画像は、高解像度、複雑なシーン、ターゲットスケールの大きなバリエーションのために、物体検出に重大な課題を提起する。
リモートセンシング画像におけるYOLOv11nモデルの検出精度の低下に対処するため,本稿では2つの改善策を提案する。
方法1
(a)小さなオブジェクトの特徴抽出を強化するために、バックボーンネットワークにLarge Separable Kernel Attention(LSKA)機構を導入する。
b)ゴールドヨーロ構造をネックネットワークに組み込んでマルチスケールな特徴融合を実現し,異なるスケールの物体の検出性能を向上させる。
方法2
(a)Gold-YOLO構造もネックネットワークに統合される。
b)MultiSEAMHead検出ヘッドを組み合わせることで,小型・大規模オブジェクトの表現と検出能力をさらに強化する。
提案手法の有効性を検証するため,DOTAv1データセットを用いて実験を行った。
提案手法は,モデルによる軽量な優位性を保ちながら,ベースラインのYOLOv11nと比較して検出精度(mAP@0.5)を1.3%,1.8%向上させ,リモートセンシング画像におけるオブジェクト検出手法の有効性と実用性を示した。
関連論文リスト
- YOLO-DS: Fine-Grained Feature Decoupling via Dual-Statistic Synergy Operator for Object Detection [55.58092342624062]
DSO(Dual-Statistic Synergy Operator)を中心に構築されたYOLO-DSを提案する。
YOLO-DSは、チャネル平均とピーク平均差を共同でモデル化することにより、オブジェクトの特徴を分離する。
MS-COCOベンチマークでは、YOLO-DSは5つのモデルスケールでYOLOv8を上回っている。
論文 参考訳(メタデータ) (2026-01-26T05:50:32Z) - YOLO-RS: Remote Sensing Enhanced Crop Detection Methods [0.32985979395737786]
既存のターゲット検出手法は、リモートセンシング画像において、小さなターゲットを扱う際の性能が劣っている。
YOLO-RSは、小さなターゲットの検出を大幅に強化した最新のYolov11に基づいている。
リモートセンシング画像における小目標検出作業におけるYOLO-RSの有効性と適用可能性を検証する実験を行った。
論文 参考訳(メタデータ) (2025-04-15T13:13:22Z) - Efficient Feature Fusion for UAV Object Detection [9.632727117779178]
特に小さな物体は画像のごく一部を占めており、正確な検出を困難にしている。
既存のマルチスケール機能融合手法は、様々な解像度で機能を集約することでこれらの課題に対処する。
本稿では,UAVオブジェクト検出タスクに特化して設計された新しい機能融合フレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-29T20:39:16Z) - SOOD++: Leveraging Unlabeled Data to Boost Oriented Object Detection [68.18620488664187]
本稿では,SOOD++ と呼ばれる簡易かつ効果的な半教師付きオブジェクト指向検出手法を提案する。
具体的には、空中画像からの物体は、通常任意の向き、小さなスケール、密度分布を持つ。
各種ラベル付き環境下での多目的対象物に対する大規模な実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-07-01T07:03:51Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - RRNet: Relational Reasoning Network with Parallel Multi-scale Attention
for Salient Object Detection in Optical Remote Sensing Images [82.1679766706423]
光リモートセンシング画像(RSI)のためのSODは、光学RSIから視覚的に特徴的な物体や領域を探索・抽出することを目的としている。
光学RSIにおけるSODに並列なマルチスケールアテンションを持つリレーショナル推論ネットワークを提案する。
提案するRRNetは,既存の最先端SODコンペティタよりも質的,定量的に優れている。
論文 参考訳(メタデータ) (2021-10-27T07:18:32Z) - AdaZoom: Adaptive Zoom Network for Multi-Scale Object Detection in Large
Scenes [57.969186815591186]
大規模なシーンの検出は、小さなオブジェクトと極端なスケールの変動のために難しい問題である。
本稿では,物体検出のための焦点領域を適応的に拡大するために,フレキシブルな形状と焦点長を有する選択的拡大器として,新しい適応型Zoom(AdaZoom)ネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-19T03:30:22Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。