論文の概要: LiM-YOLO: Less is More with Pyramid Level Shift and Normalized Auxiliary Branch for Ship Detection in Optical Remote Sensing Imagery
- arxiv url: http://arxiv.org/abs/2512.09700v1
- Date: Wed, 10 Dec 2025 14:48:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-11 15:14:53.560733
- Title: LiM-YOLO: Less is More with Pyramid Level Shift and Normalized Auxiliary Branch for Ship Detection in Optical Remote Sensing Imagery
- Title(参考訳): LiM-YOLO:光学リモートセンシング画像におけるピラミッドレベルのシフトと船体検出のための正規化補助分岐よりも少ない
- Authors: Seon-Hoon Kim, Hyeji Sim, Youeyun Jung, Ok-Chul Jung, Yerin Kim,
- Abstract要約: LiM-YOLOは、ドメイン固有の競合を解決するために設計された特殊な検出器である。
船舶の規模を統計的に分析し,検出ヘッドをP2-P4に緩和するピラミッドレベルシフト戦略を導入する。
LiM-YOLOは最先端モデルに比べて検出精度と効率が優れている。
- 参考スコア(独自算出の注目度): 3.2425852744760184
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Applying general-purpose object detectors to ship detection in satellite imagery presents significant challenges due to the extreme scale disparity and morphological anisotropy of maritime targets. Standard architectures utilizing stride-32 (P5) layers often fail to resolve narrow vessels, resulting in spatial feature dilution. In this work, we propose LiM-YOLO, a specialized detector designed to resolve these domain-specific conflicts. Based on a statistical analysis of ship scales, we introduce a Pyramid Level Shift Strategy that reconfigures the detection head to P2-P4. This shift ensures compliance with Nyquist sampling criteria for small objects while eliminating the computational redundancy of deep layers. To further enhance training stability on high-resolution inputs, we incorporate a Group Normalized Convolutional Block for Linear Projection (GN-CBLinear), which mitigates gradient volatility in micro-batch settings. Validated on SODA-A, DOTA-v1.5, FAIR1M-v2.0, and ShipRSImageNet-V1, LiM-YOLO demonstrates superior detection accuracy and efficiency compared to state-of-the-art models. The code is available at https://github.com/egshkim/LiM-YOLO.
- Abstract(参考訳): 衛星画像の船体検出に汎用物体検出器を応用すると、海洋目標の極端なスケールの格差と形態的異方性により、大きな課題が生じる。
ストライド32(P5)層を用いた標準的なアーキテクチャでは、狭い容器の解決に失敗することが多く、空間的特徴の希釈が生じる。
本研究では、これらのドメイン固有の競合を解決するために設計された特殊検出器LiM-YOLOを提案する。
船舶の規模を統計的に分析し,検出ヘッドをP2-P4に再構成するピラミッドレベルシフト戦略を導入する。
このシフトは、ディープレイヤの計算冗長性を排除しつつ、小さなオブジェクトのNyquistサンプリング基準に準拠することを保証する。
高分解能入力のトレーニング安定性をさらに高めるため、マイクロバッチ設定における勾配変動を緩和するGN-CBLinear(Group Normalized Convolutional Block for Linear Projection)を組み込んだ。
SODA-A、DOTA-v1.5、FAIR1M-v2.0、ShipRSImageNet-V1で検証されたLiM-YOLOは、最先端のモデルよりも優れた検出精度と効率を示す。
コードはhttps://github.com/egshkim/LiM-YOLOで公開されている。
関連論文リスト
- HierLight-YOLO: A Hierarchical and Lightweight Object Detection Network for UAV Photography [0.0]
本稿では,小型物体のリアルタイム検出を支援する階層的特徴融合と軽量モデルであるHierLight-YOLOを提案する。
本稿では階層型拡張経路集約ネットワーク(HEPAN)を提案する。
小さい物体検出ヘッドは、空間分解能をさらに高め、小さな物体(4ピクセル)検出に対処するために特徴融合を行うように設計されている。
論文 参考訳(メタデータ) (2025-09-26T13:59:02Z) - Power Battery Detection [91.99787495748218]
電力電池は、内部構造欠陥が深刻な安全リスクを生じさせる電気自動車において必須の部品である。
我々は,X線画像から陰極および陽極板の密集端を局所化し,品質検査を行うことを目的として,電力電池検出(PBD)に関する総合的研究を行った。
PBD5Kは,9種類のバッテリタイプから5,000枚のX線画像と8種類の実世界の視覚的干渉を含む,このタスクのための最初の大規模ベンチマークである。
論文 参考訳(メタデータ) (2025-08-11T09:35:25Z) - High-Frequency Semantics and Geometric Priors for End-to-End Detection Transformers in Challenging UAV Imagery [6.902247657565531]
本稿では,空中シーンに適したリアルタイム検出変換器であるHEDS-DETRを紹介する。
まず,高周波数拡張セマンティックスネットワーク(HFESNet)のバックボーンを提案する。
第2に、高分解能特徴を効率的に融合させることにより、情報損失に対処する。
第三に、2つの相乗的成分を用いてデコーダの安定性と位置決め精度を向上させる。
論文 参考訳(メタデータ) (2025-07-01T14:56:56Z) - YOLO-MST: Multiscale deep learning method for infrared small target detection based on super-resolution and YOLO [0.18641315013048293]
本稿では,画像超解像技術とマルチスケール観測を組み合わせた深層学習赤外線小目標検出手法を提案する。
この手法の2つの公開データセットであるSIRSTとIRISでのmAP@0.5検出率は、それぞれ96.4%と99.5%に達した。
論文 参考訳(メタデータ) (2024-12-27T18:43:56Z) - LAM-YOLO: Drones-based Small Object Detection on Lighting-Occlusion Attention Mechanism YOLO [0.9062164411594178]
LAM-YOLOは、ドローンベースの画像に特化して設計されたオブジェクト検出モデルである。
我々は、異なる照明条件下での小さな目標の視認性を高めるために、光遮断注意機構を導入する。
次に、回帰損失関数として改良されたSIB-IoUを用いてモデル収束を加速し、局所化精度を向上させる。
論文 参考訳(メタデータ) (2024-11-01T10:00:48Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - DepthFormer: Exploiting Long-Range Correlation and Local Information for
Accurate Monocular Depth Estimation [50.08080424613603]
高精度な単分子深度推定には長距離相関が不可欠である。
我々は,このグローバルコンテキストを効果的な注意機構でモデル化するためにTransformerを活用することを提案する。
提案したモデルであるDepthFormerは、最先端のモノクル深度推定手法をはるかに超えている。
論文 参考訳(メタデータ) (2022-03-27T05:03:56Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。