論文の概要: RMK RetinaNet: Rotated Multi-Kernel RetinaNet for Robust Oriented Object Detection in Remote Sensing Imagery
- arxiv url: http://arxiv.org/abs/2603.04793v1
- Date: Thu, 05 Mar 2026 04:14:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-06 22:06:11.06498
- Title: RMK RetinaNet: Rotated Multi-Kernel RetinaNet for Robust Oriented Object Detection in Remote Sensing Imagery
- Title(参考訳): RMK RetinaNet:リモートセンシング画像におけるロバスト指向物体検出のための回転多カーネルRetinaNet
- Authors: Huiran Sun,
- Abstract要約: リモートセンシング画像における回転物体の受容は、3つの大きなボトルネックによって妨げられる。
これらの問題に対処するために、回転多重カーネルRetinaNet(RMK RetinaNet)を提案する。
RMK RetinaNetは、最先端の回転物体検出器に匹敵する性能を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Rotated object detection in remote sensing imagery is hindered by three major bottlenecks: non-adaptive receptive field utilization, inadequate long-range multi-scale feature fusion, and discontinuities in angle regression. To address these issues, we propose Rotated Multi-Kernel RetinaNet (RMK RetinaNet). First, we design a Multi-Scale Kernel (MSK) Block to strengthen adaptive multi-scale feature extraction. Second, we incorporate a Multi-Directional Contextual Anchor Attention (MDCAA) mechanism into the feature pyramid to enhance contextual modeling across scales and orientations. Third, we introduce a Bottom-up Path to preserve fine-grained spatial details that are often degraded during downsampling. Finally, we develop an Euler Angle Encoding Module (EAEM) to enable continuous and stable angle regression. Extensive experiments on DOTA-v1.0, HRSC2016, and UCAS-AOD show that RMK RetinaNet achieves performance comparable to state-of-the-art rotated object detectors while improving robustness in multi-scale and multi-orientation scenarios.
- Abstract(参考訳): リモートセンシング画像における回転物体検出は,非適応受容場利用,長距離多機能融合の不十分,角度回帰の不連続の3つの主要なボトルネックによって妨げられている。
これらの問題に対処するために、回転多重カーネルRetinaNet(RMK RetinaNet)を提案する。
まず、適応型マルチスケール特徴抽出を強化するために、マルチスケールカーネルブロック(MSK)を設計する。
第2に、MDCAA(Multi-Directional Contextual Anchor Attention)メカニズムを特徴ピラミッドに組み込んで、スケールと向きをまたいだコンテキストモデリングを強化する。
第3に,ダウンサンプリング時にしばしば劣化する微細な空間的詳細を保存するためのボトムアップパスを導入する。
最後に,連続かつ安定な角度回帰を可能にするEuler Angle Encoding Module (EAEM) を開発した。
DOTA-v1.0、HRSC2016、UCAS-AODの大規模な実験により、RMK RetinaNetは最先端の回転物体検出器に匹敵する性能を達成し、マルチスケールおよびマルチオリエンテーションシナリオにおける堅牢性を改善した。
関連論文リスト
- A lightweight detector for real-time detection of remote sensing images [0.0]
DMG-YOLOは、リモートセンシング画像の小さな物体検出に適した軽量リアルタイム検出器である。
バックボーンにデュアルブランチ特徴抽出(DFE)モジュールを導入し,特徴マップを2つの並列ブランチに分割する。
首にGlobal and Local Aggregate Feature Pyramid Network (GLAFPN)を導入し,小物体検出をさらに促進する。
論文 参考訳(メタデータ) (2025-11-21T11:11:04Z) - A Lightweight 3D Anomaly Detection Method with Rotationally Invariant Features [60.76577388438418]
3D異常検出(AD)は、ポイントクラウドデータから異常点や領域を特定することを目的として、コンピュータビジョンにおいて重要なタスクである。
既存の手法は、方向と位置の変化を伴う点雲を扱う場合、結果として得られる特徴が著しく異なるため、課題に遭遇する可能性がある。
本稿では、3次元ADのための新しい回転不変特徴量(RIF)フレームワークを提案し、各点を回転不変空間にマッピングして表現の整合性を維持する。
論文 参考訳(メタデータ) (2025-11-17T08:16:05Z) - PointOBB-v3: Expanding Performance Boundaries of Single Point-Supervised Oriented Object Detection [65.84604846389624]
我々は,より強力な単一点制御OODフレームワークであるPointOBB-v3を提案する。
追加のプリミティブなしで擬似回転ボックスを生成し、エンドツーエンドのパラダイムをサポートする。
本手法は従来の最先端手法と比較して3.56%の精度向上を実現している。
論文 参考訳(メタデータ) (2025-01-23T18:18:15Z) - Anchor Free remote sensing detector based on solving discrete polar
coordinate equation [4.708085033897991]
回転・多スケール物体を検出するためのAnchor Free Aviatic Remote Sensor Object Detector (BWP-Det) を提案する。
具体的には、インタラクティブなダブルブランチ(IDB)アップサンプリングネットワークを設計し、ヒートマップの予測に1つのブランチを徐々にアップサンプリングする。
我々は、前景と背景の違いを強調するために、重み付きマルチスケール畳み込み(WmConv)を改善した。
論文 参考訳(メタデータ) (2023-03-21T09:28:47Z) - Adaptive Rotated Convolution for Rotated Object Detection [96.94590550217718]
本稿では、回転物体検出問題に対処するために、適応回転変換(ARC)モジュールを提案する。
ARCモジュールでは、コンボリューションカーネルが適応的に回転し、異なる画像に異なる向きのオブジェクト特徴を抽出する。
提案手法は,81.77%mAPのDOTAデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-14T11:53:12Z) - Weakly Aligned Feature Fusion for Multimodal Object Detection [52.15436349488198]
マルチモーダルデータはしばしば位置ずれの問題に悩まされます。つまり、イメージペアは厳密に一致していません。
この問題により、マルチモーダルな特徴を融合させることが難しくなり、畳み込みニューラルネットワーク(CNN)のトレーニングが難解になる。
本稿では、位置ずれ問題に対処するために、アライメント領域CNN(AR-CNN)と呼ばれる汎用マルチモーダル検出器を提案する。
論文 参考訳(メタデータ) (2022-04-21T02:35:23Z) - EPNet++: Cascade Bi-directional Fusion for Multi-Modal 3D Object
Detection [56.03081616213012]
本稿では,新しいCasscade Bi-directional Fusion(CB-Fusion)モジュールを導入することで,マルチモーダル3Dオブジェクト検出のためのEPNet++を提案する。
提案したCB-Fusionモジュールは、カスケード双方向相互作用融合方式で画像特徴と点特徴の豊富な意味情報を高める。
KITTI、JRDB、SUN-RGBDデータセットの実験結果は、最先端の手法よりもEPNet++の方が優れていることを示している。
論文 参考訳(メタデータ) (2021-12-21T10:48:34Z) - DARDet: A Dense Anchor-free Rotated Object Detector in Aerial Images [11.45718985586972]
空中画像における回転物体検出のための高密度アンカーフリー回転物体検出器(DARDet)を提案する。
我々のDARDetは、特徴マップの各前景ピクセルで回転したボックスの5つのパラメータを直接予測する。
提案手法は, 一般的に使用されている3つの空中オブジェクトデータセットに対して, 最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-10-03T15:28:14Z) - CFC-Net: A Critical Feature Capturing Network for Arbitrary-Oriented
Object Detection in Remote Sensing Images [0.9462808515258465]
本稿では,物体検出における識別的特徴の役割について論じる。
次に,検出精度を向上させるために,cfc-net (critical feature capture network) を提案する。
本手法は多くの最先端手法と比較して優れた検出性能が得られることを示す。
論文 参考訳(メタデータ) (2021-01-18T02:31:09Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。