論文の概要: Renormalized Connection for Scale-preferred Object Detection in Satellite Imagery
- arxiv url: http://arxiv.org/abs/2409.05624v1
- Date: Mon, 9 Sep 2024 13:56:22 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-10 14:29:55.001747
- Title: Renormalized Connection for Scale-preferred Object Detection in Satellite Imagery
- Title(参考訳): 衛星画像におけるスケール優先物体検出のための正規化接続
- Authors: Fan Zhang, Lingling Li, Licheng Jiao, Xu Liu, Fang Liu, Shuyuan Yang, Biao Hou,
- Abstract要約: 我々は、効率的な特徴抽出の観点から再正規化群理論を実装するために、知識発見ネットワーク(KDN)を設計する。
KDN上の再正規化接続(RC)は、マルチスケール特徴の「相乗的焦点」を可能にする。
RCはFPNベースの検出器のマルチレベル特徴の分割・対数機構を幅広いスケールで予測されたタスクに拡張する。
- 参考スコア(独自算出の注目度): 51.83786195178233
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Satellite imagery, due to its long-range imaging, brings with it a variety of scale-preferred tasks, such as the detection of tiny/small objects, making the precise localization and detection of small objects of interest a challenging task. In this article, we design a Knowledge Discovery Network (KDN) to implement the renormalization group theory in terms of efficient feature extraction. Renormalized connection (RC) on the KDN enables ``synergistic focusing'' of multi-scale features. Based on our observations of KDN, we abstract a class of RCs with different connection strengths, called n21C, and generalize it to FPN-based multi-branch detectors. In a series of FPN experiments on the scale-preferred tasks, we found that the ``divide-and-conquer'' idea of FPN severely hampers the detector's learning in the right direction due to the large number of large-scale negative samples and interference from background noise. Moreover, these negative samples cannot be eliminated by the focal loss function. The RCs extends the multi-level feature's ``divide-and-conquer'' mechanism of the FPN-based detectors to a wide range of scale-preferred tasks, and enables synergistic effects of multi-level features on the specific learning goal. In addition, interference activations in two aspects are greatly reduced and the detector learns in a more correct direction. Extensive experiments of 17 well-designed detection architectures embedded with n21s on five different levels of scale-preferred tasks validate the effectiveness and efficiency of the RCs. Especially the simplest linear form of RC, E421C performs well in all tasks and it satisfies the scaling property of RGT. We hope that our approach will transfer a large number of well-designed detectors from the computer vision community to the remote sensing community.
- Abstract(参考訳): 衛星画像は、その長距離イメージングのために、小型/小型の物体の検出や、興味のある小さな物体の正確な位置特定や検出といった、様々なスケールで好まれるタスクをもたらす。
本稿では,効率的な特徴抽出の観点から再正規化群理論を実装するために,知識発見ネットワーク(KDN)を設計する。
KDN上の再正規化接続(RC)は、マルチスケール機能の 'synergistic focus' を可能にする。
我々は、KDNの観測に基づいて、n21Cと呼ばれる異なる接続強度を持つRCのクラスを抽象化し、FPNベースのマルチブランチ検出器に一般化する。
スケール優先タスクに関する一連のFPN実験において、FPNの「分極と対流」という考え方は、多数の大規模負のサンプルと背景雑音からの干渉により、検出器の学習を正しい方向に著しく妨げていることがわかった。
さらに、これらの負のサンプルは、焦点損失関数によって排除できない。
RCは、FPNベースの検出器のマルチレベル特徴の `divide-and-conquer' メカニズムを広範囲のスケール優先タスクに拡張し、特定の学習目標に対するマルチレベル特徴の相乗効果を実現する。
さらに、2つの側面における干渉活性化が大幅に減少し、検出器はより正しい方向に学習する。
n21に埋め込まれた17のよく設計された検知アーキテクチャの大規模な実験により、RCの有効性と効率が検証された。
特に、RCの最も単純な線形形式であるE421Cは、すべてのタスクにおいてよく機能し、RGTのスケーリング特性を満たす。
当社のアプローチは、コンピュータビジョンコミュニティからリモートセンシングコミュニティに、多数のよく設計された検出器を転送することを期待しています。
関連論文リスト
- Multitask Learning for SAR Ship Detection with Gaussian-Mask Joint Segmentation [20.540873039361102]
本稿では,オブジェクト検出,スペックル抑制,ターゲットセグメンテーションタスクからなるSAR船舶検出のためのマルチタスク学習フレームワークを提案する。
アスペクト比重み付けによる角度分類損失を導入し、角度周期性と物体比に対処して検出精度を向上させる。
スペックル抑制タスクはデュアルフュージョンアテンション機構を使用してノイズを低減し、浅くノイズを生じさせる特徴を融合させ、ロバスト性を高める。
ターゲットセグメンテーションタスクは、回転したガウスマスクを利用して、乱雑な背景から対象領域を抽出するネットワークを支援し、画素レベルの予測により検出効率を向上させる。
論文 参考訳(メタデータ) (2024-11-21T05:10:41Z) - SCLNet: A Scale-Robust Complementary Learning Network for Object Detection in UAV Images [0.0]
本稿では,SCLNet(Scale-robust complementary learning network)を提案する。
1つの実装は、提案したスケール補完デコーダとスケール補完損失関数に基づいている。
もう一つの実装は、提案したコントラッシブ・コントラスト・コントラスト・コントラスト・コントラスト・ネットワークとコントラスト・コントラスト・コントラスト・コントラスト・コントラスト・ロス関数に基づいている。
論文 参考訳(メタデータ) (2024-09-11T05:39:25Z) - A DeNoising FPN With Transformer R-CNN for Tiny Object Detection [25.892598910922004]
そこで本稿では,Trans R-CNN (DNTR) を用いたFPNのデノベーション手法を提案する。
DNTRは、簡単なプラグイン設計、DeNoising FPN (DN-FPN)、効果的なTransformerベースの検出器であるTrans R-CNNで構成されている。
我々は、古いR-CNN検出器を新しいTrans R-CNN検出器に置き換え、自己注意を持つ小さな物体の表現に集中する。
論文 参考訳(メタデータ) (2024-06-09T12:18:15Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - RRNet: Relational Reasoning Network with Parallel Multi-scale Attention
for Salient Object Detection in Optical Remote Sensing Images [82.1679766706423]
光リモートセンシング画像(RSI)のためのSODは、光学RSIから視覚的に特徴的な物体や領域を探索・抽出することを目的としている。
光学RSIにおけるSODに並列なマルチスケールアテンションを持つリレーショナル推論ネットワークを提案する。
提案するRRNetは,既存の最先端SODコンペティタよりも質的,定量的に優れている。
論文 参考訳(メタデータ) (2021-10-27T07:18:32Z) - MRDet: A Multi-Head Network for Accurate Oriented Object Detection in
Aerial Images [51.227489316673484]
水平アンカーから変換された指向性提案を生成するために、任意指向領域提案ネットワーク(AO-RPN)を提案する。
正確なバウンディングボックスを得るために,検出タスクを複数のサブタスクに分離し,マルチヘッドネットワークを提案する。
各ヘッドは、対応するタスクに最適な特徴を学習するために特別に設計されており、ネットワークがオブジェクトを正確に検出することができる。
論文 参考訳(メタデータ) (2020-12-24T06:36:48Z) - EDN: Salient Object Detection via Extremely-Downsampled Network [66.38046176176017]
画像全体のグローバルビューを効果的に学ぶために、極端なダウンサンプリング技術を使用するExtremely-Downsampled Network(EDN)を紹介します。
実験は、ednがリアルタイム速度でsart性能を達成することを実証する。
論文 参考訳(メタデータ) (2020-12-24T04:23:48Z) - SRF-GAN: Super-Resolved Feature GAN for Multi-Scale Representation [5.634825161148483]
畳み込み型物体検出器の超解像特性のための新しい生成器を提案する。
本稿では,検出ベースジェネレータと特徴パッチ識別器で構成される超解像GAN(SRF-GAN)を設計する。
我々のSRFジェネレータは従来の方法に代えて、他の従来の検出器と簡単に微調整できる。
論文 参考訳(メタデータ) (2020-11-17T06:27:32Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。