論文の概要: Multi-patch Feature Pyramid Network for Weakly Supervised Object
Detection in Optical Remote Sensing Images
- arxiv url: http://arxiv.org/abs/2108.08063v1
- Date: Wed, 18 Aug 2021 09:25:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-19 14:38:59.748814
- Title: Multi-patch Feature Pyramid Network for Weakly Supervised Object
Detection in Optical Remote Sensing Images
- Title(参考訳): 光リモートセンシング画像における弱教師付き物体検出のためのマルチパッチ特徴ピラミッドネットワーク
- Authors: Pourya Shamsolmoali, Jocelyn Chanussot, Masoumeh Zareapoor, Huiyu
Zhou, and Jie Yang
- Abstract要約: マルチパッチ特徴ピラミッドネットワーク(MPFP-Net)を用いたオブジェクト検出のための新しいアーキテクチャを提案する。
MPFP-Netは、トレーニング中の最も差別的なパッチのみを追求する現在のモデルとは異なる。
残余値の正則化と核融合遷移層を厳密にノルム保存する有効な方法を提案する。
- 参考スコア(独自算出の注目度): 39.25541709228373
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Object detection is a challenging task in remote sensing because objects only
occupy a few pixels in the images, and the models are required to
simultaneously learn object locations and detection. Even though the
established approaches well perform for the objects of regular sizes, they
achieve weak performance when analyzing small ones or getting stuck in the
local minima (e.g. false object parts). Two possible issues stand in their way.
First, the existing methods struggle to perform stably on the detection of
small objects because of the complicated background. Second, most of the
standard methods used hand-crafted features, and do not work well on the
detection of objects parts of which are missing. We here address the above
issues and propose a new architecture with a multiple patch feature pyramid
network (MPFP-Net). Different from the current models that during training only
pursue the most discriminative patches, in MPFPNet the patches are divided into
class-affiliated subsets, in which the patches are related and based on the
primary loss function, a sequence of smooth loss functions are determined for
the subsets to improve the model for collecting small object parts. To enhance
the feature representation for patch selection, we introduce an effective
method to regularize the residual values and make the fusion transition layers
strictly norm-preserving. The network contains bottom-up and crosswise
connections to fuse the features of different scales to achieve better
accuracy, compared to several state-of-the-art object detection models. Also,
the developed architecture is more efficient than the baselines.
- Abstract(参考訳): オブジェクト検出は、画像内の数ピクセルのみを占有し、オブジェクトの位置と検出を同時に学習するモデルを必要とするため、リモートセンシングにおいて難しいタスクである。
確立されたアプローチは、通常のサイズのオブジェクトに対してうまく機能するが、小さなオブジェクトを解析したり、ローカルのミニマ(例えば、)で立ち往生する際の弱いパフォーマンスを達成する。
偽物部分)。
考えられる2つの問題が立ち向かっている。
第一に, 既存手法では, 複雑な背景から, 小型物体の検出を安定的に行うのが困難である。
第二に、標準的な手法のほとんどは手作りの機能を使用しており、欠落しているオブジェクトの検知にはうまく機能しない。
本稿では、上記の問題に対処し、マルチパッチ機能ピラミッドネットワーク(MPFP-Net)を用いた新しいアーキテクチャを提案する。
トレーニング中に最も差別的なパッチのみを追求する現在のモデルとは異なり、MPFPNetではパッチはクラス関連サブセットに分割され、パッチが関連付けられ、一次損失関数に基づいて、サブセットに対して滑らかな損失関数列が決定され、小さなオブジェクト部品の収集モデルが改善される。
パッチ選択のための特徴表現を強化するために,残差値を正規化し,融合遷移層を厳格に規範保存する効果的な手法を提案する。
ネットワークにはボトムアップとクロスワイドの接続があり、いくつかの最先端オブジェクト検出モデルと比較して、異なるスケールの特徴を融合して精度を向上させる。
また、開発されたアーキテクチャはベースラインよりも効率的です。
関連論文リスト
- Object-Centric Multiple Object Tracking [124.30650395969126]
本稿では,多目的追跡パイプラインのためのビデオオブジェクト中心モデルを提案する。
オブジェクト中心のスロットを検出出力に適応するインデックスマージモジュールと、オブジェクトメモリモジュールで構成される。
オブジェクト中心学習に特化して、オブジェクトのローカライゼーションと機能バインディングのためのスパース検出ラベルしか必要としない。
論文 参考訳(メタデータ) (2023-09-01T03:34:12Z) - Rethinking the backbone architecture for tiny object detection [0.0]
既存の小さなオブジェクト検出方法は、標準的なディープニューラルネットワークをバックボーンアーキテクチャとして使用しています。
このようなバックボーンは、大きなオブジェクトの分類のために設計されたため、小さなオブジェクトを検出するには不適切であり、小さなターゲットを特定するための空間分解能を持っていない、と我々は主張する。
我々は、全体的な計算負荷を伴わずに、高解像度の機能を処理するためにより多くのリソースを割り当てる「ボトムヘビー」バージョンのバックボーンを設計する。
論文 参考訳(メタデータ) (2023-03-20T16:50:29Z) - CASAPose: Class-Adaptive and Semantic-Aware Multi-Object Pose Estimation [2.861848675707602]
CASAPoseと呼ばれる新しい単一ステージアーキテクチャを提案する。
RGB画像中の複数の異なるオブジェクトのポーズ推定のための2D-3D対応を1パスで決定する。
高速でメモリ効率が高く、複数のオブジェクトに対して高い精度を実現する。
論文 参考訳(メタデータ) (2022-10-11T10:20:01Z) - You Better Look Twice: a new perspective for designing accurate
detectors with reduced computations [56.34005280792013]
BLT-netは、新しい低計算の2段階オブジェクト検出アーキテクチャである。
非常にエレガントな第1ステージを使用して、オブジェクトをバックグラウンドから分離することで、計算を削減します。
結果のイメージ提案は、高度に正確なモデルによって第2段階で処理される。
論文 参考訳(メタデータ) (2021-07-21T12:39:51Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z) - Hierarchical Complementary Learning for Weakly Supervised Object
Localization [12.104019927107517]
弱教師付きオブジェクトローカライゼーション(WSOL)は、画像レベルのラベルだけでオブジェクトをローカライズすることを目的とした課題である。
本稿では,CNNが画像上のオブジェクトのより優れた分類とローカライズを行うのに役立つ階層型補完学習ネットワーク(HCLNet)を提案する。
論文 参考訳(メタデータ) (2020-11-16T14:58:51Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z) - Few-shot Object Detection on Remote Sensing Images [11.40135025181393]
リモートセンシング画像におけるオブジェクト検出のための数ショットの学習手法を提案する。
我々は、YOLOv3アーキテクチャに基づいて、少数ショットオブジェクト検出モデルを構築し、マルチスケールオブジェクト検出フレームワークを開発する。
論文 参考訳(メタデータ) (2020-06-14T07:18:10Z) - NETNet: Neighbor Erasing and Transferring Network for Better Single Shot
Object Detection [170.30694322460045]
我々は、ピラミッドの特徴を再設定し、スケールアウェアな特徴を探索する新しいNeighbor Erasing and Transferring(NET)メカニズムを提案する。
NETNetと呼ばれるシングルショットネットワークは、スケールアウェアなオブジェクト検出のために構築されている。
論文 参考訳(メタデータ) (2020-01-18T15:21:29Z) - Pixel-Semantic Revise of Position Learning A One-Stage Object Detector
with A Shared Encoder-Decoder [5.371825910267909]
異なる手法がオブジェクトを適応的に検出することを分析する。
いくつかの最先端検出器は、異なる特徴ピラミッドと多レベルセマンティック情報を強化するための多くのメカニズムを組み合わせている。
この研究は、注意機構を持つ共有エンコーダデコーダを持つアンカーフリー検出器によって対処される。
論文 参考訳(メタデータ) (2020-01-04T08:55:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。