論文の概要: Dual Refinement Feature Pyramid Networks for Object Detection
- arxiv url: http://arxiv.org/abs/2012.01733v2
- Date: Fri, 4 Dec 2020 02:57:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-23 14:56:43.528633
- Title: Dual Refinement Feature Pyramid Networks for Object Detection
- Title(参考訳): 物体検出のためのデュアルリファインメント特徴ピラミッドネットワーク
- Authors: Jialiang Ma, Bin Chen
- Abstract要約: FPNは、オブジェクト検出器で使われる一般的なコンポーネントであり、隣り合うレベルの特徴と和によって、マルチスケール情報を補う。
本稿では,画素レベルと特徴マップレベルから設計欠陥を解析する。
本研究では,パラメータフリーな特徴ピラミッドネットワークであるDual Refinement Feature Pyramid Networksを設計した。
- 参考スコア(独自算出の注目度): 2.88935873409577
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: FPN is a common component used in object detectors, it supplements
multi-scale information by adjacent level features interpolation and summation.
However, due to the existence of nonlinear operations and the convolutional
layers with different output dimensions, the relationship between different
levels is much more complex, the pixel-wise summation is not an efficient
approach. In this paper, we first analyze the design defects from pixel level
and feature map level. Then, we design a novel parameter-free feature pyramid
networks named Dual Refinement Feature Pyramid Networks (DRFPN) for the
problems. Specifically, DRFPN consists of two modules: Spatial Refinement Block
(SRB) and Channel Refinement Block (CRB). SRB learns the location and content
of sampling points based on contextual information between adjacent levels. CRB
learns an adaptive channel merging method based on attention mechanism. Our
proposed DRFPN can be easily plugged into existing FPN-based models. Without
bells and whistles, for two-stage detectors, our model outperforms different
FPN-based counterparts by 1.6 to 2.2 AP on the COCO detection benchmark, and
1.5 to 1.9 AP on the COCO segmentation benchmark. For one-stage detectors,
DRFPN improves anchor-based RetinaNet by 1.9 AP and anchor-free FCOS by 1.3 AP
when using ResNet50 as backbone. Extensive experiments verifies the robustness
and generalization ability of DRFPN. The code will be made publicly available.
- Abstract(参考訳): FPNは、オブジェクト検出器で使われる一般的なコンポーネントであり、隣り合うレベルの補間と和によって、マルチスケール情報を補う。
しかし、非線形演算と異なる出力次元の畳み込み層が存在するため、異なるレベル間の関係はより複雑であり、ピクセルワイズ和は効率的なアプローチではない。
本稿では,まず,画素レベルと特徴マップレベルからの設計欠陥を分析する。
そこで我々はDual Refinement Feature Pyramid Networks (DRFPN) と呼ばれる新しいパラメータフリー特徴ピラミッドネットワークを設計した。
具体的には、DRFPNはSRB(Spatial Refinement Block)とCRB(Channel Refinement Block)の2つのモジュールで構成される。
srbは隣接するレベル間の文脈情報に基づいてサンプリングポイントの位置と内容を学ぶ。
CRBはアテンション機構に基づく適応チャネルマージ法を学習する。
提案するRFPNは,既存のFPNモデルに容易に接続できる。
ベルとホイッスルがなければ、2段階検出器では、COCO検出ベンチマークでは1.6から2.2AP、COCOセグメンテーションベンチマークでは1.5から1.9APで異なるFPNベースのモデルよりも優れている。
1段階検出器では、ResNet50をバックボーンとして使用する場合、DRFPNはアンカーベースRetinaNetを1.9 AP、アンカーフリーFCOSを1.3 AP改善する。
DRFPNの強靭性と一般化能力を検証する。
コードは公開される予定だ。
関連論文リスト
- Renormalized Connection for Scale-preferred Object Detection in Satellite Imagery [51.83786195178233]
我々は、効率的な特徴抽出の観点から再正規化群理論を実装するために、知識発見ネットワーク(KDN)を設計する。
KDN上の再正規化接続(RC)は、マルチスケール特徴の「相乗的焦点」を可能にする。
RCはFPNベースの検出器のマルチレベル特徴の分割・対数機構を幅広いスケールで予測されたタスクに拡張する。
論文 参考訳(メタデータ) (2024-09-09T13:56:22Z) - Global Context Aggregation Network for Lightweight Saliency Detection of
Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。
まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。
3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2023-09-22T06:19:11Z) - Selective Multi-Scale Learning for Object Detection [35.08958597150306]
RetinaNetとSMSLを組み合わせると、COCOデータセットのAP(39.1%から40.9%)が1.8%改善される。
SMSLと統合すると、2段検出器はAPを1.0%改善できる。
論文 参考訳(メタデータ) (2022-06-16T14:23:50Z) - RCNet: Reverse Feature Pyramid and Cross-scale Shift Network for Object
Detection [10.847953426161924]
本稿では,RevFP(Reverse Feature Pyramid)とCSN(Cross-scale Shift Network)で構成されるRCNetを提案する。
RevFPは、局所的な双方向特徴融合を利用して、双方向ピラミッド推論パイプラインを簡素化する。
CSNは、隣接レベルと非隣接レベルの両方に直接表現を伝播し、より相関性の高いマルチスケール機能を実現する。
論文 参考訳(メタデータ) (2021-10-23T04:00:25Z) - Disentangle Your Dense Object Detector [82.22771433419727]
深層学習に基づく高密度物体検出器はここ数年で大きな成功を収め、ビデオ理解などのマルチメディアアプリケーションにも応用されてきた。
しかし、現在の高密度検出器の訓練パイプラインは、保持できない多くの接続に妥協されている。
そこで本研究では, 簡易かつ効果的な遠心分離機構を設計し, 現在の最先端検出器に統合するDED(Disentangled Dense Object Detector)を提案する。
論文 参考訳(メタデータ) (2021-07-07T00:52:16Z) - FCCDN: Feature Constraint Network for VHR Image Change Detection [12.670734830806591]
本稿では,変更検出のための特徴制約変更検出ネットワーク(FCCDN)を提案する。
両時間的特徴抽出と特徴融合を両立させる。
2つのビルディング変更検出データセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-05-23T06:13:47Z) - A^2-FPN: Attention Aggregation based Feature Pyramid Network for
Instance Segmentation [68.10621089649486]
アテンションアグリゲーションに基づく機能ピラミッドネットワーク(A2-FPN)を提案し、マルチスケール機能学習を改善します。
A2-FPNは、Cascade Mask R-CNNやHybrid Task Cascadeといった強力なベースラインに統合された場合、2.0%と1.4%のマスクAPを改善する。
論文 参考訳(メタデータ) (2021-05-07T11:51:08Z) - MRDet: A Multi-Head Network for Accurate Oriented Object Detection in
Aerial Images [51.227489316673484]
水平アンカーから変換された指向性提案を生成するために、任意指向領域提案ネットワーク(AO-RPN)を提案する。
正確なバウンディングボックスを得るために,検出タスクを複数のサブタスクに分離し,マルチヘッドネットワークを提案する。
各ヘッドは、対応するタスクに最適な特徴を学習するために特別に設計されており、ネットワークがオブジェクトを正確に検出することができる。
論文 参考訳(メタデータ) (2020-12-24T06:36:48Z) - Suppress and Balance: A Simple Gated Network for Salient Object
Detection [89.88222217065858]
両問題を同時に解くための単純なゲートネットワーク(GateNet)を提案する。
多レベルゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに最適に送信することができる。
さらに,提案したFold-ASPP操作(Fold-ASPP)に基づくアトラス空間ピラミッドプーリングを用いて,様々なスケールのサリアンオブジェクトを正確に位置決めする。
論文 参考訳(メタデータ) (2020-07-16T02:00:53Z) - A novel Region of Interest Extraction Layer for Instance Segmentation [3.5493798890908104]
本稿では,既存のRoI抽出器の限界を克服する必要性を動機とする。
提案するレイヤ(Generic RoI Extractor - GRoIE)には,非ローカルなビルディングブロックとアテンション機構が導入され,パフォーマンスが向上する。
GRoIEは、オブジェクト検出とインスタンスセグメンテーションの両方のために、すべての2段階アーキテクチャとシームレスに統合できる。
論文 参考訳(メタデータ) (2020-04-28T17:07:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。