論文の概要: RCNet: Reverse Feature Pyramid and Cross-scale Shift Network for Object
Detection
- arxiv url: http://arxiv.org/abs/2110.12130v1
- Date: Sat, 23 Oct 2021 04:00:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-26 15:40:31.950443
- Title: RCNet: Reverse Feature Pyramid and Cross-scale Shift Network for Object
Detection
- Title(参考訳): RCNet:オブジェクト検出のためのリバース機能ピラミッドとクロススケールシフトネットワーク
- Authors: Zhuofan Zong, Qianggang Cao, Biao Leng
- Abstract要約: 本稿では,RevFP(Reverse Feature Pyramid)とCSN(Cross-scale Shift Network)で構成されるRCNetを提案する。
RevFPは、局所的な双方向特徴融合を利用して、双方向ピラミッド推論パイプラインを簡素化する。
CSNは、隣接レベルと非隣接レベルの両方に直接表現を伝播し、より相関性の高いマルチスケール機能を実現する。
- 参考スコア(独自算出の注目度): 10.847953426161924
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Feature pyramid networks (FPN) are widely exploited for multi-scale feature
fusion in existing advanced object detection frameworks. Numerous previous
works have developed various structures for bidirectional feature fusion, all
of which are shown to improve the detection performance effectively. We observe
that these complicated network structures require feature pyramids to be
stacked in a fixed order, which introduces longer pipelines and reduces the
inference speed. Moreover, semantics from non-adjacent levels are diluted in
the feature pyramid since only features at adjacent pyramid levels are merged
by the local fusion operation in a sequence manner. To address these issues, we
propose a novel architecture named RCNet, which consists of Reverse Feature
Pyramid (RevFP) and Cross-scale Shift Network (CSN). RevFP utilizes local
bidirectional feature fusion to simplify the bidirectional pyramid inference
pipeline. CSN directly propagates representations to both adjacent and
non-adjacent levels to enable multi-scale features more correlative. Extensive
experiments on the MS COCO dataset demonstrate RCNet can consistently bring
significant improvements over both one-stage and two-stage detectors with
subtle extra computational overhead. In particular, RetinaNet is boosted to
40.2 AP, which is 3.7 points higher than baseline, by replacing FPN with our
proposed model. On COCO test-dev, RCNet can achieve very competitive
performance with a single-model single-scale 50.5 AP. Codes will be made
available.
- Abstract(参考訳): 特徴ピラミッドネットワーク(FPN)は、既存の高度なオブジェクト検出フレームワークにおけるマルチスケール機能融合に広く利用されている。
多くの先行研究が双方向特徴融合のための様々な構造を開発しており、いずれも検出性能を効果的に向上させることが示されている。
これらの複雑なネットワーク構造では,機能ピラミッドを一定の順序で積み重ねる必要があり,パイプラインが長くなり,推論速度が低下する。
また,隣接ピラミッドレベルの特徴のみを局所的融合演算により逐次的にマージするため,非隣接レベルの意味論は特徴ピラミッドで希釈される。
これらの課題に対処するため,RevFP(Reverse Feature Pyramid)とCSN(Cross-scale Shift Network)からなるRCNetというアーキテクチャを提案する。
RevFPは、局所的な双方向特徴融合を利用して、双方向ピラミッド推論パイプラインを簡素化する。
csnは隣接レベルと非隣接レベルの両方に表現を直接伝達し、マルチスケールな特徴をより相互に関連付ける。
MS COCOデータセットの大規模な実験は、RCNetが微妙な計算オーバーヘッドを持つ1段と2段の両方の検出器に対して、一貫して大幅な改善をもたらすことを示した。
特にRetinaNetは、FPNを我々の提案したモデルに置き換えることで、ベースラインよりも3.7ポイント高い40.2 APに強化される。
COCOテストデブでは、RCNetはシングルスケールの50.5 APで非常に競争力のある性能を達成できる。
コードは利用可能になる。
関連論文リスト
- Trident Pyramid Networks: The importance of processing at the feature
pyramid level for better object detection [50.008529403150206]
我々はTrident Pyramid Network (TPN)と呼ばれる新しいコアアーキテクチャを提案する。
TPNはより深い設計を可能にし、コミュニケーションベースの処理と自己処理のバランスを改善する。
TPNコアをオブジェクト検出ベンチマークで使用した場合,BifPNベースラインを1.5 APで上回り,一貫した改善が見られた。
論文 参考訳(メタデータ) (2021-10-08T09:59:59Z) - A^2-FPN: Attention Aggregation based Feature Pyramid Network for
Instance Segmentation [68.10621089649486]
アテンションアグリゲーションに基づく機能ピラミッドネットワーク(A2-FPN)を提案し、マルチスケール機能学習を改善します。
A2-FPNは、Cascade Mask R-CNNやHybrid Task Cascadeといった強力なベースラインに統合された場合、2.0%と1.4%のマスクAPを改善する。
論文 参考訳(メタデータ) (2021-05-07T11:51:08Z) - OPANAS: One-Shot Path Aggregation Network Architecture Search for Object
Detection [82.04372532783931]
近年、ニューラルアーキテクチャサーチ (NAS) が特徴ピラミッドネットワーク (FPN) の設計に活用されている。
本稿では,探索効率と検出精度を大幅に向上させる,ワンショットパス集約ネットワークアーキテクチャ探索(OPANAS)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-08T01:48:53Z) - Implicit Feature Pyramid Network for Object Detection [22.530998243247154]
物体検出のための暗黙的特徴ピラミッドネットワーク(i-FPN)を提案する。
本稿では,深平衡モデル(DEQ)で最近導入された暗黙関数を用いてFPNの変換をモデル化する。
MSデータセットによる実験結果から,i-FPNはベースライン検出器と比較して検出性能を大幅に向上することが示された。
論文 参考訳(メタデータ) (2020-12-25T11:30:27Z) - Dual Refinement Feature Pyramid Networks for Object Detection [2.88935873409577]
FPNは、オブジェクト検出器で使われる一般的なコンポーネントであり、隣り合うレベルの特徴と和によって、マルチスケール情報を補う。
本稿では,画素レベルと特徴マップレベルから設計欠陥を解析する。
本研究では,パラメータフリーな特徴ピラミッドネットワークであるDual Refinement Feature Pyramid Networksを設計した。
論文 参考訳(メタデータ) (2020-12-03T07:17:03Z) - Parallel Residual Bi-Fusion Feature Pyramid Network for Accurate
Single-Shot Object Detection [22.817918566911203]
本稿では,高速かつ高精度な単発物体検出のための並列残差二フュージョン特徴ピラミッドネットワーク(PRB-FPN)を提案する。
提案するネットワークは,UAVDT17およびMS COCOデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2020-12-03T06:51:20Z) - Suppress and Balance: A Simple Gated Network for Salient Object
Detection [89.88222217065858]
両問題を同時に解くための単純なゲートネットワーク(GateNet)を提案する。
多レベルゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに最適に送信することができる。
さらに,提案したFold-ASPP操作(Fold-ASPP)に基づくアトラス空間ピラミッドプーリングを用いて,様々なスケールのサリアンオブジェクトを正確に位置決めする。
論文 参考訳(メタデータ) (2020-07-16T02:00:53Z) - A novel Region of Interest Extraction Layer for Instance Segmentation [3.5493798890908104]
本稿では,既存のRoI抽出器の限界を克服する必要性を動機とする。
提案するレイヤ(Generic RoI Extractor - GRoIE)には,非ローカルなビルディングブロックとアテンション機構が導入され,パフォーマンスが向上する。
GRoIEは、オブジェクト検出とインスタンスセグメンテーションの両方のために、すべての2段階アーキテクチャとシームレスに統合できる。
論文 参考訳(メタデータ) (2020-04-28T17:07:32Z) - Feature Pyramid Grids [140.11116687047058]
本稿では,深い多経路特徴ピラミッドであるFeature Pyramid Grids (FPG)を提案する。
FPGは、同様の計算コストで性能を大幅に向上させることで、シングルパスの特徴ピラミッドネットワークを改善することができる。
論文 参考訳(メタデータ) (2020-04-07T17:59:52Z) - Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。
レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文 参考訳(メタデータ) (2020-02-25T14:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。