論文の概要: A novel Region of Interest Extraction Layer for Instance Segmentation
- arxiv url: http://arxiv.org/abs/2004.13665v2
- Date: Thu, 1 Oct 2020 14:12:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-08 23:27:06.277561
- Title: A novel Region of Interest Extraction Layer for Instance Segmentation
- Title(参考訳): インスタンスセグメンテーションのための関心抽出層の新しい領域
- Authors: Leonardo Rossi, Akbar Karimi, Andrea Prati
- Abstract要約: 本稿では,既存のRoI抽出器の限界を克服する必要性を動機とする。
提案するレイヤ(Generic RoI Extractor - GRoIE)には,非ローカルなビルディングブロックとアテンション機構が導入され,パフォーマンスが向上する。
GRoIEは、オブジェクト検出とインスタンスセグメンテーションの両方のために、すべての2段階アーキテクチャとシームレスに統合できる。
- 参考スコア(独自算出の注目度): 3.5493798890908104
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Given the wide diffusion of deep neural network architectures for computer
vision tasks, several new applications are nowadays more and more feasible.
Among them, a particular attention has been recently given to instance
segmentation, by exploiting the results achievable by two-stage networks (such
as Mask R-CNN or Faster R-CNN), derived from R-CNN. In these complex
architectures, a crucial role is played by the Region of Interest (RoI)
extraction layer, devoted to extracting a coherent subset of features from a
single Feature Pyramid Network (FPN) layer attached on top of a backbone.
This paper is motivated by the need to overcome the limitations of existing
RoI extractors which select only one (the best) layer from FPN. Our intuition
is that all the layers of FPN retain useful information. Therefore, the
proposed layer (called Generic RoI Extractor - GRoIE) introduces non-local
building blocks and attention mechanisms to boost the performance.
A comprehensive ablation study at component level is conducted to find the
best set of algorithms and parameters for the GRoIE layer. Moreover, GRoIE can
be integrated seamlessly with every two-stage architecture for both object
detection and instance segmentation tasks. Therefore, the improvements brought
about by the use of GRoIE in different state-of-the-art architectures are also
evaluated. The proposed layer leads up to gain a 1.1% AP improvement on
bounding box detection and 1.7% AP improvement on instance segmentation.
The code is publicly available on GitHub repository at
https://github.com/IMPLabUniPr/mmdetection/tree/groie_dev
- Abstract(参考訳): コンピュータビジョンタスクのためのディープニューラルネットワークアーキテクチャの広範な普及を考えると、今日ではいくつかの新しいアプリケーションがより実現可能になっている。
その中でも最近、R-CNNから派生した2段階ネットワーク(Mask R-CNNやFaster R-CNNなど)によって達成可能な結果を活用することで、インスタンスセグメンテーションに特に注目されている。
これらの複雑なアーキテクチャでは、重要な役割はRerea of Interest(RoI)抽出層によって演じられ、バックボーン上にアタッチされた単一のFeature Pyramid Network(FPN)層から特徴の一貫性のあるサブセットを抽出する。
本論文は,FPNから1層(ベスト層)のみを選択する既存のRoI抽出器の限界を克服する必要性を動機としている。
我々の直感では、FPNのすべての層が有用な情報を保持する。
そこで提案するレイヤ(Generic RoI Extractor - GRoIE)では,非ローカルなビルディングブロックとアテンション機構を導入して性能を向上する。
GRoIE層におけるアルゴリズムとパラメータの最適セットを見つけるために, 成分レベルでの包括的アブレーション研究を行った。
さらに、オブジェクト検出とインスタンスセグメンテーションタスクの両方のために、groieは2段階アーキテクチャごとにシームレスに統合できる。
そのため、異なる最先端アーキテクチャにおけるgroieの使用による改善も評価されている。
提案されたレイヤは、バウンディングボックス検出における1.1%のAP改善と、インスタンスセグメンテーションにおける1.7%のAP改善を実現している。
コードはGitHubリポジトリでhttps://github.com/IMPLabUniPr/mmdetection/tree/groie_devで公開されている。
関連論文リスト
- Dynamic Perceiver for Efficient Visual Recognition [87.08210214417309]
特徴抽出手順と早期分類タスクを分離する動的知覚器(Dyn-Perceiver)を提案する。
特徴ブランチは画像の特徴を抽出し、分類ブランチは分類タスクに割り当てられた遅延コードを処理する。
早期出口は分類枝に限られており、低レベルの特徴において線形分離性は不要である。
論文 参考訳(メタデータ) (2023-06-20T03:00:22Z) - A^2-FPN: Attention Aggregation based Feature Pyramid Network for
Instance Segmentation [68.10621089649486]
アテンションアグリゲーションに基づく機能ピラミッドネットワーク(A2-FPN)を提案し、マルチスケール機能学習を改善します。
A2-FPNは、Cascade Mask R-CNNやHybrid Task Cascadeといった強力なベースラインに統合された場合、2.0%と1.4%のマスクAPを改善する。
論文 参考訳(メタデータ) (2021-05-07T11:51:08Z) - Auto-Panoptic: Cooperative Multi-Component Architecture Search for
Panoptic Segmentation [144.50154657257605]
本稿では、バックボーン、セグメンテーションブランチ、フィーチャーフュージョンモジュールを含むすべての主要コンポーネントを同時に検索する効率的なフレームワークを提案する。
検索したアーキテクチャ、すなわちAuto-Panopticは、挑戦的なCOCOとADE20Kベンチマークに関する新しい最先端技術を実現します。
論文 参考訳(メタデータ) (2020-10-30T08:34:35Z) - DC-NAS: Divide-and-Conquer Neural Architecture Search [108.57785531758076]
本稿では,ディープ・ニューラル・アーキテクチャーを効果的かつ効率的に探索するためのディバイド・アンド・コンカ(DC)手法を提案する。
ImageNetデータセットで75.1%の精度を達成しており、これは同じ検索空間を使った最先端の手法よりも高い。
論文 参考訳(メタデータ) (2020-05-29T09:02:16Z) - When Residual Learning Meets Dense Aggregation: Rethinking the
Aggregation of Deep Neural Networks [57.0502745301132]
我々は,グローバルな残差学習と局所的なマイクロセンスアグリゲーションを備えた新しいアーキテクチャであるMicro-Dense Netsを提案する。
我々のマイクロセンスブロックはニューラルアーキテクチャ検索に基づくモデルと統合して性能を向上させることができる。
論文 参考訳(メタデータ) (2020-04-19T08:34:52Z) - Dense Residual Network: Enhancing Global Dense Feature Flow for
Character Recognition [75.4027660840568]
本稿では,すべての畳み込み層から階層的特徴をフルに活用することにより,局所的・大域的特徴フローを改善する方法について検討する。
技術的には、テキスト認識のための効率的で効果的なCNNフレームワークであるFDRN(Fast Dense Residual Network)を提案する。
論文 参考訳(メタデータ) (2020-01-23T06:55:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。