論文の概要: Auto-Panoptic: Cooperative Multi-Component Architecture Search for
Panoptic Segmentation
- arxiv url: http://arxiv.org/abs/2010.16119v1
- Date: Fri, 30 Oct 2020 08:34:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-01 16:37:32.941828
- Title: Auto-Panoptic: Cooperative Multi-Component Architecture Search for
Panoptic Segmentation
- Title(参考訳): オートパノプティクス:パノプティカルセグメンテーションのための協調多成分アーキテクチャ探索
- Authors: Yangxin Wu, Gengwei Zhang, Hang Xu, Xiaodan Liang, Liang Lin
- Abstract要約: 本稿では、バックボーン、セグメンテーションブランチ、フィーチャーフュージョンモジュールを含むすべての主要コンポーネントを同時に検索する効率的なフレームワークを提案する。
検索したアーキテクチャ、すなわちAuto-Panopticは、挑戦的なCOCOとADE20Kベンチマークに関する新しい最先端技術を実現します。
- 参考スコア(独自算出の注目度): 144.50154657257605
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Panoptic segmentation is posed as a new popular test-bed for the
state-of-the-art holistic scene understanding methods with the requirement of
simultaneously segmenting both foreground things and background stuff. The
state-of-the-art panoptic segmentation network exhibits high structural
complexity in different network components, i.e. backbone, proposal-based
foreground branch, segmentation-based background branch, and feature fusion
module across branches, which heavily relies on expert knowledge and tedious
trials. In this work, we propose an efficient, cooperative and highly automated
framework to simultaneously search for all main components including backbone,
segmentation branches, and feature fusion module in a unified panoptic
segmentation pipeline based on the prevailing one-shot Network Architecture
Search (NAS) paradigm. Notably, we extend the common single-task NAS into the
multi-component scenario by taking the advantage of the newly proposed
intra-modular search space and problem-oriented inter-modular search space,
which helps us to obtain an optimal network architecture that not only performs
well in both instance segmentation and semantic segmentation tasks but also be
aware of the reciprocal relations between foreground things and background
stuff classes. To relieve the vast computation burden incurred by applying NAS
to complicated network architectures, we present a novel path-priority greedy
search policy to find a robust, transferrable architecture with significantly
reduced searching overhead. Our searched architecture, namely Auto-Panoptic,
achieves the new state-of-the-art on the challenging COCO and ADE20K
benchmarks. Moreover, extensive experiments are conducted to demonstrate the
effectiveness of path-priority policy and transferability of Auto-Panoptic
across different datasets. Codes and models are available at:
https://github.com/Jacobew/AutoPanoptic.
- Abstract(参考訳): パノプティクスのセグメンテーションは、最先端の総合的なシーン理解手法のための新しいテストベッドとして、前景と背景の両方を同時にセグメンテーションする必要がある。
最先端のパン光学セグメンテーションネットワークは、バックボーン、プロポーザルベースのフォアグラウンドブランチ、セグメンテーションベースのバックグラウンドブランチ、および、専門知識と退屈な試行に大きく依存する機能融合モジュールなど、異なるネットワークコンポーネントにおいて高い構造的複雑さを示す。
本研究では,バックボーン,セグメンテーションブランチ,機能融合モジュールを含むすべての主要コンポーネントを,ワンショットネットワークアーキテクチャサーチ(NAS)パラダイムに基づいて一元的に探索する,効率的で協調的で高度に自動化されたフレームワークを提案する。
特に,新たに提案したモジュール内探索空間と問題指向のモジュール間探索空間を利用して,共通タスクNASをマルチコンポーネントシナリオに拡張することで,インスタンスセグメンテーションとセグメンテーションの両タスクでよく機能するだけでなく,前景物と背景物との相互関係も認識できる最適なネットワークアーキテクチャを実現する。
複雑なネットワークアーキテクチャにNASを適用することで発生する膨大な計算負担を軽減するため、探索オーバーヘッドを大幅に低減した堅牢で転送可能なアーキテクチャを見つけるための経路優先の検索ポリシーを提案する。
検索したアーキテクチャ、すなわちAuto-Panopticは、挑戦的なCOCOとADE20Kベンチマークに関する新しい最先端技術を実現します。
さらに、異なるデータセット間でのパス優先ポリシーの有効性とオートパノプティクスの転送可能性を示すために、広範囲な実験を行った。
コードとモデルは、https://github.com/Jacobew/AutoPanoptic.comで入手できる。
関連論文リスト
- NAS-based Recursive Stage Partial Network (RSPNet) for Light-Weight
Semantic Segmentation [16.019616787091202]
現在のNASベースのセマンティックセグメンテーション手法は、軽量設計よりも精度の向上に焦点を当てている。
軽量セマンティックセグメンテーションのためのNASベースのRSPNetモデルを設計するための2段階フレームワークを提案する。
提案したアーキテクチャは非常に効率的でシンプルで効果的であり、マクロ構造とマイクロ構造の両方の探索が5日間の計算で完了する。
論文 参考訳(メタデータ) (2022-10-03T03:25:29Z) - Pruning-as-Search: Efficient Neural Architecture Search via Channel
Pruning and Structural Reparameterization [50.50023451369742]
プルーニング・アズ・サーチ(Pruning-as-Search、PaS)は、必要なサブネットワークを自動的に効率的に検索するエンドツーエンドのプルーニング手法である。
提案したアーキテクチャは,ImageNet-1000分類タスクにおいて,1.0%$ Top-1精度で先行技術より優れていた。
論文 参考訳(メタデータ) (2022-06-02T17:58:54Z) - A Unified Transformer Framework for Group-based Segmentation:
Co-Segmentation, Co-Saliency Detection and Video Salient Object Detection [59.21990697929617]
人間は、ダイナミックな世界に住んでいるので、画像のグループやビデオのフレームから学ぶことによってオブジェクトをマイニングする傾向があります。
従来のアプローチでは、類似したタスクで異なるネットワークを個別に設計するが、互いに適用するのは困難である。
UFO(UnifiedObject Framework for Co-Object Framework)という,これらの問題に対処するための統一フレームワークを導入する。
論文 参考訳(メタデータ) (2022-03-09T13:35:19Z) - Boundary-Aware Segmentation Network for Mobile and Web Applications [60.815545591314915]
境界認識ネットワーク(basnet)は、精度の高い画像分割のための予測再定義アーキテクチャとハイブリッド損失と統合されている。
basnetは単一のgpu上で70fps以上動作し、多くの潜在的なアプリケーションが利用できる。
BASNetをベースに、BASNetが「COPY」と「PASTING」現実世界のオブジェクトのための拡張現実であるAR COPY & PASTEと、オブジェクト背景の自動削除のためのWebベースのツールであるOBJECT CUTの2つの(近い)商用アプリケーションをさらに開発しました。
論文 参考訳(メタデータ) (2021-01-12T19:20:26Z) - AutoPose: Searching Multi-Scale Branch Aggregation for Pose Estimation [96.29533512606078]
本稿では,新しいニューラルアーキテクチャサーチ(NAS)フレームワークであるAutoPoseを紹介する。
高精度で高解像度な2次元ポーズ推定に向けて、クロススケール接続の複数の並列ブランチを自動的に検出することができる。
論文 参考訳(メタデータ) (2020-08-16T22:27:43Z) - A novel Region of Interest Extraction Layer for Instance Segmentation [3.5493798890908104]
本稿では,既存のRoI抽出器の限界を克服する必要性を動機とする。
提案するレイヤ(Generic RoI Extractor - GRoIE)には,非ローカルなビルディングブロックとアテンション機構が導入され,パフォーマンスが向上する。
GRoIEは、オブジェクト検出とインスタンスセグメンテーションの両方のために、すべての2段階アーキテクチャとシームレスに統合できる。
論文 参考訳(メタデータ) (2020-04-28T17:07:32Z) - EfficientPS: Efficient Panoptic Segmentation [13.23676270963484]
セマンティックにリッチなマルチスケール機能を効率的にエンコードし、融合する効率的パノプティクス(Efficient Panoptic, EfficientPS)アーキテクチャを導入する。
セマンティックヘッドは、細部とコンテキストの特徴を整合的に集約し、インスタンスヘッドとしてMask R-CNNの新たな変種を組み込む。
また、一般的なKITTIベンチマークのためのパノビュータアノテーションを含むKITTIパノビュータセグメンテーションデータセットについても紹介する。
論文 参考訳(メタデータ) (2020-04-05T20:15:59Z) - DCNAS: Densely Connected Neural Architecture Search for Semantic Image
Segmentation [44.46852065566759]
Densely Connected NAS (DCNAS) フレームワークを提案し、視覚情報のマルチスケール表現に対して最適なネットワーク構造を直接検索する。
具体的には,学習可能な重みを使ってセルを相互に接続することにより,多数の主流ネットワーク設計をカバーするために,密結合された検索空間を導入する。
我々は、DCNASアルゴリズムから得られたアーキテクチャが、公開セマンティックイメージセグメンテーションベンチマーク上で最先端のパフォーマンスを達成することを実証した。
論文 参考訳(メタデータ) (2020-03-26T13:21:33Z) - AutoSTR: Efficient Backbone Search for Scene Text Recognition [80.7290173000068]
テキストインスタンスの多様性とシーンの複雑さのため、シーンテキスト認識(STR)は非常に難しい。
テキスト認識性能を向上させるために,データ依存のバックボーンを検索するための自動STR(AutoSTR)を提案する。
実験によると、データ依存のバックボーンを検索することで、AutoSTRは標準ベンチマークにおける最先端のアプローチより優れている。
論文 参考訳(メタデータ) (2020-03-14T06:51:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。