論文の概要: BlendMask: Top-Down Meets Bottom-Up for Instance Segmentation
- arxiv url: http://arxiv.org/abs/2001.00309v3
- Date: Sun, 26 Apr 2020 10:27:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-16 04:11:39.550920
- Title: BlendMask: Top-Down Meets Bottom-Up for Instance Segmentation
- Title(参考訳): BlendMask: トップダウンがインスタンスセグメンテーションのボトムアップに
- Authors: Hao Chen, Kunyang Sun, Zhi Tian, Chunhua Shen, Yongming Huang,
Youliang Yan
- Abstract要約: 本研究では,インスタンスレベルの情報とセマンティックな情報と,低レベルの微細な粒度を効果的に組み合わせることで,マスク予測の改善を実現する。
私たちの主な貢献は、トップダウンとボトムアップの両方のインスタンスセグメンテーションアプローチからインスピレーションを得たブレンダーモジュールです。
BlendMaskは、非常に少ないチャネルで、ピクセルあたりの高密度な位置感受性インスタンス機能を効果的に予測し、単一の畳み込み層で各インスタンスの注意マップを学習することができる。
- 参考スコア(独自算出の注目度): 103.74690082121079
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Instance segmentation is one of the fundamental vision tasks. Recently, fully
convolutional instance segmentation methods have drawn much attention as they
are often simpler and more efficient than two-stage approaches like Mask R-CNN.
To date, almost all such approaches fall behind the two-stage Mask R-CNN method
in mask precision when models have similar computation complexity, leaving
great room for improvement.
In this work, we achieve improved mask prediction by effectively combining
instance-level information with semantic information with lower-level
fine-granularity. Our main contribution is a blender module which draws
inspiration from both top-down and bottom-up instance segmentation approaches.
The proposed BlendMask can effectively predict dense per-pixel
position-sensitive instance features with very few channels, and learn
attention maps for each instance with merely one convolution layer, thus being
fast in inference. BlendMask can be easily incorporated with the
state-of-the-art one-stage detection frameworks and outperforms Mask R-CNN
under the same training schedule while being 20% faster. A light-weight version
of BlendMask achieves $ 34.2% $ mAP at 25 FPS evaluated on a single 1080Ti GPU
card. Because of its simplicity and efficacy, we hope that our BlendMask could
serve as a simple yet strong baseline for a wide range of instance-wise
prediction tasks.
Code is available at https://git.io/AdelaiDet
- Abstract(参考訳): インスタンスセグメンテーションは基本的なビジョンタスクの1つです。
近年,Msk R-CNNのような2段階アプローチよりもシンプルで効率的であることが多いため,完全畳み込み型インスタンス分割法が注目されている。
現在までに、このようなアプローチはモデルが類似の計算複雑性を持つ場合、マスク精度で2段階のMask R-CNN法に置き換わっている。
本研究では,インスタンスレベル情報と意味情報とを効果的に組み合わせ,より低い粒度でマスク予測を実現する。
私たちの主な貢献は、トップダウンとボトムアップの両方のインスタンスセグメンテーションアプローチからインスピレーションを得たブレンダーモジュールです。
提案するblendmaskは、非常に少ないチャネルでピクセル単位の位置センシティブなインスタンス特徴を効果的に予測し、1つの畳み込み層で各インスタンスのアテンションマップを学習することができ、推論が高速になる。
blendmaskは最先端のワンステージ検出フレームワークに容易に組み込むことができ、同じトレーニングスケジュールでr-cnnを20%高速にマスクできる。
blendmaskの軽量バージョンは、1つの1080ti gpuカードで25fpsで34.2%の$ mapを達成した。
その単純さと有効性から、私たちのBlendMaskが、幅広いインスタンスワイドな予測タスクの単純かつ強力なベースラインとして機能することを願っています。
コードはhttps://git.io/AdelaiDetで入手できる。
関連論文リスト
- DynaMask: Dynamic Mask Selection for Instance Segmentation [21.50329070835023]
我々は,各インスタンスに最適なマスク解像度を選択するために,計算コストを無視できるマスクスイッチモジュール(MSM)を開発した。
提案手法,すなわちDynaMaskは,高い計算オーバーヘッドで,他の最先端技術よりも一貫した,顕著なパフォーマンス向上を実現する。
論文 参考訳(メタデータ) (2023-03-14T13:01:25Z) - Mask is All You Need: Rethinking Mask R-CNN for Dense and
Arbitrary-Shaped Scene Text Detection [11.390163890611246]
Mask R-CNNは、任意の形のシーンテキストの検出とスポッティングのための強力なベースラインとして広く採用されている。
1つの提案には複数のインスタンスが存在する可能性があるため、マスクヘッドが異なるインスタンスを区別し、パフォーマンスを劣化させるのが難しくなる。
本稿では,各画素をテキストや非テキストに分類するのではなく,マスクヘッドがインスタンス全体の形状を予測することを学習する事例認識型マスク学習を提案する。
論文 参考訳(メタデータ) (2021-09-08T04:32:29Z) - BoxInst: High-Performance Instance Segmentation with Box Annotations [102.10713189544947]
本稿では,トレーニング用バウンディングボックスアノテーションのみを用いて,マスクレベルのインスタンスセグメンテーションを実現する高性能な手法を提案する。
私たちの中核となる考え方は、セグメンテーションネットワーク自体を変更することなく、インスタンスセグメンテーションにおける学習マスクの喪失を活用することです。
論文 参考訳(メタデータ) (2020-12-03T22:27:55Z) - DCT-Mask: Discrete Cosine Transform Mask Representation for Instance
Segmentation [50.70679435176346]
本稿では、離散コサイン変換(DCT)を用いて、高分解能二元格子マスクをコンパクトなベクトルに符号化することで、新しいマスク表現を提案する。
DCT-Maskと呼ばれるこの手法は、ほとんどのピクセルベースのインスタンスセグメンテーション手法に簡単に統合できる。
論文 参考訳(メタデータ) (2020-11-19T15:00:21Z) - SipMask: Spatial Information Preservation for Fast Image and Video
Instance Segmentation [149.242230059447]
SipMaskと呼ばれる高速な単一ステージインスタンス分割法を提案する。
検出されたバウンディングボックスの異なるサブリージョンにインスタンスのマスク予測を分離することで、インスタンス固有の空間情報を保存する。
リアルタイム機能の面では、SipMaskはYOLACTを、同様の設定で3.0%(マスクAP)という絶対的なゲインで上回ります。
論文 参考訳(メタデータ) (2020-07-29T12:21:00Z) - Mask Encoding for Single Shot Instance Segmentation [97.99956029224622]
マスクエンコーディングに基づくインスタンスセグメンテーション(MEInst)と呼ばれる単純なシングルショットインスタンスセグメンテーションフレームワークを提案する。
二次元マスクを直接予測する代わりに、MEInstはそれをコンパクトで固定的な表現ベクトルに蒸留する。
よりシンプルでフレキシブルな一段階のインスタンスセグメンテーション手法は、競合性能も達成できることを示す。
論文 参考訳(メタデータ) (2020-03-26T02:51:17Z) - PointINS: Point-based Instance Segmentation [117.38579097923052]
POI(Point-of-Interest)機能によるインスタンスセグメンテーションにおけるマスク表現は、各インスタンスの高次元マスク機能を学ぶには、計算負荷が重いため、難しい。
本稿では、このマスク表現学習タスクを2つの抽出可能なモジュールに分解するインスタンス認識畳み込みを提案する。
インスタンス認識の畳み込みとともに、単純で実用的なインスタンスセグメンテーションアプローチであるPointINSを提案する。
論文 参考訳(メタデータ) (2020-03-13T08:24:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。