論文の概要: Conditional Convolutions for Instance Segmentation
- arxiv url: http://arxiv.org/abs/2003.05664v4
- Date: Sun, 26 Jul 2020 02:18:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-24 15:08:51.170309
- Title: Conditional Convolutions for Instance Segmentation
- Title(参考訳): インスタンスセグメンテーションの条件付き畳み込み
- Authors: Zhi Tian and Chunhua Shen and Hao Chen
- Abstract要約: 我々はCondInstと呼ばれるシンプルだが効果的なインスタンスセグメンテーションフレームワークを提案する。
インスタンスに条件付き動的インスタンス認識ネットワークを採用しています。
本稿では,精度と推論速度の両面で性能の向上を実現するための,より単純なインスタンス分割法を示す。
- 参考スコア(独自算出の注目度): 109.2706837177222
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We propose a simple yet effective instance segmentation framework, termed
CondInst (conditional convolutions for instance segmentation). Top-performing
instance segmentation methods such as Mask R-CNN rely on ROI operations
(typically ROIPool or ROIAlign) to obtain the final instance masks. In
contrast, we propose to solve instance segmentation from a new perspective.
Instead of using instance-wise ROIs as inputs to a network of fixed weights, we
employ dynamic instance-aware networks, conditioned on instances. CondInst
enjoys two advantages: 1) Instance segmentation is solved by a fully
convolutional network, eliminating the need for ROI cropping and feature
alignment. 2) Due to the much improved capacity of dynamically-generated
conditional convolutions, the mask head can be very compact (e.g., 3 conv.
layers, each having only 8 channels), leading to significantly faster
inference. We demonstrate a simpler instance segmentation method that can
achieve improved performance in both accuracy and inference speed. On the COCO
dataset, we outperform a few recent methods including well-tuned Mask RCNN
baselines, without longer training schedules needed.
Code is available: https://github.com/aim-uofa/adet
- Abstract(参考訳): 本稿では,単純かつ効果的なインスタンス分割フレームワークであるcondinst (conditional convolutions for instance segmentation)を提案する。
Mask R-CNNのようなトップパフォーマンスのインスタンスセグメンテーションメソッドは、最終的なインスタンスマスクを得るためにROI操作(一般的にROIPoolまたはROIAlign)に依存している。
対照的に、新しい視点からインスタンスセグメンテーションを解くことを提案する。
固定重みのネットワークへの入力としてインスタンスワイズROIを使用する代わりに、インスタンスに条件付けされた動的インスタンス認識ネットワークを使用します。
CondInstには2つの利点がある。
1) インスタンスのセグメンテーションは完全な畳み込みネットワークによって解決され、ROI収穫や機能アライメントの必要性がなくなる。
2) 動的に生成された条件付き畳み込みの容量が大幅に向上するため, マスクヘッドは非常にコンパクト(例えば, 3層, それぞれが8チャネルしか持たない)となり, 推定が大幅に高速化される。
本稿では,精度と推論速度の両面において,より単純なインスタンス分割法を提案する。
COCOデータセットでは、トレーニングスケジュールを長くすることなく、十分に調整されたMask RCNNベースラインを含む、最近のいくつかの手法より優れています。
コード提供: https://github.com/aim-uofa/adet
関連論文リスト
- Implicit Feature Refinement for Instance Segmentation [20.34804959340334]
高品質なインスタンスセグメンテーションのための新しい暗黙的特徴改善モジュールを提案する。
我々のIRFは、最先端の画像/ビデオインスタンスセグメンテーションフレームワークの性能向上を実現しています。
論文 参考訳(メタデータ) (2021-12-09T05:36:04Z) - SOLO: A Simple Framework for Instance Segmentation [84.00519148562606]
インスタンスカテゴリ"は、インスタンスの場所に応じて、インスタンス内の各ピクセルにカテゴリを割り当てる。
SOLO"は、強力なパフォーマンスを備えたインスタンスセグメンテーションのための、シンプルで、直接的で、高速なフレームワークです。
提案手法は, 高速化と精度の両面から, 実例分割の最先端結果を実現する。
論文 参考訳(メタデータ) (2021-06-30T09:56:54Z) - Instance and Panoptic Segmentation Using Conditional Convolutions [96.7275593916409]
本稿では,CondInst と呼ばれる,シンプルで効果的な光学的セグメンテーションフレームワークを提案する。
我々は、CondInstがインスタンス分割タスクと単眼セグメンテーションタスクの両方において精度と推論速度を向上できることを示す。
論文 参考訳(メタデータ) (2021-02-05T06:57:02Z) - Unifying Instance and Panoptic Segmentation with Dynamic Rank-1
Convolutions [109.2706837177222]
DR1Maskは、インスタンスとセマンティックセグメンテーションの両方で共有機能マップを利用する最初のパノプティクスセグメンテーションフレームワークである。
副産物として、DR1Maskは従来の最先端のインスタンスセグメンテーションネットワークであるBlendMaskよりも10%高速で1ポイント精度が高い。
論文 参考訳(メタデータ) (2020-11-19T12:42:10Z) - PointINS: Point-based Instance Segmentation [117.38579097923052]
POI(Point-of-Interest)機能によるインスタンスセグメンテーションにおけるマスク表現は、各インスタンスの高次元マスク機能を学ぶには、計算負荷が重いため、難しい。
本稿では、このマスク表現学習タスクを2つの抽出可能なモジュールに分解するインスタンス認識畳み込みを提案する。
インスタンス認識の畳み込みとともに、単純で実用的なインスタンスセグメンテーションアプローチであるPointINSを提案する。
論文 参考訳(メタデータ) (2020-03-13T08:24:58Z) - BlendMask: Top-Down Meets Bottom-Up for Instance Segmentation [103.74690082121079]
本研究では,インスタンスレベルの情報とセマンティックな情報と,低レベルの微細な粒度を効果的に組み合わせることで,マスク予測の改善を実現する。
私たちの主な貢献は、トップダウンとボトムアップの両方のインスタンスセグメンテーションアプローチからインスピレーションを得たブレンダーモジュールです。
BlendMaskは、非常に少ないチャネルで、ピクセルあたりの高密度な位置感受性インスタンス機能を効果的に予測し、単一の畳み込み層で各インスタンスの注意マップを学習することができる。
論文 参考訳(メタデータ) (2020-01-02T03:30:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。