論文の概要: SipMask: Spatial Information Preservation for Fast Image and Video
Instance Segmentation
- arxiv url: http://arxiv.org/abs/2007.14772v1
- Date: Wed, 29 Jul 2020 12:21:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-05 20:27:44.792375
- Title: SipMask: Spatial Information Preservation for Fast Image and Video
Instance Segmentation
- Title(参考訳): SipMask: 高速画像とビデオインスタンスセグメンテーションのための空間情報保存
- Authors: Jiale Cao, Rao Muhammad Anwer, Hisham Cholakkal, Fahad Shahbaz Khan,
Yanwei Pang, Ling Shao
- Abstract要約: SipMaskと呼ばれる高速な単一ステージインスタンス分割法を提案する。
検出されたバウンディングボックスの異なるサブリージョンにインスタンスのマスク予測を分離することで、インスタンス固有の空間情報を保存する。
リアルタイム機能の面では、SipMaskはYOLACTを、同様の設定で3.0%(マスクAP)という絶対的なゲインで上回ります。
- 参考スコア(独自算出の注目度): 149.242230059447
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single-stage instance segmentation approaches have recently gained popularity
due to their speed and simplicity, but are still lagging behind in accuracy,
compared to two-stage methods. We propose a fast single-stage instance
segmentation method, called SipMask, that preserves instance-specific spatial
information by separating mask prediction of an instance to different
sub-regions of a detected bounding-box. Our main contribution is a novel
light-weight spatial preservation (SP) module that generates a separate set of
spatial coefficients for each sub-region within a bounding-box, leading to
improved mask predictions. It also enables accurate delineation of spatially
adjacent instances. Further, we introduce a mask alignment weighting loss and a
feature alignment scheme to better correlate mask prediction with object
detection. On COCO test-dev, our SipMask outperforms the existing single-stage
methods. Compared to the state-of-the-art single-stage TensorMask, SipMask
obtains an absolute gain of 1.0% (mask AP), while providing a four-fold
speedup. In terms of real-time capabilities, SipMask outperforms YOLACT with an
absolute gain of 3.0% (mask AP) under similar settings, while operating at
comparable speed on a Titan Xp. We also evaluate our SipMask for real-time
video instance segmentation, achieving promising results on YouTube-VIS
dataset. The source code is available at
https://github.com/JialeCao001/SipMask.
- Abstract(参考訳): シングルステージインスタンスのセグメンテーションアプローチは最近、そのスピードとシンプルさのために人気を集めているが、2段階の方法と比べても精度は遅れている。
本稿では,インスタンスのマスク予測を検出されたバウンディングボックスの異なるサブリージョンに分離することにより,インスタンス固有の空間情報を保持する高速単段インスタンスセグメンテーション手法であるsipmaskを提案する。
我々の主な貢献は,境界ボックス内の各部分領域ごとに空間係数を分離して生成し,マスク予測を改善する新しい軽量空間保存モジュールである。
また、空間的に隣接したインスタンスの正確なデライン化も可能である。
さらに,マスクアライメント重み付け損失と特徴アライメントスキームを導入し,マスク予測と物体検出との相関性を高める。
COCO test-devでは、SipMaskは既存のシングルステージメソッドよりも優れています。
最先端のシングルステージTensorMaskと比較して、SipMaskは4倍のスピードアップを提供しながら1.0%(マスクAP)の絶対ゲインを得る。
リアルタイム機能に関しては、SipMaskはTitan Xpと同等の速度で動作しながら、同様の設定で、YOLACTを3.0%(マスクAP)という絶対的なパフォーマンスで上回ります。
また、リアルタイムビデオインスタンスセグメンテーションのためのSipMaskの評価を行い、YouTube-VISデータセット上で有望な結果を得た。
ソースコードはhttps://github.com/JialeCao001/SipMaskで入手できる。
関連論文リスト
- Mask Propagation for Efficient Video Semantic Segmentation [63.09523058489429]
ビデオセマンティックベースライン劣化(VSS)は、ビデオシーケンス内の各ピクセルにセマンティックラベルを割り当てることを含む。
SSSSと呼ばれるVSSのための効率的なマスク伝搬フレームワークを提案する。
当社のフレームワークは,フレーム単位のMask2Formerと比較して最大4倍のFLOPを削減し,Cityscapes検証セット上では最大2% mIoUしか使用できない。
論文 参考訳(メタデータ) (2023-10-29T09:55:28Z) - Real-time Instance Segmentation with Discriminative Orientation Maps [0.16311150636417257]
本論文では,OrienMaskと呼ばれるリアルタイムインスタンス分割フレームワークを提案する。
いくつかの識別方向マップを予測するためにマスクヘッドが追加される。
同じアンカーサイズにマッチするすべてのインスタンスは、共通の向きマップを共有する。
論文 参考訳(メタデータ) (2021-06-23T07:27:35Z) - Mask Encoding for Single Shot Instance Segmentation [97.99956029224622]
マスクエンコーディングに基づくインスタンスセグメンテーション(MEInst)と呼ばれる単純なシングルショットインスタンスセグメンテーションフレームワークを提案する。
二次元マスクを直接予測する代わりに、MEInstはそれをコンパクトで固定的な表現ベクトルに蒸留する。
よりシンプルでフレキシブルな一段階のインスタンスセグメンテーション手法は、競合性能も達成できることを示す。
論文 参考訳(メタデータ) (2020-03-26T02:51:17Z) - SOLOv2: Dynamic and Fast Instance Segmentation [102.15325936477362]
パフォーマンスの高いシンプルで直接的で高速なインスタンスセグメンテーションフレームワークを構築しています。
オブジェクトセグメンタのマスクヘッドを動的に学習することで、さらに一歩前進する。
簡単な直接インスタンス分割システムを示し,高速化と精度の両面において,いくつかの最先端手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-03-23T09:44:21Z) - PointINS: Point-based Instance Segmentation [117.38579097923052]
POI(Point-of-Interest)機能によるインスタンスセグメンテーションにおけるマスク表現は、各インスタンスの高次元マスク機能を学ぶには、計算負荷が重いため、難しい。
本稿では、このマスク表現学習タスクを2つの抽出可能なモジュールに分解するインスタンス認識畳み込みを提案する。
インスタンス認識の畳み込みとともに、単純で実用的なインスタンスセグメンテーションアプローチであるPointINSを提案する。
論文 参考訳(メタデータ) (2020-03-13T08:24:58Z) - BlendMask: Top-Down Meets Bottom-Up for Instance Segmentation [103.74690082121079]
本研究では,インスタンスレベルの情報とセマンティックな情報と,低レベルの微細な粒度を効果的に組み合わせることで,マスク予測の改善を実現する。
私たちの主な貢献は、トップダウンとボトムアップの両方のインスタンスセグメンテーションアプローチからインスピレーションを得たブレンダーモジュールです。
BlendMaskは、非常に少ないチャネルで、ピクセルあたりの高密度な位置感受性インスタンス機能を効果的に予測し、単一の畳み込み層で各インスタンスの注意マップを学習することができる。
論文 参考訳(メタデータ) (2020-01-02T03:30:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。