論文の概要: Mask Transfiner for High-Quality Instance Segmentation
- arxiv url: http://arxiv.org/abs/2111.13673v1
- Date: Fri, 26 Nov 2021 18:58:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-29 17:23:43.244497
- Title: Mask Transfiner for High-Quality Instance Segmentation
- Title(参考訳): 高品質インスタンスセグメンテーションのためのマスクトランスファイナ
- Authors: Lei Ke, Martin Danelljan, Xia Li, Yu-Wing Tai, Chi-Keung Tang, Fisher
Yu
- Abstract要約: 高品質で効率的なインスタンスセグメンテーションのためのMask Transfinerを提案する。
当社のアプローチでは, エラーが発生しやすい木ノードを検出し, エラーを並列に自己修正する。
私たちのコードとトレーニングされたモデルは、http://vis.xyz/pub/transfiner.comで公開されます。
- 参考スコア(独自算出の注目度): 95.74244714914052
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Two-stage and query-based instance segmentation methods have achieved
remarkable results. However, their segmented masks are still very coarse. In
this paper, we present Mask Transfiner for high-quality and efficient instance
segmentation. Instead of operating on regular dense tensors, our Mask
Transfiner decomposes and represents the image regions as a quadtree. Our
transformer-based approach only processes detected error-prone tree nodes and
self-corrects their errors in parallel. While these sparse pixels only
constitute a small proportion of the total number, they are critical to the
final mask quality. This allows Mask Transfiner to predict highly accurate
instance masks, at a low computational cost. Extensive experiments demonstrate
that Mask Transfiner outperforms current instance segmentation methods on three
popular benchmarks, significantly improving both two-stage and query-based
frameworks by a large margin of +3.0 mask AP on COCO and BDD100K, and +6.6
boundary AP on Cityscapes. Our code and trained models will be available at
http://vis.xyz/pub/transfiner.
- Abstract(参考訳): 2段階およびクエリベースのインスタンスセグメンテーション手法は素晴らしい結果を得た。
しかし、その部分的なマスクはいまだに粗い。
本稿では,高品質かつ効率的なインスタンスセグメンテーションのためのマスクトランスファイナを提案する。
通常の密度テンソルで操作する代わりに、マスクトランスファイナは画像領域をクワッドツリーとして分解し、表現する。
トランスフォーマチックなアプローチでは,エラーが発生しやすい木ノードのみを検出し,その誤りを並列に修正する。
これらのスパース画素は総数のごく一部しか構成しないが、最終的なマスクの品質には重要である。
これにより、Mask Transfinerは計算コストの低い高精度なインスタンスマスクを予測できる。
大規模な実験では、Mask Transfinerが3つの人気のあるベンチマークで現在のインスタンスセグメンテーションメソッドより優れており、COCOとBDD100Kの+3.0マスクAPとCityscapesの+6.6境界APの広いマージンで、2段階とクエリベースのフレームワークの両方が大幅に改善されている。
私たちのコードとトレーニングされたモデルはhttp://vis.xyz/pub/transfiner.com/で利用できます。
関連論文リスト
- DynaMask: Dynamic Mask Selection for Instance Segmentation [21.50329070835023]
我々は,各インスタンスに最適なマスク解像度を選択するために,計算コストを無視できるマスクスイッチモジュール(MSM)を開発した。
提案手法,すなわちDynaMaskは,高い計算オーバーヘッドで,他の最先端技術よりも一貫した,顕著なパフォーマンス向上を実現する。
論文 参考訳(メタデータ) (2023-03-14T13:01:25Z) - RefineMask: Towards High-Quality Instance Segmentation with Fine-Grained
Features [53.71163467683838]
RefineMaskは、オブジェクトやシーンの高品質なインスタンスセグメンテーションのための新しい方法です。
インスタンス毎のセグメンテーションプロセス中に粒度の細かい機能を多段階的に組み込む。
以前のほとんどのメソッドで過剰にスムースされたオブジェクトの曲がった部分のようなハードケースをセグメンテーションすることに成功します。
論文 参考訳(メタデータ) (2021-04-17T15:09:20Z) - BoxInst: High-Performance Instance Segmentation with Box Annotations [102.10713189544947]
本稿では,トレーニング用バウンディングボックスアノテーションのみを用いて,マスクレベルのインスタンスセグメンテーションを実現する高性能な手法を提案する。
私たちの中核となる考え方は、セグメンテーションネットワーク自体を変更することなく、インスタンスセグメンテーションにおける学習マスクの喪失を活用することです。
論文 参考訳(メタデータ) (2020-12-03T22:27:55Z) - DCT-Mask: Discrete Cosine Transform Mask Representation for Instance
Segmentation [50.70679435176346]
本稿では、離散コサイン変換(DCT)を用いて、高分解能二元格子マスクをコンパクトなベクトルに符号化することで、新しいマスク表現を提案する。
DCT-Maskと呼ばれるこの手法は、ほとんどのピクセルベースのインスタンスセグメンテーション手法に簡単に統合できる。
論文 参考訳(メタデータ) (2020-11-19T15:00:21Z) - SOLOv2: Dynamic and Fast Instance Segmentation [102.15325936477362]
パフォーマンスの高いシンプルで直接的で高速なインスタンスセグメンテーションフレームワークを構築しています。
オブジェクトセグメンタのマスクヘッドを動的に学習することで、さらに一歩前進する。
簡単な直接インスタンス分割システムを示し,高速化と精度の両面において,いくつかの最先端手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-03-23T09:44:21Z) - PointINS: Point-based Instance Segmentation [117.38579097923052]
POI(Point-of-Interest)機能によるインスタンスセグメンテーションにおけるマスク表現は、各インスタンスの高次元マスク機能を学ぶには、計算負荷が重いため、難しい。
本稿では、このマスク表現学習タスクを2つの抽出可能なモジュールに分解するインスタンス認識畳み込みを提案する。
インスタンス認識の畳み込みとともに、単純で実用的なインスタンスセグメンテーションアプローチであるPointINSを提案する。
論文 参考訳(メタデータ) (2020-03-13T08:24:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。