論文の概要: PolarMask++: Enhanced Polar Representation for Single-Shot Instance
Segmentation and Beyond
- arxiv url: http://arxiv.org/abs/2105.02184v1
- Date: Wed, 5 May 2021 16:55:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-06 12:45:35.089989
- Title: PolarMask++: Enhanced Polar Representation for Single-Shot Instance
Segmentation and Beyond
- Title(参考訳): PolarMask++:シングルショットインスタンスセグメンテーションのための強化されたPolar表現
- Authors: Enze Xie, Wenhai Wang, Mingyu Ding, Ruimao Zhang, Ping Luo
- Abstract要約: PolarMaskは、極座標内のオブジェクトの輪郭を予測するものとしてインスタンス分割問題を再構成する。
2つのモジュールは慎重に設計されている。
サンプル良質の中心の例への柔らかい極の中心および極性IoUの損失)。
PolarMaskは完全に畳み込み型であり、ほとんどのオフザシェルフ検出方法に簡単に組み込むことができる。
- 参考スコア(独自算出の注目度): 47.518550130850755
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reducing the complexity of the pipeline of instance segmentation is crucial
for real-world applications. This work addresses this issue by introducing an
anchor-box free and single-shot instance segmentation framework, termed
PolarMask, which reformulates the instance segmentation problem as predicting
the contours of objects in the polar coordinate, with several appealing
benefits. (1) The polar representation unifies instance segmentation (masks)
and object detection (bounding boxes) into a single framework, reducing the
design and computational complexity. (2) Two modules are carefully designed
(i.e. soft polar centerness and polar IoU loss) to sample high-quality center
examples and optimize polar contour regression, making the performance of
PolarMask does not depend on the bounding box prediction results and thus
becomes more efficient in training. (3) PolarMask is fully convolutional and
can be easily embedded into most off-the-shelf detection methods. To further
improve the accuracy of the framework, a Refined Feature Pyramid is introduced
to further improve the feature representation at different scales, termed
PolarMask++. Extensive experiments demonstrate the effectiveness of both
PolarMask and PolarMask++, which achieve competitive results on instance
segmentation in the challenging COCO dataset with single-model and single-scale
training and testing, as well as new state-of-the-art results on rotate text
detection and cell segmentation. We hope the proposed polar representation can
provide a new perspective for designing algorithms to solve single-shot
instance segmentation. The codes and models are available at:
github.com/xieenze/PolarMask.
- Abstract(参考訳): 実世界のアプリケーションでは、インスタンスセグメンテーションのパイプラインの複雑さを低減することが重要です。
この研究は、極座標内のオブジェクトの輪郭を予測し、いくつかの魅力的な利点と共にインスタンス分割問題を再構成する、polarmaskと呼ばれるアンカーボックスフリーかつシングルショットインスタンスセグメンテーションフレームワークを導入することで、この問題に対処する。
1) 極性表現は、インスタンスセグメンテーション(mask)とオブジェクト検出(バウンディングボックス)を単一のフレームワークに統合し、設計と計算の複雑さを低減します。
2)2つのモジュールを慎重に設計する(すなわち)。
ソフト極性中心性と極性IoU損失)を用いて高品質中心サンプルをサンプリングし、極性輪郭回帰を最適化することにより、PolarMaskの性能はバウンディングボックス予測結果に依存せず、訓練の効率が向上する。
(3)PolarMaskは完全に畳み込み型であり、ほとんどのオフザシェルフ検出方法に簡単に組み込むことができる。
フレームワークの精度をさらに向上するため、PolaMask++と呼ばれるさまざまなスケールの機能表現を改善するために、Refined Feature Pyramidが導入されている。
単一のモデルとシングルスケールのトレーニングとテストで挑戦的なcocoデータセットのインスタンスセグメンテーションにおける競合結果を達成するpolarmaskとpolarmask++の両方の有効性と、回転テキスト検出とセルセグメンテーションに関する新たな最先端結果が実証された。
提案した極性表現は、シングルショットのインスタンスセグメンテーションを解決するアルゴリズムを設計するための新しい視点を提供することを期待する。
コードとモデルは、github.com/xieenze/PolarMaskで入手できる。
関連論文リスト
- Isometric Transformations for Image Augmentation in Mueller Matrix Polarimetry [4.33959569757548]
ミューラー行列偏光法は、試料との偏光相互作用に関する重要な情報を取得する。
回転やフリップのような標準的な変換は、ミューラー行列像の偏光特性を保たない。
物理的に一貫した回転とフリップをミュラー行列に適用する多目的シミュレーションフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-12T16:50:13Z) - Bridge the Points: Graph-based Few-shot Segment Anything Semantically [79.1519244940518]
プレトレーニング技術の最近の進歩により、視覚基礎モデルの能力が向上した。
最近の研究はSAMをFew-shot Semantic segmentation (FSS)に拡張している。
本稿では,グラフ解析に基づく簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-10-09T15:02:28Z) - MP-PolarMask: A Faster and Finer Instance Segmentation for Concave Images [4.977034524493568]
PolarMaskは、極座標系によって物体を表すユニークなモデルである。
PolarMaskには2つの欠陥がある: (i)凹凸オブジェクトを表現できないことと (ii) レイレグレッションを使用する際の非効率性である。
複数の極系を利用するMP-PolarMask(Multi-Point PolarMask)を提案する。
論文 参考訳(メタデータ) (2024-06-03T14:20:34Z) - Polar-Doc: One-Stage Document Dewarping with Multi-Scope Constraints
under Polar Representation [26.050987382098107]
文書デワープは、テキスト認識の恩恵を受けるために、写真化された文書の幾何学的変形を排除することを目的としている。
本研究では,文書デワープにおける各点の極座標表現,すなわちPolar-Docについて検討する。
グリッドベース正規化として制御点間の関係を制約する新しいマルチスコープポラリド-IOU損失を提案する。
論文 参考訳(メタデータ) (2023-12-13T06:50:30Z) - PARTNER: Level up the Polar Representation for LiDAR 3D Object Detection [81.16859686137435]
本稿では、極座標における新しい3次元物体検出器Partnerを紹介する。
提案手法は,ONCE検証セットにおいて3.68%,9.15%の差で従来の極性理論よりも優れていた。
論文 参考訳(メタデータ) (2023-08-08T01:59:20Z) - SiamPolar: Semi-supervised Realtime Video Object Segmentation with Polar
Representation [6.108508667949229]
そこで我々は,新しい極性表現を用いたシームズネットワークに基づく半教師付きリアルタイム手法を提案する。
極性表現は、微妙な精度の損失でマスクを符号化するためのパラメータを減らすことができる。
また、異なる空間スケールから特徴を抽出するために、非対称シャイムネットワークも開発されている。
論文 参考訳(メタデータ) (2021-10-27T21:10:18Z) - NeuroMorph: Unsupervised Shape Interpolation and Correspondence in One
Go [109.88509362837475]
入力2つの3次元形状を考慮したニューラルネットワークアーキテクチャであるNeuroMorphを提案する。
NeuroMorphはそれらの間のスムーズかつポイントツーポイント対応を生成する。
異なる対象カテゴリの非等尺性ペアを含む、さまざまな入力形状に対してうまく機能する。
論文 参考訳(メタデータ) (2021-06-17T12:25:44Z) - Finding Geometric Models by Clustering in the Consensus Space [61.65661010039768]
本稿では,未知数の幾何学的モデル,例えばホモグラフィーを求めるアルゴリズムを提案する。
複数の幾何モデルを用いることで精度が向上するアプリケーションをいくつか提示する。
これには、複数の一般化されたホモグラフからのポーズ推定、高速移動物体の軌道推定が含まれる。
論文 参考訳(メタデータ) (2021-03-25T14:35:07Z) - Fast Single-shot Ship Instance Segmentation Based on Polar Template Mask
in Remote Sensing Images [7.45725819658858]
本稿では,概念的にシンプルで簡単な単一ショット畳み込みニューラルネットワーク構造を提案する。
SSS-Netと呼ばれる本手法は,対象物の中心の位置に基づいて対象物を検出する。
Airbus Ship Detection ChallengeデータセットとISAIDshipsデータセットの両方の実験によると、SSS-Netは、船のインスタンスセグメンテーションの精度と速度において、強力な競争力を持っている。
論文 参考訳(メタデータ) (2020-08-28T02:38:04Z) - PointINS: Point-based Instance Segmentation [117.38579097923052]
POI(Point-of-Interest)機能によるインスタンスセグメンテーションにおけるマスク表現は、各インスタンスの高次元マスク機能を学ぶには、計算負荷が重いため、難しい。
本稿では、このマスク表現学習タスクを2つの抽出可能なモジュールに分解するインスタンス認識畳み込みを提案する。
インスタンス認識の畳み込みとともに、単純で実用的なインスタンスセグメンテーションアプローチであるPointINSを提案する。
論文 参考訳(メタデータ) (2020-03-13T08:24:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。