論文の概要: Recurrent Generic Contour-based Instance Segmentation with Progressive
Learning
- arxiv url: http://arxiv.org/abs/2301.08898v3
- Date: Mon, 22 Jan 2024 03:01:28 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-23 22:13:41.731012
- Title: Recurrent Generic Contour-based Instance Segmentation with Progressive
Learning
- Title(参考訳): 逐次学習による連続的輪郭型インスタンスセグメンテーション
- Authors: Hao Feng, Keyi Zhou, Wengang Zhou, Yufei Yin, Jiajun Deng, Qi Sun,
Houqiang Li
- Abstract要約: 本稿では,一般的な輪郭型インスタンスセグメンテーションのための新しいディープネットワークアーキテクチャ,すなわちPolySnakeを提案する。
従来のSnakeアルゴリズムに動機付け,提案したPolySnakeはより優れた,堅牢なセグメンテーション性能を実現する。
- 参考スコア(独自算出の注目度): 111.31166268300817
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Contour-based instance segmentation has been actively studied, thanks to its
flexibility and elegance in processing visual objects within complex
backgrounds. In this work, we propose a novel deep network architecture, i.e.,
PolySnake, for generic contour-based instance segmentation. Motivated by the
classic Snake algorithm, the proposed PolySnake achieves superior and robust
segmentation performance with an iterative and progressive contour refinement
strategy. Technically, PolySnake introduces a recurrent update operator to
estimate the object contour iteratively. It maintains a single estimate of the
contour that is progressively deformed toward the object boundary. At each
iteration, PolySnake builds a semantic-rich representation for the current
contour and feeds it to the recurrent operator for further contour adjustment.
Through the iterative refinements, the contour progressively converges to a
stable status that tightly encloses the object instance. Beyond the scope of
general instance segmentation, extensive experiments are conducted to validate
the effectiveness and generalizability of our PolySnake in two additional
specific task scenarios, including scene text detection and lane detection. The
results demonstrate that the proposed PolySnake outperforms the existing
advanced methods on several multiple prevalent benchmarks across the three
tasks. The codes and pre-trained models are available at
https://github.com/fh2019ustc/PolySnake
- Abstract(参考訳): contourベースのインスタンスセグメンテーションは、複雑なバックグラウンド内でビジュアルオブジェクトを処理する柔軟性とエレガンスのおかげで、活発に研究されている。
本研究では,一般的な輪郭型インスタンスセグメンテーションのための新しいディープネットワークアーキテクチャ,すなわちPolySnakeを提案する。
古典的な Snake アルゴリズムに動機付け,提案した PolySnake は反復的・進行的輪郭改良戦略により,優れた,堅牢なセグメンテーション性能を実現する。
技術的には、PolySnakeは繰り返し更新演算子を導入し、オブジェクトの輪郭を反復的に見積もる。
それは、オブジェクト境界に向かって徐々に変形する輪郭の単一の推定を維持する。
それぞれのイテレーションで、PolySnakeは現在の輪郭のセマンティックリッチな表現を構築し、それをリカレント演算子に供給し、さらなる輪郭調整を行う。
反復精製により、輪郭は徐々に安定な状態に収束し、オブジェクトのインスタンスをしっかりと囲む。
一般的なインスタンスセグメンテーションの範囲を超えて、シーンテキスト検出とレーン検出を含む2つの特定のタスクシナリオにおいて、PolySnakeの有効性と一般化性を検証するために、広範な実験が実施されている。
その結果,提案手法は3つのタスクにまたがる複数の有界ベンチマークにおいて,既存の先進的手法よりも優れていることがわかった。
コードと事前訓練されたモデルはhttps://github.com/fh2019ustc/PolySnakeで入手できる。
関連論文リスト
- P2PFormer: A Primitive-to-polygon Method for Regular Building Contour Extraction from Remote Sensing Images [5.589842901102337]
既存の方法は不規則な輪郭、丸い角、冗長点に悩まされている。
本稿では,ポストプロセッシングを使わずに通常の建物輪郭を生成する,新しい合理化パイプラインを提案する。
P2PFormerは、WHU、CrowdAI、WHU-Mixデータセット上で、最先端のパフォーマンスを新たに実現している。
論文 参考訳(メタデータ) (2024-06-05T04:38:45Z) - Human as Points: Explicit Point-based 3D Human Reconstruction from
Single-view RGB Images [78.56114271538061]
我々はHaPと呼ばれる明示的なポイントベース人間再構築フレームワークを導入する。
提案手法は,3次元幾何学空間における完全明示的な点雲推定,操作,生成,洗練が特徴である。
我々の結果は、完全に明示的で幾何学中心のアルゴリズム設計へのパラダイムのロールバックを示すかもしれない。
論文 参考訳(メタデータ) (2023-11-06T05:52:29Z) - SRFormer: Text Detection Transformer with Incorporated Segmentation and
Regression [6.74412860849373]
本稿では,アマルガメーションと回帰を併用した統合DTRモデルSRFormerを提案する。
実験分析により,初期デコーダ層で良好なセグメンテーション予測が得られることが示された。
提案手法の強靭性,優れたトレーニングとデータ効率,および最先端の性能について検討した。
論文 参考訳(メタデータ) (2023-08-21T07:34:31Z) - Semantics-Aware Dynamic Localization and Refinement for Referring Image
Segmentation [102.25240608024063]
画像の参照は、言語表現からのイメージセグメントを参照する。
そこで我々は,局所化中心からセグメンテーション言語へ移行するアルゴリズムを開発した。
比較すると,本手法はより汎用的で有効である。
論文 参考訳(メタデータ) (2023-03-11T08:42:40Z) - Generative Category-Level Shape and Pose Estimation with Semantic
Primitives [27.692997522812615]
本稿では,1枚のRGB-D画像からカテゴリレベルのオブジェクト形状とポーズ推定を行う新しいフレームワークを提案する。
カテゴリ内変動に対処するために、様々な形状を統一された潜在空間にエンコードするセマンティックプリミティブ表現を採用する。
提案手法は,実世界のデータセットにおいて,SOTAのポーズ推定性能とより優れた一般化を実現する。
論文 参考訳(メタデータ) (2022-10-03T17:51:54Z) - ContourRender: Detecting Arbitrary Contour Shape For Instance
Segmentation In One Pass [48.57232627854642]
一方のパスにおける輪郭点の回帰の難しさは、滑らかな輪郭をポリゴンに識別する際のあいまいさが主な原因である。
あいまいさに対処するために,textbfContourRender という新しい差別化可能なレンダリング方式を提案する。
まず、可逆形状シグネチャによって生成された輪郭を予測し、それから、より安定したシルエットで輪郭を最適化し、それを輪郭メッシュに変換してメッシュを2Dマップにレンダリングする。
論文 参考訳(メタデータ) (2021-06-07T07:23:03Z) - DyCo3D: Robust Instance Segmentation of 3D Point Clouds through Dynamic
Convolution [136.7261709896713]
本稿では,インスタンスの性質に応じて適切な畳み込みカーネルを生成するデータ駆動型アプローチを提案する。
提案手法はScanetNetV2とS3DISの両方で有望な結果が得られる。
また、現在の最先端よりも推論速度を25%以上向上させる。
論文 参考訳(メタデータ) (2020-11-26T14:56:57Z) - CellSegmenter: unsupervised representation learning and instance
segmentation of modular images [0.0]
本稿では,教師なし表現学習とインスタンスセグメンテーションタスクのための構造化された深層生成モデルとアモータイズ推論フレームワークを提案する。
提案した推論アルゴリズムは、再帰的なメカニズムなしで畳み込み並列化されている。
細胞核イメージングデータセットで得られたセグメンテーション結果を示し,高品質なセグメンテーションを実現するための手法の有効性を示した。
論文 参考訳(メタデータ) (2020-11-25T02:10:58Z) - Deep Shells: Unsupervised Shape Correspondence with Optimal Transport [52.646396621449]
本稿では,3次元形状対応のための教師なし学習手法を提案する。
提案手法は,複数のデータセット上での最先端技術よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-10-28T22:24:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。