Fugu-MT 論文翻訳(概要): Recurrent Generic Contour-based Instance Segmentation with Progressive Learning

論文の概要: Recurrent Generic Contour-based Instance Segmentation with Progressive Learning

arxiv url: http://arxiv.org/abs/2301.08898v3
Date: Mon, 22 Jan 2024 03:01:28 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-23 22:13:41.731012
Title: Recurrent Generic Contour-based Instance Segmentation with Progressive Learning
Title（参考訳）: 逐次学習による連続的輪郭型インスタンスセグメンテーション
Authors: Hao Feng, Keyi Zhou, Wengang Zhou, Yufei Yin, Jiajun Deng, Qi Sun, Houqiang Li
Abstract要約: 本稿では,一般的な輪郭型インスタンスセグメンテーションのための新しいディープネットワークアーキテクチャ,すなわちPolySnakeを提案する。従来のSnakeアルゴリズムに動機付け,提案したPolySnakeはより優れた,堅牢なセグメンテーション性能を実現する。
参考スコア（独自算出の注目度）: 111.31166268300817
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Contour-based instance segmentation has been actively studied, thanks to its flexibility and elegance in processing visual objects within complex backgrounds. In this work, we propose a novel deep network architecture, i.e., PolySnake, for generic contour-based instance segmentation. Motivated by the classic Snake algorithm, the proposed PolySnake achieves superior and robust segmentation performance with an iterative and progressive contour refinement strategy. Technically, PolySnake introduces a recurrent update operator to estimate the object contour iteratively. It maintains a single estimate of the contour that is progressively deformed toward the object boundary. At each iteration, PolySnake builds a semantic-rich representation for the current contour and feeds it to the recurrent operator for further contour adjustment. Through the iterative refinements, the contour progressively converges to a stable status that tightly encloses the object instance. Beyond the scope of general instance segmentation, extensive experiments are conducted to validate the effectiveness and generalizability of our PolySnake in two additional specific task scenarios, including scene text detection and lane detection. The results demonstrate that the proposed PolySnake outperforms the existing advanced methods on several multiple prevalent benchmarks across the three tasks. The codes and pre-trained models are available at https://github.com/fh2019ustc/PolySnake
Abstract（参考訳）: contourベースのインスタンスセグメンテーションは、複雑なバックグラウンド内でビジュアルオブジェクトを処理する柔軟性とエレガンスのおかげで、活発に研究されている。本研究では,一般的な輪郭型インスタンスセグメンテーションのための新しいディープネットワークアーキテクチャ,すなわちPolySnakeを提案する。古典的な Snake アルゴリズムに動機付け,提案した PolySnake は反復的・進行的輪郭改良戦略により,優れた,堅牢なセグメンテーション性能を実現する。技術的には、PolySnakeは繰り返し更新演算子を導入し、オブジェクトの輪郭を反復的に見積もる。それは、オブジェクト境界に向かって徐々に変形する輪郭の単一の推定を維持する。それぞれのイテレーションで、PolySnakeは現在の輪郭のセマンティックリッチな表現を構築し、それをリカレント演算子に供給し、さらなる輪郭調整を行う。反復精製により、輪郭は徐々に安定な状態に収束し、オブジェクトのインスタンスをしっかりと囲む。一般的なインスタンスセグメンテーションの範囲を超えて、シーンテキスト検出とレーン検出を含む2つの特定のタスクシナリオにおいて、PolySnakeの有効性と一般化性を検証するために、広範な実験が実施されている。その結果,提案手法は3つのタスクにまたがる複数の有界ベンチマークにおいて,既存の先進的手法よりも優れていることがわかった。コードと事前訓練されたモデルはhttps://github.com/fh2019ustc/PolySnakeで入手できる。

関連論文リスト

Detection Based Part-level Articulated Object Reconstruction from Single RGBD Image [52.11275397911693]
本稿では,1枚のRGBD画像から複数の人工関節オブジェクトを再構成する,エンドツーエンドで訓練可能なクロスカテゴリ手法を提案する。私たちは、あらかじめ定義された部分数で人工的なオブジェクトに焦点をあて、インスタンスレベルの潜在空間を学習することに依存する以前の作業から離れています。提案手法は, 従来の作業では処理できない様々な構成された複数インスタンスの再構築に成功し, 形状再構成や運動学推定において, 先行の作業よりも優れていた。
論文参考訳（メタデータ） (2025-04-04T05:08:04Z)
P2PFormer: A Primitive-to-polygon Method for Regular Building Contour Extraction from Remote Sensing Images [5.589842901102337]
既存の方法は不規則な輪郭、丸い角、冗長点に悩まされている。本稿では,ポストプロセッシングを使わずに通常の建物輪郭を生成する,新しい合理化パイプラインを提案する。 P2PFormerは、WHU、CrowdAI、WHU-Mixデータセット上で、最先端のパフォーマンスを新たに実現している。
論文参考訳（メタデータ） (2024-06-05T04:38:45Z)
Human as Points: Explicit Point-based 3D Human Reconstruction from Single-view RGB Images [78.56114271538061]
我々はHaPと呼ばれる明示的なポイントベース人間再構築フレームワークを導入する。提案手法は,3次元幾何学空間における完全明示的な点雲推定,操作,生成,洗練が特徴である。我々の結果は、完全に明示的で幾何学中心のアルゴリズム設計へのパラダイムのロールバックを示すかもしれない。
論文参考訳（メタデータ） (2023-11-06T05:52:29Z)
SRFormer: Text Detection Transformer with Incorporated Segmentation and Regression [6.74412860849373]
本稿では,アマルガメーションと回帰を併用した統合DTRモデルSRFormerを提案する。実験分析により,初期デコーダ層で良好なセグメンテーション予測が得られることが示された。提案手法の強靭性,優れたトレーニングとデータ効率,および最先端の性能について検討した。
論文参考訳（メタデータ） (2023-08-21T07:34:31Z)
Semantics-Aware Dynamic Localization and Refinement for Referring Image Segmentation [102.25240608024063]
画像の参照は、言語表現からのイメージセグメントを参照する。そこで我々は,局所化中心からセグメンテーション言語へ移行するアルゴリズムを開発した。比較すると,本手法はより汎用的で有効である。
論文参考訳（メタデータ） (2023-03-11T08:42:40Z)
Generative Category-Level Shape and Pose Estimation with Semantic Primitives [27.692997522812615]
本稿では,1枚のRGB-D画像からカテゴリレベルのオブジェクト形状とポーズ推定を行う新しいフレームワークを提案する。カテゴリ内変動に対処するために、様々な形状を統一された潜在空間にエンコードするセマンティックプリミティブ表現を採用する。提案手法は,実世界のデータセットにおいて,SOTAのポーズ推定性能とより優れた一般化を実現する。
論文参考訳（メタデータ） (2022-10-03T17:51:54Z)
ContourRender: Detecting Arbitrary Contour Shape For Instance Segmentation In One Pass [48.57232627854642]
一方のパスにおける輪郭点の回帰の難しさは、滑らかな輪郭をポリゴンに識別する際のあいまいさが主な原因である。あいまいさに対処するために,textbfContourRender という新しい差別化可能なレンダリング方式を提案する。まず、可逆形状シグネチャによって生成された輪郭を予測し、それから、より安定したシルエットで輪郭を最適化し、それを輪郭メッシュに変換してメッシュを2Dマップにレンダリングする。
論文参考訳（メタデータ） (2021-06-07T07:23:03Z)
DyCo3D: Robust Instance Segmentation of 3D Point Clouds through Dynamic Convolution [136.7261709896713]
本稿では,インスタンスの性質に応じて適切な畳み込みカーネルを生成するデータ駆動型アプローチを提案する。提案手法はScanetNetV2とS3DISの両方で有望な結果が得られる。また、現在の最先端よりも推論速度を25%以上向上させる。
論文参考訳（メタデータ） (2020-11-26T14:56:57Z)
CellSegmenter: unsupervised representation learning and instance segmentation of modular images [0.0]
本稿では,教師なし表現学習とインスタンスセグメンテーションタスクのための構造化された深層生成モデルとアモータイズ推論フレームワークを提案する。提案した推論アルゴリズムは、再帰的なメカニズムなしで畳み込み並列化されている。細胞核イメージングデータセットで得られたセグメンテーション結果を示し,高品質なセグメンテーションを実現するための手法の有効性を示した。
論文参考訳（メタデータ） (2020-11-25T02:10:58Z)
Deep Shells: Unsupervised Shape Correspondence with Optimal Transport [52.646396621449]
本稿では,3次元形状対応のための教師なし学習手法を提案する。提案手法は,複数のデータセット上での最先端技術よりも大幅に改善されていることを示す。
論文参考訳（メタデータ） (2020-10-28T22:24:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。