論文の概要: End-to-End Segmentation via Patch-wise Polygons Prediction
- arxiv url: http://arxiv.org/abs/2112.02535v1
- Date: Sun, 5 Dec 2021 10:42:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-09 09:11:29.483817
- Title: End-to-End Segmentation via Patch-wise Polygons Prediction
- Title(参考訳): パッチワイドポリゴン予測によるエンドツーエンドセグメンテーション
- Authors: Tal Shaharabany and Lior Wolf
- Abstract要約: 先頭のセグメンテーション法は、出力マップをピクセルグリッドとして表現する。
画像パッチ毎に対象のエッジがモデル化される別の表現を、パッチごとのラベル確率と結合した$k$の頂点を持つポリゴンとして検討する。
- 参考スコア(独自算出の注目度): 93.91375268580806
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The leading segmentation methods represent the output map as a pixel grid. We
study an alternative representation in which the object edges are modeled, per
image patch, as a polygon with $k$ vertices that is coupled with per-patch
label probabilities. The vertices are optimized by employing a differentiable
neural renderer to create a raster image. The delineated region is then
compared with the ground truth segmentation. Our method obtains multiple
state-of-the-art results: 76.26\% mIoU on the Cityscapes validation, 90.92\%
IoU on the Vaihingen building segmentation benchmark, 66.82\% IoU for the MoNU
microscopy dataset, and 90.91\% for the bird benchmark CUB. Our code for
training and reproducing these results is attached as supplementary.
- Abstract(参考訳): 先行セグメンテーション手法は、出力マップを画素グリッドとして表現する。
対象のエッジがイメージパッチごとにモデル化される代替表現を,パッチごとのラベル確率と結合した$k$頂点を持つポリゴンとして検討する。
頂点は、識別可能なニューラルレンダラーを使用してラスタ画像を作成することで最適化される。
次に、区切りされた領域を、地上の真理セグメンテーションと比較する。
本手法は, 都市景観検証における76.26\% mIoU, ヴァイヒンゲンビルディングセグメンテーション・ベンチマークにおける90.92\% IoU, MoNUマイクロスコープ・データセットにおける66.82\% IoU, 鳥ベンチマークCUBにおける90.91\%の2つの結果を得た。
これらの結果のトレーニングと再現のコードは補足として添付されます。
関連論文リスト
- View-Consistent Hierarchical 3D Segmentation Using Ultrametric Feature Fields [52.08335264414515]
我々は3次元シーンを表すニューラル・レージアンス・フィールド(NeRF)内の新しい特徴場を学習する。
本手法は、ビュー一貫性の多粒性2Dセグメンテーションを入力とし、3D一貫性のセグメンテーションの階層構造を出力として生成する。
提案手法と,多視点画像と多粒性セグメンテーションを用いた合成データセットのベースラインの評価を行い,精度と視点整合性を向上したことを示す。
論文 参考訳(メタデータ) (2024-05-30T04:14:58Z) - CorrMatch: Label Propagation via Correlation Matching for
Semi-Supervised Semantic Segmentation [73.89509052503222]
本稿では、CorrMatchと呼ばれる、単純だが実行可能な半教師付きセマンティックセマンティックセマンティックセマンティクス手法を提案する。
相関写像は、同一カテゴリのクラスタリングピクセルを容易に実現できるだけでなく、良好な形状情報も含んでいることを観察する。
我々は,高信頼画素を拡大し,さらに掘り出すために,画素の対の類似性をモデル化して画素伝搬を行う。
そして、相関地図から抽出した正確なクラス非依存マスクを用いて、領域伝搬を行い、擬似ラベルを強化する。
論文 参考訳(メタデータ) (2023-06-07T10:02:29Z) - Random Edge Coding: One-Shot Bits-Back Coding of Large Labeled Graphs [24.761152163389735]
ランダムエッジ符号化(Random Edge Coding)と呼ばれる大きなラベル付きグラフを圧縮するためのワンショット方式を提案する。
実験によると、ランダムエッジ符号化は実世界のネットワークデータセット上での競合圧縮性能を実現することができる。
論文 参考訳(メタデータ) (2023-05-16T12:23:18Z) - PolyFormer: Referring Image Segmentation as Sequential Polygon
Generation [20.55281741205142]
画素レベルのセグメンテーションマスクを直接予測する代わりに、画像セグメンテーションを参照する問題はシーケンシャルポリゴン生成として定式化される。
これは新しいシーケンス・ツー・シーケンス・フレームワークであるPolygon Transformer(PolyFormer)によって実現されている。
より正確な幾何学的位置決めを行うために,正確な浮動小数点座標を直接予測する回帰型デコーダを提案する。
論文 参考訳(メタデータ) (2023-02-14T23:00:25Z) - VoGE: A Differentiable Volume Renderer using Gaussian Ellipsoids for
Analysis-by-Synthesis [62.47221232706105]
本稿では,ガウス再構成カーネルをボリュームプリミティブとして利用するVoGEを提案する。
本稿では,VoGEを用いて効率よくレンダリングを行うために,体積密度集約と粗大な描画戦略に関する近似クローズフォーム解を提案する。
VoGEは、オブジェクトポーズ推定、形状/テクスチャフィッティング、推論など、様々な視覚タスクに適用された場合、SoTAより優れている。
論文 参考訳(メタデータ) (2022-05-30T19:52:11Z) - SegDiff: Image Segmentation with Diffusion Probabilistic Models [81.16986859755038]
拡散確率法は最先端の画像生成に使用される。
画像分割を行うためにそのようなモデルを拡張する方法を提案する。
この方法は、トレーニング済みのバックボーンに頼ることなく、エンドツーエンドで学習する。
論文 参考訳(メタデータ) (2021-12-01T10:17:25Z) - PolyWorld: Polygonal Building Extraction with Graph Neural Networks in
Satellite Images [10.661430927191205]
本稿では、画像から直接建物頂点を抽出し、それらを正しく接続して正確なポリゴンを生成するニューラルネットワークであるPolyWorldを紹介する。
PolyWorldは、ポリゴン化の構築における最先端を著しく上回る。
論文 参考訳(メタデータ) (2021-11-30T15:23:17Z) - Edge-aware Graph Representation Learning and Reasoning for Face Parsing [61.5045850197694]
顔解析は、最近注目されている各顔成分にピクセルワイズラベルを推論する。
従来は顔解析における効率性を示してきたが, 異なる顔領域間の相関性を見落としている。
本稿では,グラフ表現の学習による地域関係のモデル化と推論を提案する。
論文 参考訳(メタデータ) (2020-07-22T07:46:34Z) - ContourRend: A Segmentation Method for Improving Contours by Rendering [10.13129256609938]
マスクベースのセグメンテーションは粗い予測グリッドで輪郭特徴をうまく扱えない。
本稿では,畳み込み輪郭を改良するために畳み込み輪郭を用いるContourendを提案する。
本手法は, 平均結合面積が72.41%に達し, ベースラインのポリゴンGCNを1.22%超える。
論文 参考訳(メタデータ) (2020-07-15T02:16:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。