論文の概要: GeoSegNet: Point Cloud Semantic Segmentation via Geometric
Encoder-Decoder Modeling
- arxiv url: http://arxiv.org/abs/2207.06766v1
- Date: Thu, 14 Jul 2022 09:24:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-15 14:57:38.431808
- Title: GeoSegNet: Point Cloud Semantic Segmentation via Geometric
Encoder-Decoder Modeling
- Title(参考訳): GeoSegNet:Geometric Encoder-Decoder Modelingによるポイントクラウドセマンティックセマンティックセグメンテーション
- Authors: Chen Chen, Yisen Wang, Honghua Chen, Xuefeng Yan, Dayong Ren, Yanwen
Guo, Haoran Xie, Fu Lee Wang, Mingqiang Wei
- Abstract要約: 我々はGeoSegNetと呼ばれるロバストなセマンティックセマンティックセマンティクスネットワークを提案する。
我々のGeoSegNetはマルチジオメトリベースのエンコーダと境界誘導デコーダで構成されている。
実験により,提案手法の精度と対象境界の明瞭度を比較検討し,提案手法を比較検討した。
- 参考スコア(独自算出の注目度): 39.35429984469557
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic segmentation of point clouds, aiming to assign each point a semantic
category, is critical to 3D scene understanding.Despite of significant advances
in recent years, most of existing methods still suffer from either the
object-level misclassification or the boundary-level ambiguity. In this paper,
we present a robust semantic segmentation network by deeply exploring the
geometry of point clouds, dubbed GeoSegNet. Our GeoSegNet consists of a
multi-geometry based encoder and a boundary-guided decoder. In the encoder, we
develop a new residual geometry module from multi-geometry perspectives to
extract object-level features. In the decoder, we introduce a contrastive
boundary learning module to enhance the geometric representation of boundary
points. Benefiting from the geometric encoder-decoder modeling, our GeoSegNet
can infer the segmentation of objects effectively while making the
intersections (boundaries) of two or more objects clear. Experiments show
obvious improvements of our method over its competitors in terms of the overall
segmentation accuracy and object boundary clearness. Code is available at
https://github.com/Chen-yuiyui/GeoSegNet.
- Abstract(参考訳): ポイントクラウドのセマンティクスセグメンテーションは,各ポイントを意味カテゴリーに割り当てることを目的としているが,3dシーン理解には不可欠である。近年の著しい進歩にもかかわらず,既存の手法のほとんどが,オブジェクトレベルの誤分類や境界レベルの曖昧さに苦しんでいる。
本稿では,geosegnetと呼ばれる点雲の幾何構造を深く探究することにより,ロバストな意味セグメンテーションネットワークを提案する。
GeoSegNetはマルチジオメトリベースのエンコーダと境界誘導デコーダで構成される。
エンコーダでは、オブジェクトレベルの特徴を抽出するために、マルチジオメトリの観点から新しい残差幾何モジュールを開発する。
デコーダでは、境界点の幾何学的表現を強化するために、対比境界学習モジュールを導入する。
我々のGeoSegNetは幾何学エンコーダデコーダモデリングの利点を生かして、2つ以上のオブジェクトの交差点(境界)を明確にしながら、オブジェクトのセグメンテーションを効果的に推測することができる。
実験の結果, 提案手法は, 全体のセグメンテーション精度とオブジェクト境界クリア性の観点から, 競合他社よりも明らかに改善されていることがわかった。
コードはhttps://github.com/Chen-yuiyui/GeoSegNetで入手できる。
関連論文リスト
- Geometrically-driven Aggregation for Zero-shot 3D Point Cloud Understanding [11.416392706435415]
ゼロショット3Dポイントクラウド理解は2Dビジョンランゲージモデル(VLM)によって達成できる
既存の戦略は、ヴィジュアル・ランゲージ・モデル(Vision-Language Model)をレンダリングまたはキャプチャされた2Dピクセルから3Dポイントにマッピングし、固有かつ表現可能な雲の幾何学構造を見渡す。
本稿では, 点雲の3次元幾何学的構造を利用して, 移動したビジョン・ランゲージモデルの品質を向上させるための, 初となるトレーニングフリーアグリゲーション手法を提案する。
論文 参考訳(メタデータ) (2023-12-04T12:30:07Z) - Generalized Few-Shot Point Cloud Segmentation Via Geometric Words [54.32239996417363]
ショットポイントクラウドセグメンテーションアルゴリズムは、ベースクラスのセグメンテーション精度を犠牲にして、新しいクラスに適応するように学習する。
一般化された数ショット点雲のセグメンテーションというより実践的なパラダイムの最初の試みを示す。
基本クラスと新規クラス間で共有される幾何学的要素を表す幾何学的単語を提案し,それらを新しい幾何学的意味表現に組み込む。
論文 参考訳(メタデータ) (2023-09-20T11:24:33Z) - PointMCD: Boosting Deep Point Cloud Encoders via Multi-view Cross-modal
Distillation for 3D Shape Recognition [55.38462937452363]
本稿では,教師として事前訓練されたディープイメージエンコーダ,学生としてディープポイントエンコーダを含む多視点クロスモーダル蒸留アーキテクチャを提案する。
複数ビューの視覚的および幾何学的記述子をペアワイズにアライメントすることで、より強力なディープポイントエンコーダを、疲労や複雑なネットワーク修正を伴わずに得ることができる。
論文 参考訳(メタデータ) (2022-07-07T07:23:20Z) - GFNet: Geometric Flow Network for 3D Point Cloud Semantic Segmentation [91.15865862160088]
本稿では,異なるビュー間の幾何対応性を検討するための幾何フローネットワーク (GFNet) を提案する。
具体的には、異なる視点にまたがって補完情報を双方向に整列し、伝播する新しい幾何フローモジュール(GFM)を考案する。
論文 参考訳(メタデータ) (2022-07-06T11:48:08Z) - SemAffiNet: Semantic-Affine Transformation for Point Cloud Segmentation [94.11915008006483]
ポイントクラウドセマンティックセグメンテーションのためのSemAffiNetを提案する。
我々はScanNetV2とNYUv2データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-05-26T17:00:23Z) - Neighborhood-aware Geometric Encoding Network for Point Cloud
Registration [0.0]
周辺を意識した幾何学。
正確なポイントクラウド登録のためのネットワーク(NgeNet)。
NgeNetはモデルに依存しないため、他のネットワークに簡単に移行できる。
論文 参考訳(メタデータ) (2022-01-28T13:04:54Z) - Boundary-Aware Geometric Encoding for Semantic Segmentation of Point
Clouds [45.270215729464056]
境界情報は2Dイメージセグメンテーションにおいて重要な役割を果たすが、通常は3Dポイントクラウドセグメンテーションでは無視される。
境界点を予測するための境界予測モジュール(BPM)を提案する。
予測された境界に基づいて、境界認識ジオメトリック。
GEMは、幾何学的情報をエンコードし、近隣の差別を伴う特徴を集約するように設計されている。
論文 参考訳(メタデータ) (2021-01-07T05:38:19Z) - Learning Geometry-Disentangled Representation for Complementary
Understanding of 3D Object Point Cloud [50.56461318879761]
3次元画像処理のためのGDANet(Geometry-Disentangled Attention Network)を提案する。
GDANetは、点雲を3Dオブジェクトの輪郭と平らな部分に切り離し、それぞれ鋭い変化成分と穏やかな変化成分で表される。
3Dオブジェクトの分類とセグメンテーションベンチマークの実験は、GDANetがより少ないパラメータで最先端の処理を実現していることを示している。
論文 参考訳(メタデータ) (2020-12-20T13:35:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。