論文の概要: GSTran: Joint Geometric and Semantic Coherence for Point Cloud Segmentation
- arxiv url: http://arxiv.org/abs/2408.11558v1
- Date: Wed, 21 Aug 2024 12:12:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-22 17:07:27.291192
- Title: GSTran: Joint Geometric and Semantic Coherence for Point Cloud Segmentation
- Title(参考訳): GSTran: ポイントクラウドセグメンテーションのための統合幾何学とセマンティックコヒーレンス
- Authors: Abiao Li, Chenlei Lv, Guofeng Mei, Yifan Zuo, Jian Zhang, Yuming Fang,
- Abstract要約: 本稿では,セグメント化作業に適した新しい変圧器ネットワークであるGSTranを提案する。
提案するネットワークは主に,局所幾何学変換器と大域意味変換器の2つの主成分から構成される。
ShapeNetPartとS3DISベンチマークの実験により,提案手法の有効性が示された。
- 参考スコア(独自算出の注目度): 33.72549134362884
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning meaningful local and global information remains a challenge in point cloud segmentation tasks. When utilizing local information, prior studies indiscriminately aggregates neighbor information from different classes to update query points, potentially compromising the distinctive feature of query points. In parallel, inaccurate modeling of long-distance contextual dependencies when utilizing global information can also impact model performance. To address these issues, we propose GSTran, a novel transformer network tailored for the segmentation task. The proposed network mainly consists of two principal components: a local geometric transformer and a global semantic transformer. In the local geometric transformer module, we explicitly calculate the geometric disparity within the local region. This enables amplifying the affinity with geometrically similar neighbor points while suppressing the association with other neighbors. In the global semantic transformer module, we design a multi-head voting strategy. This strategy evaluates semantic similarity across the entire spatial range, facilitating the precise capture of contextual dependencies. Experiments on ShapeNetPart and S3DIS benchmarks demonstrate the effectiveness of the proposed method, showing its superiority over other algorithms. The code is available at https://github.com/LAB123-tech/GSTran.
- Abstract(参考訳): 意味のあるローカル情報とグローバル情報を学ぶことは、ポイントクラウドセグメンテーションタスクにおいて依然として課題である。
ローカル情報を利用する場合、先行研究は異なるクラスから隣り合う情報を無差別に集約してクエリポイントを更新し、クエリポイントの特異な特徴を補う可能性がある。
並行して、グローバル情報を利用する場合の長距離コンテキスト依存の不正確なモデリングは、モデルの性能にも影響を及ぼす可能性がある。
これらの課題に対処するために,セグメント化タスクに適した新しいトランスフォーマネットワークであるGSTranを提案する。
提案するネットワークは主に,局所幾何学変換器と大域意味変換器の2つの主成分から構成される。
局所幾何学変換器モジュールでは,局所領域内の幾何学的格差を明示的に計算する。
これにより、幾何学的に類似した近傍点との親和性を増幅し、他の近傍点との関連を抑えることができる。
グローバルセマンティックトランスフォーマーモジュールでは,マルチヘッド投票戦略を設計する。
この戦略は空間範囲全体の意味的類似性を評価し、コンテキスト依存の正確なキャプチャを容易にする。
ShapeNetPartとS3DISベンチマークの実験では,提案手法の有効性が示され,他のアルゴリズムよりも優れていることが示された。
コードはhttps://github.com/LAB123-tech/GSTranで公開されている。
関連論文リスト
- Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - Coupled Laplacian Eigenmaps for Locally-Aware 3D Rigid Point Cloud Matching [0.0]
局所構造を考慮したグラフラプラシアン固有写像に基づく新しい手法を提案する。
ラプラシアン固有写像の順序と符号のあいまいさに対処するために、結合ラプラシアンと呼ばれる新しい作用素を導入する。
これらの高次元空間間の類似性は、形状に一致するような局所的な意味のあるスコアを与えることを示す。
論文 参考訳(メタデータ) (2024-02-27T10:10:12Z) - GTNet: Graph Transformer Network for 3D Point Cloud Classification and Semantic Segmentation [10.596757615219207]
グラフベースのディープラーニングネットワークとTransformerベースのディープラーニングネットワークは、さまざまなポイントクラウドタスクで優れたパフォーマンスを示している。
本稿では,Graph Transformerという新機能抽出ブロックを提案し,GTNetと呼ばれる3Dポイントクラウド学習ネットワークを構築した。
論文 参考訳(メタデータ) (2023-05-24T14:51:18Z) - Full Point Encoding for Local Feature Aggregation in 3D Point Clouds [29.402585297221457]
畳み込みおよびトランスフォーマーアーキテクチャに適用可能な全点符号化を提案する。
鍵となる考え方は、局所的および大域的な幾何学的接続から重みを適応的に学習することである。
S3DIS 6倍の76% mIoU と S3DIS Area5 の72.2% の最先端セマンティックセグメンテーション結果を得た。
論文 参考訳(メタデータ) (2023-03-08T09:14:17Z) - LCPFormer: Towards Effective 3D Point Cloud Analysis via Local Context
Propagation in Transformers [60.51925353387151]
本稿では,近隣地域間のメッセージパッシングを活用するために,LCP (Local Context Propagation) という新しいモジュールを提案する。
隣接するローカル領域の重複点を仲介として使用した後、異なるローカルリージョンからの共有ポイントの特徴を再重み付けし、その後、次のレイヤに渡す。
提案手法は, 異なるタスクに適用可能であり, 3次元形状分類や高密度予測タスクを含むベンチマークにおいて, 様々なトランスフォーマーベースの手法より優れる。
論文 参考訳(メタデータ) (2022-10-23T15:43:01Z) - SemAffiNet: Semantic-Affine Transformation for Point Cloud Segmentation [94.11915008006483]
ポイントクラウドセマンティックセグメンテーションのためのSemAffiNetを提案する。
我々はScanNetV2とNYUv2データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-05-26T17:00:23Z) - Stratified Transformer for 3D Point Cloud Segmentation [89.9698499437732]
Stratified Transformerは、長距離コンテキストをキャプチャし、強力な一般化能力と高性能を示す。
不規則な点配置によって引き起こされる課題に対処するために,局所情報を集約する第1層点埋め込みを提案する。
S3DIS, ScanNetv2およびShapeNetPartデータセットにおける本手法の有効性と優位性を示す実験を行った。
論文 参考訳(メタデータ) (2022-03-28T05:35:16Z) - Augmenting Convolutional networks with attention-based aggregation [55.97184767391253]
我々は,非局所的推論を実現するために,注目に基づくグローバルマップを用いた畳み込みネットワークの強化方法を示す。
この学習集約層を2つのパラメータ(幅と深さ)でパラメータ化した単純パッチベースの畳み込みネットワークで接続する。
これは、特にメモリ消費の点で、精度と複雑さの間の驚くほど競争力のあるトレードオフをもたらす。
論文 参考訳(メタデータ) (2021-12-27T14:05:41Z) - A Rotation-Invariant Framework for Deep Point Cloud Analysis [132.91915346157018]
ネットワーク入力時に一般的な3次元カルト座標を置き換えるために,新しい低レベル純粋回転不変表現を導入する。
また,これらの表現を特徴に組み込むネットワークアーキテクチャを提案し,点とその近傍の局所的関係とグローバルな形状構造を符号化する。
本手法は, 形状分類, 部分分割, 形状検索を含む多点雲解析タスクにおいて評価する。
論文 参考訳(メタデータ) (2020-03-16T14:04:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。