論文の概要: Number-Adaptive Prototype Learning for 3D Point Cloud Semantic
Segmentation
- arxiv url: http://arxiv.org/abs/2210.09948v1
- Date: Tue, 18 Oct 2022 15:57:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 15:16:08.273618
- Title: Number-Adaptive Prototype Learning for 3D Point Cloud Semantic
Segmentation
- Title(参考訳): 3dポイントクラウドセマンティクスセグメンテーションのための数適応プロトタイプ学習
- Authors: Yangheng Zhao, Jun Wang, Xiaolong Li, Yue Hu, Ce Zhang, Yanfeng Wang,
and Siheng Chen
- Abstract要約: セマンティッククラス内の異なる点パターンを動的に記述するために,適応的なプロトタイプ数を提案する。
本手法は,ポイントワイド分類パラダイムに基づくベースラインモデルよりも2.3%mIoUの改善を実現する。
- 参考スコア(独自算出の注目度): 46.610620464184926
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D point cloud semantic segmentation is one of the fundamental tasks for 3D
scene understanding and has been widely used in the metaverse applications.
Many recent 3D semantic segmentation methods learn a single prototype
(classifier weights) for each semantic class, and classify 3D points according
to their nearest prototype. However, learning only one prototype for each class
limits the model's ability to describe the high variance patterns within a
class. Instead of learning a single prototype for each class, in this paper, we
propose to use an adaptive number of prototypes to dynamically describe the
different point patterns within a semantic class. With the powerful capability
of vision transformer, we design a Number-Adaptive Prototype Learning (NAPL)
model for point cloud semantic segmentation. To train our NAPL model, we
propose a simple yet effective prototype dropout training strategy, which
enables our model to adaptively produce prototypes for each class. The
experimental results on SemanticKITTI dataset demonstrate that our method
achieves 2.3% mIoU improvement over the baseline model based on the point-wise
classification paradigm.
- Abstract(参考訳): 3Dポイントクラウドセマンティックセグメンテーションは3Dシーン理解の基本課題の一つであり、メタバースアプリケーションで広く利用されている。
最近の多くの3d意味セマンティクスセグメンテーション手法は、各セマンティクスクラスの単一のプロトタイプ(分類子重み)を学習し、最寄りのプロトタイプに従って3dポイントを分類する。
しかし、各クラスの1つのプロトタイプだけを学ぶことは、クラス内の高分散パターンを記述するモデルの能力を制限する。
本稿では,各クラスの1つのプロトタイプを学習する代わりに,意味クラス内の異なる点パターンを動的に記述するために,適応型プロトタイプを使用する方法を提案する。
視覚変換器の強力な能力により,ポイントクラウドセマンティックセグメンテーションのための数適応プロトタイプ学習(NAPL)モデルを設計する。
NAPLモデルをトレーニングするために,モデルが各クラスに対して適応的にプロトタイプを作成可能な,シンプルで効果的なプロトタイプドロップアウトトレーニング戦略を提案する。
SemanticKITTIデータセットを用いた実験結果から,本手法は,ポイントワイド分類パラダイムに基づくベースラインモデルよりも2.3% mIoUの改善を実現することが示された。
関連論文リスト
- Rethinking Few-shot 3D Point Cloud Semantic Segmentation [62.80639841429669]
本稿では,FS-PCSによる3Dポイント・クラウドセマンティックセマンティックセグメンテーションについて再検討する。
我々は、最先端の2つの重要な問題、前景の漏洩とスパースポイントの分布に焦点をあてる。
これらの問題に対処するために、新しいベンチマークを構築するための標準化されたFS-PCS設定を導入する。
論文 参考訳(メタデータ) (2024-03-01T15:14:47Z) - Towards Category Unification of 3D Single Object Tracking on Point
Clouds [11.281200884073812]
カテゴリー特化モデルは、シームズや動き中心のパラダイムに関わらず、3次元単体追跡(SOT)において非常に価値のある手法である。
本稿ではまず,共有モデルパラメータを持つ単一ネットワークを用いて,すべてのカテゴリにまたがるオブジェクトを同時に追跡できる統一モデルを提案する。
論文 参考訳(メタデータ) (2024-01-20T10:38:28Z) - Prototype Adaption and Projection for Few- and Zero-shot 3D Point Cloud
Semantic Segmentation [30.18333233940194]
本研究は, 少数ショットとゼロショットの3Dポイントクラウドセマンティックセマンティックセグメンテーションの課題に対処する。
提案手法は,S3DISベンチマークとScanNetベンチマークの2方向1ショット設定により,最先端のアルゴリズムを約7.90%,14.82%上回る。
論文 参考訳(メタデータ) (2023-05-23T17:58:05Z) - Weakly Supervised 3D Point Cloud Segmentation via Multi-Prototype
Learning [37.76664203157892]
ここでの根本的な課題は、局所幾何学構造の大きなクラス内変異であり、結果として意味クラス内のサブクラスとなる。
この直感を活用し、各サブクラスの個別分類器を維持することを選択します。
我々の仮説はまた、追加アノテーションのコストを伴わずにセマンティックサブクラスの一貫した発見を前提に検証されている。
論文 参考訳(メタデータ) (2022-05-06T11:07:36Z) - Rethinking Semantic Segmentation: A Prototype View [126.59244185849838]
学習不可能なプロトタイプをベースとした非パラメトリックセマンティックセマンティックセマンティクスモデルを提案する。
我々のフレームワークは、いくつかのデータセットに対して魅力的な結果をもたらす。
この作業が、現在のデファクトセマンティックセグメンテーションモデル設計を再考することを期待しています。
論文 参考訳(メタデータ) (2022-03-28T21:15:32Z) - Dual Prototypical Contrastive Learning for Few-shot Semantic
Segmentation [55.339405417090084]
本稿では,FSSタスクに適合する2つの特徴的コントラスト学習手法を提案する。
第一の考え方は、プロトタイプの特徴空間におけるクラス内距離を減少させながら、クラス間距離を増やすことで、プロトタイプをより差別的にすることである。
提案手法は,PASCAL-5iおよびCOCO-20iデータセット上で,最先端のFSS手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-09T08:14:50Z) - Simpler is Better: Few-shot Semantic Segmentation with Classifier Weight
Transformer [112.95747173442754]
数ショットのセマンティックセグメンテーションモデルは典型的にはCNNエンコーダ、CNNデコーダ、単純な分類器から構成される。
既存のほとんどのメソッドは、新しいクラスに迅速に適応するために、3つのモデルコンポーネント全てをメタ学習する。
本稿では,最も単純なコンポーネントである分類器にのみ焦点をあてて,メタ学習タスクの簡略化を提案する。
論文 参考訳(メタデータ) (2021-08-06T10:20:08Z) - Learn to Learn Metric Space for Few-Shot Segmentation of 3D Shapes [17.217954254022573]
メタラーニングに基づく3次元形状分割手法を提案する。
本稿では,ShapeNet部データセットにおける提案手法の優れた性能を,既存のベースラインや最先端の半教師手法と比較し,いくつかのシナリオで示す。
論文 参考訳(メタデータ) (2021-07-07T01:47:00Z) - Learning Feature Aggregation for Deep 3D Morphable Models [57.1266963015401]
階層レベルで機能集約を向上するためのマッピング行列を学習するための注意に基づくモジュールを提案する。
実験の結果,マッピング行列のエンドツーエンドトレーニングにより,様々な3次元形状データセットの最先端結果が得られることがわかった。
論文 参考訳(メタデータ) (2021-05-05T16:41:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。