論文の概要: Bidirectional Feature Globalization for Few-shot Semantic Segmentation
of 3D Point Cloud Scenes
- arxiv url: http://arxiv.org/abs/2208.06671v2
- Date: Wed, 17 Aug 2022 06:33:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-18 10:32:12.527580
- Title: Bidirectional Feature Globalization for Few-shot Semantic Segmentation
of 3D Point Cloud Scenes
- Title(参考訳): 3次元点雲シーンのFew-shot Semantic Segmentationのための双方向特徴グローバリゼーション
- Authors: Yongqiang Mao, Zonghao Guo, Xiaonan Lu, Zhiqiang Yuan, Haowen Guo
- Abstract要約: 本稿では,グローバルな認識を局所的な特徴に組み込むために,双方向機能グローバリゼーション(BFG)アプローチを提案する。
プロトタイプ・ツー・ポイントのグローバル化(Pr2PoG)により、グローバルな認識は、疎いプロトタイプから高密度な特徴への類似度重みに基づく局所的な特徴に埋め込まれる。
グローバルな知覚に埋め込まれた各クラスのスパースプロトタイプは、数発の3Dセグメンテーションのための単一のプロトタイプに要約される。
- 参考スコア(独自算出の注目度): 1.8374319565577157
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot segmentation of point cloud remains a challenging task, as there is
no effective way to convert local point cloud information to global
representation, which hinders the generalization ability of point features. In
this study, we propose a bidirectional feature globalization (BFG) approach,
which leverages the similarity measurement between point features and prototype
vectors to embed global perception to local point features in a bidirectional
fashion. With point-to-prototype globalization (Po2PrG), BFG aggregates local
point features to prototypes according to similarity weights from dense point
features to sparse prototypes. With prototype-to-point globalization (Pr2PoG),
the global perception is embedded to local point features based on similarity
weights from sparse prototypes to dense point features. The sparse prototypes
of each class embedded with global perception are summarized to a single
prototype for few-shot 3D segmentation based on the metric learning framework.
Extensive experiments on S3DIS and ScanNet demonstrate that BFG significantly
outperforms the state-of-the-art methods.
- Abstract(参考訳): 局所的な点雲情報をグローバル表現に変換する効果的な方法はなく、点特徴の一般化能力を妨げているため、点雲のショットセグメンテーションは依然として難しい課題である。
本研究では,点特徴量とプロトタイプベクトルの類似性を利用した双方向特徴量グローバリゼーション(bfg)手法を提案する。
po2prg (point-to-prototype globalization) により、bfg は局所点特徴をプロトタイプに集約する。
プロトタイプ・ツー・ポイントのグローバル化(Pr2PoG)により、グローバルな認識は、疎いプロトタイプから高密度な特徴への類似度重みに基づく局所的な特徴に埋め込まれる。
グローバル知覚を組み込んだ各クラスのスパースプロトタイプを1つのプロトタイプにまとめ、メートル法学習フレームワークに基づいた、わずかな3dセグメンテーションを行う。
S3DISとScanNetの大規模な実験は、BFGが最先端の手法よりも著しく優れていることを示した。
関連論文リスト
- PointCore: Efficient Unsupervised Point Cloud Anomaly Detector Using
Local-Global Features [18.32982981001087]
我々は、PointCoreと呼ばれる、共同でローカル・グローバルな特徴に基づく、教師なしのポイントクラウド異常検出フレームワークを提案する。
具体的に言うと、PointCoreはローカル(コーディネート)とグローバル(PointMAE)表現を保存するために、単一のメモリバンクしか必要としない。
Real3D-ADデータセットの実験では、PointCoreは検出とローカライゼーションの両方において、競合する推論時間と最高のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-03-04T07:51:46Z) - APPT : Asymmetric Parallel Point Transformer for 3D Point Cloud
Understanding [20.87092793669536]
トランスフォーマーベースのネットワークは、3Dポイントクラウド理解において素晴らしいパフォーマンスを達成した。
これらの問題に対処するために,非対称並列点変換器(APPT)を提案する。
APPTは、ローカル詳細機能に集中しながら、ネットワーク全体を通して機能を取り込むことができる。
論文 参考訳(メタデータ) (2023-03-31T06:11:02Z) - SphereVLAD++: Attention-based and Signal-enhanced Viewpoint Invariant
Descriptor [6.326554177747699]
SphereVLAD++ は注目度が高められた視点不変位置認識手法である。
SphereVLAD++は、小さな視点や完全に逆の視点差の下で、最先端の3D位置認識手法をすべて上回ることを示す。
論文 参考訳(メタデータ) (2022-07-06T20:32:43Z) - SemAffiNet: Semantic-Affine Transformation for Point Cloud Segmentation [94.11915008006483]
ポイントクラウドセマンティックセグメンテーションのためのSemAffiNetを提案する。
我々はScanNetV2とNYUv2データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-05-26T17:00:23Z) - SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object
Detection [78.90102636266276]
SASA(Semantics-Augmented Set Abstraction)と呼ばれる新しい集合抽象化手法を提案する。
そこで本研究では, 推定点前景スコアに基づいて, より重要な前景点の維持を支援するセマンティックス誘導点サンプリングアルゴリズムを提案する。
実際には、SASAは、前景オブジェクトに関連する貴重な点を識別し、ポイントベースの3D検出のための特徴学習を改善するのに有効である。
論文 参考訳(メタデータ) (2022-01-06T08:54:47Z) - Conformer: Local Features Coupling Global Representations for Visual
Recognition [72.9550481476101]
本稿では,畳み込み操作と自己アテンション機構を利用した表現学習のためのハイブリッドネットワーク構造,conformerを提案する。
実験では、コンフォーマーが同等のパラメータ複雑性の下で視覚変換器(DeiT-B)を2.3%上回ることが示されている。
論文 参考訳(メタデータ) (2021-05-09T10:00:03Z) - 3D Object Detection with Pointformer [29.935891419574602]
本稿では,3dポイントクラウドのためのトランスフォーマーバックボーンであるpointformerを提案する。
ローカルトランスフォーマーモジュールは、オブジェクトレベルでコンテキスト依存の領域特徴を学習するローカル領域のポイント間の相互作用をモデル化するために使用される。
Global Transformerは、シーンレベルでコンテキスト対応の表現を学ぶように設計されている。
論文 参考訳(メタデータ) (2020-12-21T15:12:54Z) - DH3D: Deep Hierarchical 3D Descriptors for Robust Large-Scale 6DoF
Relocalization [56.15308829924527]
生の3D点から直接3次元特徴の検出と記述を共同で学習するシームズネットワークを提案する。
3次元キーポイントを検出するために,局所的な記述子の識別性を教師なしで予測する。
各種ベンチマーク実験により,本手法はグローバルポイントクラウド検索とローカルポイントクラウド登録の両面で競合する結果が得られた。
論文 参考訳(メタデータ) (2020-07-17T20:21:22Z) - Global-Local Bidirectional Reasoning for Unsupervised Representation
Learning of 3D Point Clouds [109.0016923028653]
局所構造とグローバル形状の双方向推論による点雲表現を人間の監督なしに学習する。
本研究では, 実世界の3次元オブジェクト分類データセットにおいて, 教師なしモデルが最先端の教師付き手法を超越していることを示す。
論文 参考訳(メタデータ) (2020-03-29T08:26:08Z) - A Rotation-Invariant Framework for Deep Point Cloud Analysis [132.91915346157018]
ネットワーク入力時に一般的な3次元カルト座標を置き換えるために,新しい低レベル純粋回転不変表現を導入する。
また,これらの表現を特徴に組み込むネットワークアーキテクチャを提案し,点とその近傍の局所的関係とグローバルな形状構造を符号化する。
本手法は, 形状分類, 部分分割, 形状検索を含む多点雲解析タスクにおいて評価する。
論文 参考訳(メタデータ) (2020-03-16T14:04:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。