論文の概要: White Aggregation and Restoration for Few-shot 3D Point Cloud Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2509.13907v1
- Date: Wed, 17 Sep 2025 11:13:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-18 18:41:50.829955
- Title: White Aggregation and Restoration for Few-shot 3D Point Cloud Semantic Segmentation
- Title(参考訳): ショット3次元クラウドセマンティックセマンティックセマンティックセグメンテーションの白集合と復元
- Authors: Jiyun Im, SuBeen Lee, Miso Lee, Jae-Pil Heo,
- Abstract要約: Few-Shot 3D Point Cloud (FS-PCS) は、ラベルなしのポイントクラウドに対してポイント単位のラベルを予測することを目的としている。
既存の手法は、遠点サンプリングのような従来のアルゴリズムを用いてプロトタイプを構築している。
これにより,注意機構に基づく先進的なプロトタイプ生成手法を探求する動機付けとなる。
- 参考スコア(独自算出の注目度): 35.453687085580306
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Few-Shot 3D Point Cloud Segmentation (FS-PCS) aims to predict per-point labels for an unlabeled point cloud, given only a few labeled examples. To extract discriminative representations from the limited support set, existing methods have constructed prototypes using conventional algorithms such as farthest point sampling. However, we point out that its initial randomness significantly affects FS-PCS performance and that the prototype generation process remains underexplored despite its prevalence. This motivates us to investigate an advanced prototype generation method based on attention mechanism. Despite its potential, we found that vanilla module suffers from the distributional gap between learnable prototypical tokens and support features. To overcome this, we propose White Aggregation and Restoration Module (WARM), which resolves the misalignment by sandwiching cross-attention between whitening and coloring transformations. Specifically, whitening aligns the support features to prototypical tokens before attention process, and subsequently coloring restores the original distribution to the attended tokens. This simple yet effective design enables robust attention, thereby generating representative prototypes by capturing the semantic relationships among support features. Our method achieves state-of-the-art performance with a significant margin on multiple FS-PCS benchmarks, demonstrating its effectiveness through extensive experiments.
- Abstract(参考訳): Few-Shot 3D Point Cloud Segmentation (FS-PCS)は、ラベルなしのポイントクラウドのポイント単位のラベルを予測することを目的としている。
制限されたサポートセットから識別表現を抽出するために、既存の手法では、最遠点サンプリングのような従来のアルゴリズムを用いてプロトタイプを構築している。
しかし,その初期ランダム性はFS-PCSの性能に大きく影響し,プロトタイプ生成プロセスは有病率にもかかわらず未探索のままである。
これにより,注意機構に基づく先進的なプロトタイプ生成手法を探求する動機付けとなる。
その可能性にもかかわらず,バニラモジュールは学習可能な原型トークンとサポート機能の間の分散的ギャップに悩まされていることがわかった。
これを解決するために,白着色変換と白着色変換のクロスアテンションを挟み込むことにより,不整合を解消するWhite Aggregation and Restoration Module (WARM)を提案する。
具体的には、ホワイトニングは注意プロセスの前にサポート機能を原型トークンに整列させ、その後に着色することで、参加トークンへの元の分布を復元する。
このシンプルで効果的な設計は、頑健な注意を喚起し、サポート機能間のセマンティックな関係をキャプチャすることで、代表プロトタイプを生成する。
提案手法は,複数のFS-PCSベンチマークにおいて有意差のある最先端性能を実現し,その有効性を示す。
関連論文リスト
- Learning Clustering-based Prototypes for Compositional Zero-shot Learning [56.57299428499455]
ClusProは、コンポジションゼロショット学習のための堅牢なクラスタリングベースのプロトタイプマイニングフレームワークである。
それは、多様化されたプロトタイプの集合を通じて、プリミティブの概念的境界を定義する。
ClusProは、学習可能なパラメータを追加することなく、非パラメトリックな方法でプロトタイプクラスタリングを効率的に実行する。
論文 参考訳(メタデータ) (2025-02-10T14:20:01Z) - Subspace Prototype Guidance for Mitigating Class Imbalance in Point Cloud Semantic Segmentation [23.250178208474928]
本稿では,サブスペースのプロトタイプガイダンス(textbfSPG)を用いて,セグメンテーションネットワークのトレーニングを指導する手法を提案する。
提案手法はセグメンテーション性能を大幅に向上し,最先端の手法を超越する。
論文 参考訳(メタデータ) (2024-08-20T04:31:46Z) - Uncovering Prototypical Knowledge for Weakly Open-Vocabulary Semantic
Segmentation [59.37587762543934]
本稿では,弱開語彙セマンティックセマンティックセグメンテーション(WOVSS)の問題点について検討する。
既存の方法は、グループトークンの使用に関する粒度の矛盾に悩まされる。
マルチモーダル正規化を組み込んだプロトタイプ誘導ネットワーク(PGSeg)を提案する。
論文 参考訳(メタデータ) (2023-10-29T13:18:00Z) - Boosting Few-shot 3D Point Cloud Segmentation via Query-Guided
Enhancement [30.017448714419455]
本稿では,PC-FSSモデルの改良手法を提案する。
従来のPC-FSSでは,クエリサンプルの新規クラスを識別するために,サポートプロトタイプのカテゴリ情報を直接活用する手法とは異なり,モデル性能を著しく向上させる2つの重要な側面を同定する。
論文 参考訳(メタデータ) (2023-08-06T18:07:45Z) - Position-Guided Point Cloud Panoptic Segmentation Transformer [118.17651196656178]
この作業は、LiDARベースのポイントクラウドセグメンテーションにこの魅力的なパラダイムを適用し、シンプルだが効果的なベースラインを得ることから始まります。
スパース点雲のインスタンスはシーン全体に対して比較的小さく、しばしば類似した形状を持つが、画像領域では珍しいセグメンテーションの外観が欠如している。
position-guided Point cloud Panoptic segmentation transFormer (P3Former) と名付けられたこの手法は、Semantic KITTI と nuScenes のベンチマークでそれぞれ3.4%、そして 1.2%の性能をそれぞれ上回っている。
論文 参考訳(メタデータ) (2023-03-23T17:59:02Z) - Beyond the Prototype: Divide-and-conquer Proxies for Few-shot
Segmentation [63.910211095033596]
少ないショットのセグメンテーションは、少数の濃密なラベル付けされたサンプルのみを与えられた、目に見えないクラスオブジェクトをセグメンテーションすることを目的としている。
分割・分散の精神において, 単純かつ多目的な枠組みを提案する。
提案手法は、DCP(disvision-and-conquer proxies)と呼ばれるもので、適切な信頼性のある情報の開発を可能にする。
論文 参考訳(メタデータ) (2022-04-21T06:21:14Z) - Prototype Completion for Few-Shot Learning [13.63424509914303]
少数ショット学習は、いくつかの例で新しいクラスを認識することを目的としている。
事前学習に基づく手法は,特徴抽出器を事前学習し,最寄りのセントロイド型メタラーニングを通して微調整することで,この問題に効果的に対処する。
本稿では,完成度に基づくメタラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-11T03:44:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。