論文の概要: Point-PRC: A Prompt Learning Based Regulation Framework for Generalizable Point Cloud Analysis
- arxiv url: http://arxiv.org/abs/2410.20406v1
- Date: Sun, 27 Oct 2024 10:35:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-29 12:22:41.405475
- Title: Point-PRC: A Prompt Learning Based Regulation Framework for Generalizable Point Cloud Analysis
- Title(参考訳): Point-PRC: 一般化可能なポイントクラウド分析のためのプロンプト学習ベースの規則フレームワーク
- Authors: Hongyu Sun, Qiuhong Ke, Yongcai Wang, Wang Chen, Kang Yang, Deying Li, Jianfei Cai,
- Abstract要約: 近年の研究では、パラメータ効率のよいプロンプトチューニングにより、3次元点雲認識の性能が著しく向上できることが示されている。
本稿では,学習可能なプロンプトが大規模3次元モデルにおいて,よく学習された一般知識と積極的に対話することを可能にする包括的規制フレームワークを提案する。
意外なことに,本手法は,一貫した一般化能力の向上だけでなく,様々な3DDGベンチマークにおけるタスク固有の3D認識性能を明確なマージンで向上させる。
- 参考スコア(独自算出の注目度): 39.85109385954641
- License:
- Abstract: This paper investigates the 3D domain generalization (3DDG) ability of large 3D models based on prevalent prompt learning. Recent works demonstrate the performances of 3D point cloud recognition can be boosted remarkably by parameter-efficient prompt tuning. However, we observe that the improvement on downstream tasks comes at the expense of a severe drop in 3D domain generalization. To resolve this challenge, we present a comprehensive regulation framework that allows the learnable prompts to actively interact with the well-learned general knowledge in large 3D models to maintain good generalization. Specifically, the proposed framework imposes multiple explicit constraints on the prompt learning trajectory by maximizing the mutual agreement between task-specific predictions and task-agnostic knowledge. We design the regulation framework as a plug-and-play module to embed into existing representative large 3D models. Surprisingly, our method not only realizes consistently increasing generalization ability but also enhances task-specific 3D recognition performances across various 3DDG benchmarks by a clear margin. Considering the lack of study and evaluation on 3DDG, we also create three new benchmarks, namely base-to-new, cross-dataset and few-shot generalization benchmarks, to enrich the field and inspire future research. Code and benchmarks are available at \url{https://github.com/auniquesun/Point-PRC}.
- Abstract(参考訳): 本稿では,大規模3次元モデルの3次元領域一般化(DDG)能力について検討する。
近年の研究では、パラメータ効率のよいプロンプトチューニングにより、3次元点雲認識の性能が著しく向上できることが示されている。
しかし,ダウンストリームタスクの改善は,3次元領域の一般化の大幅な削減を犠牲にしている。
この課題を解決するために、学習可能なプロンプトが、大規模3次元モデルにおいてよく学習された一般的な知識と積極的に対話し、優れた一般化を維持するための包括的な規制フレームワークを提案する。
具体的には,タスク固有の予測とタスクに依存しない知識の相互一致を最大化することにより,素早い学習軌道に複数の明示的な制約を課す。
我々は,既存の代表的な3Dモデルに組み込むプラグイン・アンド・プレイモジュールとして,規制フレームワークを設計する。
意外なことに,本手法は,一貫した一般化能力の向上だけでなく,様々な3DDGベンチマークにおけるタスク固有の3D認識性能を明確なマージンで向上させる。
3DDGの研究と評価の欠如を考えると、我々はさらに3つの新しいベンチマーク、すなわちベース・ツー・ニュー、クロス・データセット、および少数ショットの一般化ベンチマークを作成し、この分野を充実させ、将来の研究を刺激する。
コードとベンチマークは \url{https://github.com/auniquesun/Point-PRC} で公開されている。
関連論文リスト
- Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - Point-DETR3D: Leveraging Imagery Data with Spatial Point Prior for Weakly Semi-supervised 3D Object Detection [32.86369670395974]
本稿では,弱半教師付き3D検出のための教師支援フレームワークであるPoint-DETR3Dを紹介する。
ラベル付きデータの5%しか持たないPoint-DETR3Dは、完全な教師付きデータのパフォーマンスを90%以上達成している。
論文 参考訳(メタデータ) (2024-03-22T16:11:29Z) - A Survey on 3D Gaussian Splatting [51.96747208581275]
3D Gaussian splatting (GS) は、明示的なラディアンス場とコンピュータグラフィックスの領域において、トランスフォーメーション技術として登場した。
本稿では,3D GSの領域における最近の発展と重要な貢献について,初めて体系的に概説する。
前例のないレンダリング速度を実現することで、3D GSは、仮想現実からインタラクティブメディアなど、数多くのアプリケーションを開くことができる。
論文 参考訳(メタデータ) (2024-01-08T13:42:59Z) - A Review and A Robust Framework of Data-Efficient 3D Scene Parsing with
Traditional/Learned 3D Descriptors [10.497309421830671]
既存の最先端の3Dポイントクラウド理解手法は、完全に教師された方法でのみうまく機能する。
この研究は、ラベルが限定されている場合のポイントクラウド理解に取り組むための、汎用的でシンプルなフレームワークを提供する。
論文 参考訳(メタデータ) (2023-12-03T02:51:54Z) - Multi-View Fusion and Distillation for Subgrade Distresses Detection
based on 3D-GPR [19.49863426864145]
本稿では,3D-GPRデータからの多視点情報を活用することで,下級災害検知タスクの新たな手法を提案する。
マルチビューGPRデータセットを最適に活用するための新しいtextbfMulti-textbfView textbfVusion と textbfDistillation フレームワーク textbfGPR-MVFD を開発した。
論文 参考訳(メタデータ) (2023-08-09T08:06:28Z) - 3D Spatial Recognition without Spatially Labeled 3D [127.6254240158249]
Weakly-supervised framework for Point cloud Recognitionを紹介する。
We show that WyPR can detected and segment objects in point cloud data without access any space labels at training time。
論文 参考訳(メタデータ) (2021-05-13T17:58:07Z) - Gram Regularization for Multi-view 3D Shape Retrieval [3.655021726150368]
本稿では,グラム正規化という新しい正規化用語を提案する。
重みカーネル間の分散を強要することにより、正規化器は識別的特徴を抽出するのに役立つ。
提案したグラム正規化はデータ独立であり、ベルやホイッスルを使わずに安定かつ迅速に収束することができる。
論文 参考訳(メタデータ) (2020-11-16T05:37:24Z) - Improving Point Cloud Semantic Segmentation by Learning 3D Object
Detection [102.62963605429508]
ポイントクラウドセマンティックセグメンテーションは、自動運転において重要な役割を果たす。
現在の3Dセマンティックセグメンテーションネットワークは、よく表現されたクラスに対して優れた性能を発揮する畳み込みアーキテクチャに焦点を当てている。
Aware 3D Semantic Detection (DASS) フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-22T14:17:40Z) - PointContrast: Unsupervised Pre-training for 3D Point Cloud
Understanding [107.02479689909164]
本研究では,3次元表現学習の研究を支援することを目的とする。
教師なし事前学習が3Dシーンの大規模なソースセットに与える影響を計測する。
論文 参考訳(メタデータ) (2020-07-21T17:59:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。