論文の概要: GAPrompt: Geometry-Aware Point Cloud Prompt for 3D Vision Model
- arxiv url: http://arxiv.org/abs/2505.04119v2
- Date: Sat, 24 May 2025 07:24:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 14:32:54.654322
- Title: GAPrompt: Geometry-Aware Point Cloud Prompt for 3D Vision Model
- Title(参考訳): GA Prompt:3次元ビジョンモデルのための幾何学的視点クラウドプロンプト
- Authors: Zixiang Ai, Zichen Liu, Yuanhang Lei, Zhenyu Cui, Xu Zou, Jiahuan Zhou,
- Abstract要約: 本稿では,3次元視覚モデルの適応性を高めるため,新しいGeometry-Aware Point Cloud Prompt (GAPrompt)を提案する。
まず、元の点雲と共に補助的な入力として機能する点プロンプトを導入し、そのモデルにきめ細かな幾何学的詳細を捉えるよう指示する。
また、点雲から大域的な形状情報を抽出し、入力レベルでのインスタンス固有の幾何調整を可能にするポイントシフトプロンプタを提案する。
- 参考スコア(独自算出の注目度): 14.751171445102626
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pre-trained 3D vision models have gained significant attention for their promising performance on point cloud data. However, fully fine-tuning these models for downstream tasks is computationally expensive and storage-intensive. Existing parameter-efficient fine-tuning (PEFT) approaches, which focus primarily on input token prompting, struggle to achieve competitive performance due to their limited ability to capture the geometric information inherent in point clouds. To address this challenge, we propose a novel Geometry-Aware Point Cloud Prompt (GAPrompt) that leverages geometric cues to enhance the adaptability of 3D vision models. First, we introduce a Point Prompt that serves as an auxiliary input alongside the original point cloud, explicitly guiding the model to capture fine-grained geometric details. Additionally, we present a Point Shift Prompter designed to extract global shape information from the point cloud, enabling instance-specific geometric adjustments at the input level. Moreover, our proposed Prompt Propagation mechanism incorporates the shape information into the model's feature extraction process, further strengthening its ability to capture essential geometric characteristics. Extensive experiments demonstrate that GAPrompt significantly outperforms state-of-the-art PEFT methods and achieves competitive results compared to full fine-tuning on various benchmarks, while utilizing only 2.19% of trainable parameters. Our code is available at https://github.com/zhoujiahuan1991/ICML2025-VGP.
- Abstract(参考訳): 事前トレーニングされた3Dビジョンモデルは、ポイントクラウドデータにおける有望なパフォーマンスに対して大きな注目を集めている。
しかし、これらのモデルを下流タスク向けに完全に微調整することは、計算コストが高く、ストレージ集約である。
既存のパラメータ効率細調整(PEFT)アプローチは、主に入力トークンのプロンプトに重点を置いており、点雲に固有の幾何情報を取得する能力に制限があるため、競争性能を達成するのに苦労している。
この課題に対処するために,幾何学的手がかりを活用して3次元視覚モデルの適応性を高める新しいGeometry-Aware Point Cloud Prompt (GAPrompt)を提案する。
まず、元の点雲と共に補助的な入力として機能する点プロンプトを導入し、そのモデルにきめ細かな幾何学的詳細を捉えるよう指示する。
さらに、点雲から大域的な形状情報を抽出し、入力レベルでのインスタンス固有の幾何調整を可能にするポイントシフトプロンプタを提案する。
さらに,提案するPrompt Propagation機構では,形状情報をモデルの特徴抽出プロセスに組み込んで,重要な幾何学的特徴を捉える能力を強化する。
GAPromptは、訓練可能なパラメータの2.19%しか利用せずに、最先端のPEFT法を著しく上回り、様々なベンチマークの完全な微調整に比べて競争的な結果が得られることを示した。
私たちのコードはhttps://github.com/zhoujiahuan 1991/ICML2025-VGPで利用可能です。
関連論文リスト
- Position-aware Guided Point Cloud Completion with CLIP Model [25.084811702682778]
本稿では,単一モーダルフレームワークをマルチモーダルフレームワークに拡張するための迅速かつ効率的な手法を提案する。
このアプローチには、欠落部分の空間情報を強化するために設計された位置認識モジュールが組み込まれている。
さらに,既存の単調なクラウド補完データセットに基づいて,PCI-TIとMVP-TIの3重画像コーパスを確立する。
論文 参考訳(メタデータ) (2024-12-11T10:43:11Z) - ParaPoint: Learning Global Free-Boundary Surface Parameterization of 3D Point Clouds [52.03819676074455]
ParaPointは、グローバルな自由境界面パラメータ化を実現するための教師なしのニューラルネットワークパイプラインである。
この研究は、グローバルマッピングと自由境界の両方を追求するニューラルポイントクラウドパラメータ化を調査する最初の試みである。
論文 参考訳(メタデータ) (2024-03-15T14:35:05Z) - Point-PEFT: Parameter-Efficient Fine-Tuning for 3D Pre-trained Models [46.42092771753465]
我々は、最小限の学習可能なパラメータを持つポイントクラウド事前学習モデルに適用するための新しいフレームワークであるPoint-PEFTを紹介する。
具体的には、事前訓練された3Dモデルに対して、パラメータの大部分を凍結し、新たに追加されたPEFTモジュールを下流タスクでチューニングする。
論文 参考訳(メタデータ) (2023-10-04T16:49:36Z) - AdaPoinTr: Diverse Point Cloud Completion with Adaptive Geometry-Aware
Transformers [94.11915008006483]
本稿では,ポイントクラウドの完了をセット・ツー・セットの翻訳問題として再定義する手法を提案する。
我々は、ポイントクラウド補完のためにTransformerエンコーダデコーダアーキテクチャを採用したPoinTrと呼ばれる新しいモデルを設計する。
本手法は,PCNで6.53 CD,ShapeNet-55で0.81 CD,現実世界のKITTIで0.392 MMDを実現する。
論文 参考訳(メタデータ) (2023-01-11T16:14:12Z) - P2P: Tuning Pre-trained Image Models for Point Cloud Analysis with
Point-to-Pixel Prompting [94.11915008006483]
本稿では,ポイントクラウド解析のための新しいポイント・ツー・Pixelを提案する。
ScanObjectNNの最も難しい設定では,89.3%の精度が得られる。
また,本フレームワークは,ModelNet分類とShapeNet Part Codeで非常に競争力のある性能を示す。
論文 参考訳(メタデータ) (2022-08-04T17:59:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。