論文の概要: PointRFT: Explicit Reinforcement Fine-tuning for Point Cloud Few-shot Learning
- arxiv url: http://arxiv.org/abs/2603.23957v1
- Date: Wed, 25 Mar 2026 05:36:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.146952
- Title: PointRFT: Explicit Reinforcement Fine-tuning for Point Cloud Few-shot Learning
- Title(参考訳): PointRFT:Point Cloud Few-shot Learningのための明示的な強化微調整
- Authors: Yankai Wang, Yiding Sun, Qirui Wang, Pengbo Li, Chaoyi Lu, Dongxu Zhang,
- Abstract要約: 我々は,ポイントクラウド表現学習に特化した,最初の強化微調整パラダイムであるPointRFTを提案する。
PointRFTは様々なベンチマークでバニラ教師付き微調整(SFT)を一貫して上回っている。
ハイブリッドなPretraining-SFT-RFTパラダイムに統合されると、ポイントクラウド基盤モデルの表現能力は実質的に解放される。
- 参考スコア(独自算出の注目度): 12.771216755928117
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding spatial dynamics and semantics in point cloud is fundamental for comprehensive 3D comprehension. While reinforcement learning algorithms such as Group Relative Policy Optimization (GRPO) have recently achieved remarkable breakthroughs in large language models by incentivizing reasoning capabilities through strategic reward design, their potential remains largely unexplored in the 3D perception domain. This naturally raises a pivotal question: Can RL-based methods effectively empower 3D point cloud fine-tuning? In this paper, we propose PointRFT, the first reinforcement fine-tuning paradigm tailored specifically for point cloud representation learning. We select three prevalent 3D foundation models and devise specialized accuracy reward and dispersion reward functions to stabilize training and mitigate distribution shifts. Through comprehensive few-shot classification experiments comparing distinct training paradigms, we demonstrate that PointRFT consistently outperforms vanilla supervised fine-tuning (SFT) across diverse benchmarks. Furthermore, when organically integrated into a hybrid Pretraining-SFT-RFT paradigm, the representational capacity of point cloud foundation models is substantially unleashed, achieving state-of-the-art performance particularly under data-scarce scenarios.
- Abstract(参考訳): 点クラウドにおける空間力学と意味論の理解は、包括的3次元理解に不可欠である。
Group Relative Policy Optimization (GRPO) のような強化学習アルゴリズムは、近年、戦略的な報酬設計を通じて推論能力を高めることで、大きな言語モデルにおいて顕著なブレークスルーを達成したが、そのポテンシャルは3D知覚領域においてほとんど解明されていない。
RLベースの手法は、3Dポイントクラウドの微調整を効果的に強化できますか?
本稿では,ポイントクラウド表現学習に特化した,最初の強化微調整パラダイムであるPointRFTを提案する。
3つの一般的な3次元基礎モデルを選択し、トレーニングを安定させ、分散シフトを軽減するために、特殊精度報酬関数と分散報酬関数を考案する。
異なるトレーニングパラダイムを比較した総合的な数ショット分類実験を通じて、PointRFTは様々なベンチマークでバニラ教師付き微調整(SFT)を一貫して上回っていることを実証する。
さらに,ハイブリッドなPretraining-SFT-RFTパラダイムに有機的に統合されると,ポイントクラウド基盤モデルの表現能力は著しく低下し,特にデータスカースシナリオ下での最先端のパフォーマンスが達成される。
関連論文リスト
- Adaptive Point-Prompt Tuning: Fine-Tuning Heterogeneous Foundation Models for 3D Point Cloud Analysis [51.37795317716487]
本稿では,パラメータの少ない事前学習モデルを微調整するAdaptive Point-Prompt Tuning (APPT)法を提案する。
局所幾何学を集約することで原点雲を点埋め込みに変換し、空間的特徴を捉える。
任意のモダリティのソース領域から3Dへの自己アテンションを校正するために,重みを点埋め込みモジュールと共有するプロンプトジェネレータを導入する。
論文 参考訳(メタデータ) (2025-08-30T06:02:21Z) - UniPre3D: Unified Pre-training of 3D Point Cloud Models with Cross-Modal Gaussian Splatting [64.31900521467362]
既存の事前学習方法は、オブジェクトレベルとシーンレベルの両方の点群に対して等しく有効である。
UniPre3Dは,任意のスケールの点群やアーキテクチャの3Dモデルに対してシームレスに適用可能な,最初の統合事前学習手法である。
論文 参考訳(メタデータ) (2025-06-11T17:23:21Z) - Masked Generative Extractor for Synergistic Representation and 3D Generation of Point Clouds [6.69660410213287]
我々は,3次元表現学習と生成学習を深く統合する利点を探るため,Point-MGEと呼ばれる革新的なフレームワークを提案する。
形状分類において、Point-MGEはModelNet40データセットで94.2%(+1.0%)、ScanObjectNNデータセットで92.9%(+5.5%)の精度を達成した。
また,非条件条件と条件条件条件条件の両方で,Point-MGEが高品質な3D形状を生成可能であることを確認した。
論文 参考訳(メタデータ) (2024-06-25T07:57:03Z) - Point Cloud Pre-training with Diffusion Models [62.12279263217138]
我々は、ポイントクラウド拡散事前学習(PointDif)と呼ばれる新しい事前学習手法を提案する。
PointDifは、分類、セグメンテーション、検出など、さまざまな下流タスクのために、さまざまな現実世界のデータセット間で大幅に改善されている。
論文 参考訳(メタデータ) (2023-11-25T08:10:05Z) - Human as Points: Explicit Point-based 3D Human Reconstruction from Single-view RGB Images [71.91424164693422]
我々はHaPと呼ばれる明示的なポイントベース人間再構築フレームワークを導入する。
提案手法は,3次元幾何学空間における完全明示的な点雲推定,操作,生成,洗練が特徴である。
我々の結果は、完全に明示的で幾何学中心のアルゴリズム設計へのパラダイムのロールバックを示すかもしれない。
論文 参考訳(メタデータ) (2023-11-06T05:52:29Z) - Triangle-Net: Towards Robustness in Point Cloud Learning [0.0]
本稿では, 回転, 位置シフト, スケーリングに対する不変性を同時に実現し, 点間隔に頑健な3次元分類手法を提案する。
提案手法は,ModelNet 40分類タスクにおいて,ポイントネットと3DmFVをそれぞれ35.0%,28.1%で上回っている。
論文 参考訳(メタデータ) (2020-02-27T20:42:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。