論文の概要: PointTPA: Dynamic Network Parameter Adaptation for 3D Scene Understanding
- arxiv url: http://arxiv.org/abs/2604.04933v1
- Date: Mon, 06 Apr 2026 17:59:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:19.340301
- Title: PointTPA: Dynamic Network Parameter Adaptation for 3D Scene Understanding
- Title(参考訳): PointTPA:3次元シーン理解のための動的ネットワークパラメータ適応
- Authors: Siyuan Liu, Chaoqun Zheng, Xin Zhou, Tianrui Feng, Dingkang Liang, Xiang Bai,
- Abstract要約: 本研究では,シーンレベルの点群に対する入力対応ネットワークパラメータを生成するテスト時間適応フレームワークを提案する。
PointTPAはScanNetの検証で78.4%のmIoUを達成した。
- 参考スコア(独自算出の注目度): 51.98954431091292
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scene-level point cloud understanding remains challenging due to diverse geometries, imbalanced category distributions, and highly varied spatial layouts. Existing methods improve object-level performance but rely on static network parameters during inference, limiting their adaptability to dynamic scene data. We propose PointTPA, a Test-time Parameter Adaptation framework that generates input-aware network parameters for scene-level point clouds. PointTPA adopts a Serialization-based Neighborhood Grouping (SNG) to form locally coherent patches and a Dynamic Parameter Projector (DPP) to produce patch-wise adaptive weights, enabling the backbone to adjust its behavior according to scene-specific variations while maintaining a low parameter overhead. Integrated into the PTv3 structure, PointTPA demonstrates strong parameter efficiency by introducing two lightweight modules of less than 2% of the backbone's parameters. Despite this minimal parameter overhead, PointTPA achieves 78.4% mIoU on ScanNet validation, surpassing existing parameter-efficient fine-tuning (PEFT) methods across multiple benchmarks, highlighting the efficacy of our test-time dynamic network parameter adaptation mechanism in enhancing 3D scene understanding. The code is available at https://github.com/H-EmbodVis/PointTPA.
- Abstract(参考訳): 多様な地形、不均衡なカテゴリー分布、非常に多様な空間配置のため、シーンレベルの雲の理解は依然として困難である。
既存の手法ではオブジェクトレベルのパフォーマンスが向上するが、推論中に静的なネットワークパラメータに依存するため、動的なシーンデータへの適応性が制限される。
本研究では,シーンレベルの点群に対する入力対応ネットワークパラメータを生成するテスト時間パラメータ適応フレームワークであるPointTPAを提案する。
PointTPAは、SNG(Serialization-based Neighborhood Grouping)を採用し、局所的コヒーレントパッチと動的パラメータプロジェクタ(DPP)を作成してパッチワイドな重みを発生させる。
PTv3構造に統合されたPointTPAは、バックボーンのパラメータの2%未満の2つの軽量モジュールを導入することで、強力なパラメータ効率を示す。
この最小パラメータオーバーヘッドにもかかわらず、PointTPAはScanNetのバリデーションにおいて78.4% mIoUを達成し、既存のパラメータ効率の微調整(PEFT)メソッドを複数のベンチマークで上回り、3Dシーン理解の強化におけるテストタイム動的ネットワークパラメータ適応機構の有効性を強調した。
コードはhttps://github.com/H-EmbodVis/PointTPAで入手できる。
関連論文リスト
- Adapter-X: A Novel General Parameter-Efficient Fine-Tuning Framework for Vision [52.80792724919329]
本稿では,2次元画像と3次元点雲の微調整を改善するためのAdapter-Xという新しいフレームワークを提案する。
2D画像と3Dポイントの雲のモードで完全な微調整をし、パラメータが大幅に少ない、すなわち2Dと3Dの分類タスクにおいて、オリジナルのトレーニング可能なパラメータのわずか0.20%と1.88%で、初めて性能を上回った。
論文 参考訳(メタデータ) (2024-06-05T08:26:44Z) - Parameter-Efficient Fine-Tuning without Introducing New Latency [7.631596468553607]
隠れ表現の代わりに事前学習パラメータに直接アダプタを適用する新しいアダプタ技術を導入する。
提案手法は,性能と記憶効率の両面で新たな最先端性を実現し,完全微調整のパラメータは0.03%に過ぎなかった。
論文 参考訳(メタデータ) (2023-05-26T08:44:42Z) - Sensitivity-Aware Visual Parameter-Efficient Fine-Tuning [91.5113227694443]
私たちは新しいビジュアルを提案します。
Sensuous-Aware Fine-Tuning (SPT) スキーム。
SPTはタスク固有の重要な位置にトレーニング可能なパラメータを割り当てる。
ダウンストリーム認識タスクの幅広い実験により,SPTは既存のPEFT法と相補的であることが示された。
論文 参考訳(メタデータ) (2023-03-15T12:34:24Z) - Dynamic Convolution for 3D Point Cloud Instance Segmentation [146.7971476424351]
動的畳み込みに基づく3次元点雲からのインスタンスセグメンテーション手法を提案する。
我々は、同じ意味圏と閉投票を持つ等質点を幾何学的遠近点に対して収集する。
提案手法は提案不要であり、代わりに各インスタンスの空間的および意味的特性に適応する畳み込みプロセスを利用する。
論文 参考訳(メタデータ) (2021-07-18T09:05:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。