論文の概要: Multimodal Robust Prompt Distillation for 3D Point Cloud Models
- arxiv url: http://arxiv.org/abs/2511.21574v1
- Date: Wed, 26 Nov 2025 16:49:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-27 18:37:59.203511
- Title: Multimodal Robust Prompt Distillation for 3D Point Cloud Models
- Title(参考訳): 3次元点雲モデルのためのマルチモーダルロバストプロンプト蒸留
- Authors: Xiang Gu, Liming Lu, Xu Zheng, Anan Du, Yongbin Zhou, Shuchao Pang,
- Abstract要約: アドリアックは、学習ベースの3Dポイントクラウドモデルに重大な脅威をもたらす。
頑健な3次元点雲を蒸留するためのMRPD (Multimodal Robust Prompt Distillation) を提案する。
学生ポイントクラウドモデルの機能を、3つの異なる教師の堅牢な埋め込みと整合させることで、軽量なプロンプトを学ぶ。
- 参考スコア(独自算出の注目度): 16.319048523015773
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Adversarial attacks pose a significant threat to learning-based 3D point cloud models, critically undermining their reliability in security-sensitive applications. Existing defense methods often suffer from (1) high computational overhead and (2) poor generalization ability across diverse attack types. To bridge these gaps, we propose a novel yet efficient teacher-student framework, namely Multimodal Robust Prompt Distillation (MRPD) for distilling robust 3D point cloud model. It learns lightweight prompts by aligning student point cloud model's features with robust embeddings from three distinct teachers: a vision model processing depth projections, a high-performance 3D model, and a text encoder. To ensure a reliable knowledge transfer, this distillation is guided by a confidence-gated mechanism which dynamically balances the contribution of all input modalities. Notably, since the distillation is all during the training stage, there is no additional computational cost at inference. Extensive experiments demonstrate that MRPD substantially outperforms state-of-the-art defense methods against a wide range of white-box and black-box attacks, while even achieving better performance on clean data. Our work presents a new, practical paradigm for building robust 3D vision systems by efficiently harnessing multimodal knowledge.
- Abstract(参考訳): 敵対的攻撃は、学習ベースの3Dポイントクラウドモデルに重大な脅威をもたらし、セキュリティに敏感なアプリケーションにおける信頼性を著しく損なう。
既存の防御手法は、(1)高い計算オーバーヘッドと(2)多様な攻撃タイプにまたがる一般化能力に悩まされることが多い。
これらのギャップを埋めるために,我々は,頑健な3Dポイントクラウドモデルを蒸留するための,マルチモーダルロバスト・プロンプト蒸留(MRPD)という,効率的で効率的な教師学習フレームワークを提案する。
学生ポイントクラウドモデルの機能を、3つの異なる教師の堅牢な埋め込み(ビジョンモデル処理深度予測、高性能3Dモデル、テキストエンコーダ)に合わせることで、軽量なプロンプトを学ぶ。
信頼性の高い知識伝達を保証するため、この蒸留は全ての入力モダリティの寄与を動的に均衡させる信頼誘導機構によって誘導される。
特に、蒸留は訓練段階にあるため、推論に追加の計算コストはかからない。
MRPDは、幅広いホワイトボックスやブラックボックス攻撃に対して、最先端の防御手法を著しく上回り、クリーンなデータでもパフォーマンスが向上することを示した。
本研究は,マルチモーダル知識を効果的に活用し,ロバストな3次元視覚システムを構築するための,新しい実用的なパラダイムを提案する。
関連論文リスト
- Exploiting Point-Language Models with Dual-Prompts for 3D Anomaly Detection [31.377138253827603]
3次元点雲における異常検出は、幅広い産業応用において不可欠である。
3D Anomaly dEtection (PLANE) のためのデュアルプロンプトを用いた新しいポイント・ランゲージモデルを提案する。
論文 参考訳(メタデータ) (2025-02-16T23:10:57Z) - A Lesson in Splats: Teacher-Guided Diffusion for 3D Gaussian Splats Generation with 2D Supervision [65.33043028101471]
本稿では,2次元監視のみを用いた3次元画像調和拡散モデルの学習フレームワークを提案する。
既存の3D生成モデルは、大規模な3Dデータセットが不足しているため、完全に3Dの監視に依存している。
論文 参考訳(メタデータ) (2024-12-01T00:29:57Z) - Transferable 3D Adversarial Shape Completion using Diffusion Models [8.323647730916635]
3Dポイントクラウド機能学習は、3Dディープラーニングモデルのパフォーマンスを大幅に改善した。
既存の攻撃方法は、主にホワイトボックスのシナリオに焦点を当てており、最近提案された3Dディープラーニングモデルへの移行に苦労している。
本稿では,拡散モデルを用いて高品質な対向点雲を生成する。
提案した攻撃は、ブラックボックスモデルとディフェンスの両方に対して、最先端の敵攻撃法より優れている。
論文 参考訳(メタデータ) (2024-07-14T04:51:32Z) - 4D Contrastive Superflows are Dense 3D Representation Learners [62.433137130087445]
我々は,LiDARとカメラのペアを連続的に利用して事前学習の目的を確立するための,新しいフレームワークであるSuperFlowを紹介する。
学習効率をさらに向上するため,カメラビューから抽出した知識の整合性を高めるプラグイン・アンド・プレイ・ビュー・一貫性モジュールを組み込んだ。
論文 参考訳(メタデータ) (2024-07-08T17:59:54Z) - Eidos: Efficient, Imperceptible Adversarial 3D Point Clouds [16.604139389480615]
Eidosは、3D pOintクラウドSに対して効果的な非受容性アディバーサリアルアタックを提供するフレームワークである。
本稿では,3次元pOintクラウドSに対して,効率的な非知覚的アディバーサリアルアタックを提供するフレームワークであるEidosを提示することで,敵攻撃の理解を深める。
論文 参考訳(メタデータ) (2024-05-23T06:09:08Z) - PCLD: Point Cloud Layerwise Diffusion for Adversarial Purification [0.8192907805418583]
ポイントクラウドは、ロボット工学、自律運転、拡張現実など、さまざまな現実世界のアプリケーションに広く利用されている。
モデルの堅牢性を評価する典型的な方法は、敵攻撃によるものである。
本稿では, 層状拡散に基づく3次元ポイントクラウド防衛戦略であるポイントクラウド層拡散(PCLD)を提案する。
論文 参考訳(メタデータ) (2024-03-11T13:13:10Z) - Leveraging Large-Scale Pretrained Vision Foundation Models for
Label-Efficient 3D Point Cloud Segmentation [67.07112533415116]
本稿では3Dポイントクラウドセグメンテーションタスクに様々な基礎モデルを適用する新しいフレームワークを提案する。
我々のアプローチでは、異なる大きな視覚モデルを用いて2次元セマンティックマスクの初期予測を行う。
本研究では,ロバストな3Dセマンティックな擬似ラベルを生成するために,投票による全ての結果を効果的に組み合わせたセマンティックなラベル融合戦略を提案する。
論文 参考訳(メタデータ) (2023-11-03T15:41:15Z) - AdvMono3D: Advanced Monocular 3D Object Detection with Depth-Aware
Robust Adversarial Training [64.14759275211115]
そこで本研究では,DART3Dと呼ばれるモノクル3次元物体検出のための,深度対応の頑健な対向学習法を提案する。
我々の敵の訓練アプローチは、本質的な不確実性に乗じて、敵の攻撃に対する堅牢性を大幅に向上させる。
論文 参考訳(メタデータ) (2023-09-03T07:05:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。