論文の概要: SPACE: Source-free Proxy Anchor Concept Erasure for MLLMs
- arxiv url: http://arxiv.org/abs/2606.09868v1
- Date: Mon, 01 Jun 2026 03:31:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:57.976142
- Title: SPACE: Source-free Proxy Anchor Concept Erasure for MLLMs
- Title(参考訳): SPACE:MLLMのソースフリープロキシアンカー概念消去
- Authors: Zhijing Zhang, Jiaqi Ding, Qianshan Wei, Nan Zhou, Jiaqi Li, Yongliang Wu, Tongxin Zhu, Xiaolin Fang,
- Abstract要約: Source-free Proxy Anchor Concept Erasure (SPACE)は、MLLMに特化した最初のオープンソースフリーのアンラーニングフレームワークである。
本研究では、SPACEが最先端のデータ依存手法に匹敵する性能を実現し、ソースフリーMUシナリオにおけるその有効性を検証した。
- 参考スコア(独自算出の注目度): 12.326367016305083
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As Multimodal Large Language Models (MLLMs) face growing privacy risks and regulatory constraints, machine unlearning (MU) has emerged as a crucial solution for removing sensitive data while preserving model performance. However, existing MU methods typically rely on visual data of the target concepts, which is often unavailable due to strict data retention policies, thus creating a demand for source-free unlearning approaches that operate without access to the target data. In this work, we propose Source-free Proxy Anchor Concept Erasure (SPACE), the first source-free unlearning framework specialized for MLLMs. SPACE consists of two stages: (1) Text-Guided Proxy Anchor Selection (TPAS), which retrieves semantically aligned proxy anchors from the shared feature space. (2) Dual-Constraint Semantic Isolation (DCSI), which optimizes these anchors to indirectly erase target concepts. DCSI confines updates to the null space of retained knowledge, ensuring structural integrity. We theoretically prove that SPACE strictly bounds the perturbation on retained knowledge and maximizes feature spectral entropy, thereby maintaining the model's performance. Furthermore, extensive experiments across six datasets show that SPACE achieves performance comparable to that of state-of-the-art data-dependent methods, validating its effectiveness in source-free MU scenarios. The source code will be released.
- Abstract(参考訳): MLLM(Multimodal Large Language Models)は、プライバシのリスクと規制上の制約の増大に直面しているため、マシンアンラーニング(MU)は、モデルのパフォーマンスを維持しながら機密データを削除するための重要なソリューションとして登場した。
しかし、既存のMUメソッドは通常、ターゲットのコンセプトの視覚的データに依存しており、厳密なデータ保持ポリシーのためにしばしば利用できない。
本研究では,オープンソースフリーのプロキシーアンカー概念消去(SPACE)を提案する。
SPACEは、(1)テキストガイドによるプロキシアンカー選択(TPAS)という2つのステージで構成され、共有機能空間からセマンティックに整列されたプロキシアンカーを検索する。
2) ターゲット概念を間接的に消去するアンカーを最適化したDCSI(Dual-Constraint Semantic isolation)。
DCSIは、保持された知識のnull空間への更新を制限し、構造的整合性を保証する。
理論的には、SPACEは保持された知識の摂動を厳密に拘束し、特徴スペクトルエントロピーを最大化し、モデルの性能を維持する。
さらに、6つのデータセットにわたる広範な実験により、SPACEは最先端のデータ依存手法に匹敵する性能を達成し、ソースフリーMUシナリオにおけるその有効性を検証している。
ソースコードはリリースされます。
関連論文リスト
- Less is More: Geometric Unlearning for LLMs with Minimal Data Disclosure [10.0091317316944]
Geometric Unlearning (GU) は、オリジナルのトレーニングコーパスにアクセスすることなく、モデルの迅速な計画状態を直接操作する。
GUは、小さな安全な参照プロンプトから所望の安全行動のコンパクトで低ランクな幾何学を蒸留する。
合成非ターゲットアンカーの教師蒸留レギュレータは、さらに横方向のドリフトを減少させる。
論文 参考訳(メタデータ) (2026-05-03T06:20:03Z) - Unleashing MLLMs on the Edge: A Unified Framework for Cross-Modal ReID via Adaptive SVD Distillation [48.88299242238335]
CM-ReID(Cross-Modal Re-identification)は、特別なクラウドモデルの断片化されたエコシステムを維持するため、課題に直面している。
我々は,強力なクラウドエッジアーキテクチャに基づく統一フレームワークであるMLLMEmbed-ReIDを提案する。
論文 参考訳(メタデータ) (2026-02-13T13:48:08Z) - AUVIC: Adversarial Unlearning of Visual Concepts for Multi-modal Large Language Models [63.05306474002547]
を強制する規制フレームワークは、機械学習の必要性を喚起します。
AUVICはMLLMのための新しい視覚概念アンラーニングフレームワークである。
AUVICは,非ターゲット概念の性能劣化を最小限に抑えつつ,最先端の目標忘れ率を実現していることを示す。
論文 参考訳(メタデータ) (2025-11-14T13:35:32Z) - Hierarchical Federated Unlearning for Large Language Models [5.406594712642111]
大きな言語モデル(LLM)は、現実のアプリケーションにますます統合され、プライバシやセキュリティ、望ましくない知識を取り除く必要性への懸念が高まっている。
スケーラブルでプライバシーを保護できるLLMのためのフェデレーション・アンラーニング・アプローチを提案する。
本手法は,タスク固有のアダプタ学習を通じて学習と保持を分離し,競合する目的を緩和するために階層的なマージ戦略を採用する。
論文 参考訳(メタデータ) (2025-10-19T04:24:51Z) - Towards Mitigating Excessive Forgetting in LLM Unlearning via Entanglement-Aware Unlearning with Proxy Constraint [28.25159814956888]
大規模言語モデル(LLM)は、プライベートまたは著作権のあるコンテンツを含む可能性のある巨大なデータセットに基づいて訓練される。
プライバシとオーナシップの懸念が高まっているため、データ所有者は、トレーニングされたモデルからデータを削除することを要求できる。
既存のほとんどの方法には音を忘れる境界がないため、一部のサンプルは忘れられてしまう。
論文 参考訳(メタデータ) (2025-08-28T05:45:40Z) - Constrained Entropic Unlearning: A Primal-Dual Framework for Large Language Models [14.321060805197874]
大規模言語モデル(LLM)が現実の環境でデプロイされるようになると、機密性、時代遅れ、あるいはプロプライエタリな情報を漏らさなくてはならなくなる。
既存の未学習の手法は、忘れと保持を規則化されたトレードオフとして定式化し、両方の目的を1つのスカラー化された損失に組み合わせる。
制約付き最適化問題として,LLMアンラーニングの新たな定式化を提案する。
論文 参考訳(メタデータ) (2025-06-05T17:55:23Z) - SPEED: Scalable, Precise, and Efficient Concept Erasure for Diffusion Models [56.83154571623655]
モデルパラメータを直接編集する効率的な概念消去手法であるSPEEDを導入する。
Speedyは、パラメータ更新がターゲット以外の概念に影響しないモデル編集スペースであるnullスペースを検索する。
たった5秒で100のコンセプトを消去しました。
論文 参考訳(メタデータ) (2025-03-10T14:40:01Z) - Robust Utility-Preserving Text Anonymization Based on Large Language Models [80.5266278002083]
機密情報を含む匿名化は、幅広いアプリケーションにとって不可欠である。
既存の技術は、大規模言語モデルの再識別能力の新たな課題に直面している。
本稿では,プライバシ評価器,ユーティリティ評価器,最適化コンポーネントの3つの重要なコンポーネントで構成されるフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-16T14:28:56Z) - Enhancing Information Maximization with Distance-Aware Contrastive
Learning for Source-Free Cross-Domain Few-Shot Learning [55.715623885418815]
クロスドメインのFew-Shot Learningメソッドは、トレーニング前のフェーズでモデルをトレーニングするために、ソースドメインデータにアクセスする必要がある。
データプライバシやデータ送信やトレーニングコストの削減に対する懸念が高まっているため,ソースデータにアクセスせずにCDFSLソリューションを開発する必要がある。
本稿では,これらの課題に対処するための距離対応コントラスト学習手法を提案する。
論文 参考訳(メタデータ) (2024-03-04T12:10:24Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。