論文の概要: Mask-Free Privacy Extraction and Rewriting: A Domain-Aware Approach via Prototype Learning
- arxiv url: http://arxiv.org/abs/2604.10145v1
- Date: Sat, 11 Apr 2026 10:21:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:15.869125
- Title: Mask-Free Privacy Extraction and Rewriting: A Domain-Aware Approach via Prototype Learning
- Title(参考訳): マスクフリープライバシ抽出と書き換え:プロトタイプ学習によるドメイン認識アプローチ
- Authors: Xiaodong Li, Yuhua Wang, Qingchen Yu, Zixuan Qin, Yifan Sun, Qinnan Zhang, Hainan Zhang, Zhiming Zheng,
- Abstract要約: プライバシーに敏感なドメインに対するDAMPER(Domain-Aware Mask-free Privacy extract and Rewriting)を提案する。
Damperは、遅延プライバシーセマンティクスを、対照的な学習を通じてコンパクトなドメインプライバシプロトタイプに運用する。
サンプリングベースのExponential Mechanismを統合し、厳密なスパンレベルの差分プライバシー保証を提供する。
- 参考スコア(独自算出の注目度): 13.300036863281996
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Client-side privacy rewriting is crucial for deploying LLMs in privacy-sensitive domains. However, existing approaches struggle to balance privacy and utility. Full-text methods often distort context, while span-level approaches rely on impractical manual masks or brittle static dictionaries. Attempts to automate localization via prompt-based LLMs prove unreliable, as they suffer from unstable instruction following that leads to privacy leakage and excessive context scrubbing. To address these limitations, we propose DAMPER (Domain-Aware Mask-free Privacy Extraction and Rewriting). DAMPER operationalizes latent privacy semantics into compact Domain Privacy Prototypes via contrastive learning, enabling precise, autonomous span localization. Furthermore, we introduce a Prototype-Guided Preference Alignment, which leverages learned prototypes as semantic anchors to construct preference pairs, optimizing a domain-compliant rewriting policy without human annotations. At inference time, DAMPER integrates a sampling-based Exponential Mechanism to provide rigorous span-level Differential Privacy (DP) guarantees. Extensive experiments demonstrate that DAMPER significantly outperforms existing baselines, achieving a superior privacy-utility trade-off.
- Abstract(参考訳): プライバシに敏感なドメインにLLMをデプロイするには、クライアント側のプライバシ書き換えが不可欠だ。
しかし、既存のアプローチはプライバシとユーティリティのバランスをとるのに苦労している。
フルテキストメソッドはしばしばコンテキストを歪ませるが、スパンレベルのアプローチは非現実的な手動マスクや不安定な静的辞書に依存している。
プロンプトベースのLCMによるローカライゼーションを自動化する試みは、プライバシーの漏洩と過剰なコンテキストスクラブにつながる不安定な命令に苦しむため、信頼性が低い。
これらの制約に対処するため,DAMPER (Domain-Aware Mask-free Privacy extract and Rewriting)を提案する。
DAMPERは、遅延プライバシーセマンティクスを対照的な学習を通じてコンパクトなドメインプライバシプロトタイプに運用し、正確で自律的なスパンローカライゼーションを可能にする。
さらに、学習したプロトタイプをセマンティックアンカーとして活用して好みのペアを構築し、人間のアノテーションを使わずにドメイン準拠の書き直しポリシーを最適化するPrototype-Guided Preference Alignmentを導入する。
推測時に、DAMPERはサンプリングベースのExponential Mechanismを統合し、厳密なスパンレベル差分プライバシー(DP)保証を提供する。
大規模な実験では、DAMPERが既存のベースラインを大幅に上回っており、プライバシーとユーティリティのトレードオフが優れていることが示されている。
関連論文リスト
- PRISM: Privacy-Aware Routing for Adaptive Cloud-Edge LLM Inference via Semantic Sketch Collaboration [8.776463501718737]
プライバシと推論品質を動的にバランスさせるコンテキスト認識フレームワークを提案する。
PRISMは,(1)エッジデバイスがエンティティレベルの感度をプロファイルし,(2)エッジ上のソフトゲーティングモジュールが実行モード - クラウド,エッジ,あるいはコラボレーションを選択し,(3)協調経路に対して,(3)エッジがエンティティリスクに基づいて適応的な2層局所微分プライバシーを適用し,(4)クラウドLLMが乱れたプロンプトからセマンティックスケッチを生成する。
論文 参考訳(メタデータ) (2025-11-27T22:32:33Z) - RL-Finetuned LLMs for Privacy-Preserving Synthetic Rewriting [17.294176570269]
本稿では,複合報酬関数を用いた大規模言語モデル(LLM)を微調整する強化学習フレームワークを提案する。
プライバシ報酬は、セマンティックキューと、潜伏表現上の最小スパンニングツリー(MST)から派生した構造パターンを組み合わせる。
実験の結果,提案手法はセマンティック品質を劣化させることなく,著者の難読化とプライバシーの指標を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2025-08-25T04:38:19Z) - SoK: Semantic Privacy in Large Language Models [24.99241770349404]
本稿では,大規模言語モデル(LLM)の入力処理,事前学習,微調整,アライメント段階におけるセマンティックプライバシリスクを分析するライフサイクル中心のフレームワークを提案する。
我々は、鍵攻撃ベクトルを分類し、差分プライバシー、埋め込み暗号化、エッジコンピューティング、未学習などの現在の防御がこれらの脅威にどのように対処しているかを評価する。
セマンティックリークの定量化、マルチモーダル入力の保護、生成品質との非識別性のバランス、プライバシー保護の透明性確保など、オープンな課題の概要をまとめて結論付けます。
論文 参考訳(メタデータ) (2025-06-30T08:08:15Z) - Privacy-preserving Prompt Personalization in Federated Learning for Multimodal Large Language Models [12.406403248205285]
フェデレート・プロンプト・パーソナライゼーション(FPP)は、データの均一性と局所的なオーバーフィッティングに対処するために開発された。
我々は、パーソナライゼーションとプライバシ保証を調和させるセキュアなFPPプロトコルSecFPPを提案する。
SecFPPは、プライバシ保護ベースラインと非プライバシ保護ベースラインの両方で著しく優れています。
論文 参考訳(メタデータ) (2025-05-28T15:09:56Z) - Activity Recognition on Avatar-Anonymized Datasets with Masked Differential Privacy [64.32494202656801]
プライバシを保存するコンピュータビジョンは、機械学習と人工知能において重要な問題である。
本稿では,ビデオデータセット中の感性のある被験者を文脈内の合成アバターに置き換える匿名化パイプラインを提案する。
また、匿名化されていないがプライバシーに敏感な背景情報を保護するため、MaskDPを提案する。
論文 参考訳(メタデータ) (2024-10-22T15:22:53Z) - Mind the Privacy Unit! User-Level Differential Privacy for Language Model Fine-Tuning [62.224804688233]
差分プライバシ(DP)は、モデルが特定のプライバシユニットで「ほとんど区別できない」ことを保証することで、有望なソリューションを提供する。
ユーザ間でのプライバシー保護の確保に必要なアプリケーションによって動機づけられたユーザレベルのDPについて検討する。
論文 参考訳(メタデータ) (2024-06-20T13:54:32Z) - PrivacyMind: Large Language Models Can Be Contextual Privacy Protection Learners [81.571305826793]
コンテキストプライバシ保護言語モデル(PrivacyMind)を紹介する。
我々の研究はモデル設計に関する理論的分析を提供し、様々な手法をベンチマークする。
特に、肯定的な例と否定的な例の両方による命令チューニングは、有望な方法である。
論文 参考訳(メタデータ) (2023-10-03T22:37:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。