論文の概要: Concept-Aware Privacy Mechanisms for Defending Embedding Inversion Attacks
- arxiv url: http://arxiv.org/abs/2602.07090v1
- Date: Fri, 06 Feb 2026 09:28:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.440444
- Title: Concept-Aware Privacy Mechanisms for Defending Embedding Inversion Attacks
- Title(参考訳): インバージョン攻撃の防止のための概念認識型プライバシメカニズム
- Authors: Yu-Che Tsai, Hsiang Hsiao, Kuan-Yu Chen, Shou-De Lin,
- Abstract要約: 既存の差分プライバシー防衛は、埋め込み次元にわたって均一な感度を仮定し、過度なノイズと劣化した実用性をもたらす。
テキスト埋め込みにおける概念固有のプライバシ保護のための,ユーザ中心のフレームワークであるSPARSEを提案する。
- 参考スコア(独自算出の注目度): 7.044221462918645
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text embeddings enable numerous NLP applications but face severe privacy risks from embedding inversion attacks, which can expose sensitive attributes or reconstruct raw text. Existing differential privacy defenses assume uniform sensitivity across embedding dimensions, leading to excessive noise and degraded utility. We propose SPARSE, a user-centric framework for concept-specific privacy protection in text embeddings. SPARSE combines (1) differentiable mask learning to identify privacy-sensitive dimensions for user-defined concepts, and (2) the Mahalanobis mechanism that applies elliptical noise calibrated by dimension sensitivity. Unlike traditional spherical noise injection, SPARSE selectively perturbs privacy-sensitive dimensions while preserving non-sensitive semantics. Evaluated across six datasets with three embedding models and attack scenarios, SPARSE consistently reduces privacy leakage while achieving superior downstream performance compared to state-of-the-art DP methods.
- Abstract(参考訳): テキストの埋め込みは、多くのNLPアプリケーションを可能にするが、インバージョン攻撃の埋め込みによる深刻なプライバシーリスクに直面する。
既存の差分プライバシー防衛は、埋め込み次元にわたって均一な感度を仮定し、過度なノイズと劣化した実用性をもたらす。
テキスト埋め込みにおける概念固有のプライバシ保護のための,ユーザ中心のフレームワークであるSPARSEを提案する。
SPARSEは,(1)識別可能なマスク学習を用いて,ユーザ定義概念のプライバシーに敏感なディメンションを識別し,(2)ディメンション感度で校正された楕円ノイズを適用したマハラノビス機構を組み合わせる。
従来の球面ノイズ注入とは異なり、SPARSEはプライバシーに敏感な次元を選択的に摂動させ、非感受性なセマンティクスを保存する。
SPARSEは3つの埋め込みモデルとアタックシナリオを持つ6つのデータセットで評価され、常にプライバシーの漏洩を低減しつつ、最先端のDPメソッドよりも優れたダウンストリームパフォーマンスを実現している。
関連論文リスト
- DP-MGTD: Privacy-Preserving Machine-Generated Text Detection via Adaptive Differentially Private Entity Sanitization [26.29089564225218]
本稿では,Adaptive Differentially Private Entity Sanitizationアルゴリズムを組み込んだフレームワークを提案する。
提案手法は,検出精度がほぼ良好であり,非プライベートベースラインを著しく上回っている。
論文 参考訳(メタデータ) (2026-01-08T06:33:15Z) - TextCrafter: Optimization-Calibrated Noise for Defending Against Text Embedding Inversion [0.13764085113103217]
テキスト埋め込みインバージョン攻撃は、潜在表現から原文を再構築し、協調推論とエッジコンピューティングにおいて深刻なプライバシー上の脅威を生じさせる。
本研究では, RL学習, 幾何を考慮したノイズ注入, クラスタ先行によるユーザ埋め込み, PII信号誘導を併用して, 作業性を維持しながらインバージョンを抑える, 最適化に基づく逆摂動機構であるTextCrafterを提案する。
論文 参考訳(メタデータ) (2025-09-22T00:51:20Z) - Activity Recognition on Avatar-Anonymized Datasets with Masked Differential Privacy [64.32494202656801]
プライバシを保存するコンピュータビジョンは、機械学習と人工知能において重要な問題である。
本稿では,ビデオデータセット中の感性のある被験者を文脈内の合成アバターに置き換える匿名化パイプラインを提案する。
また、匿名化されていないがプライバシーに敏感な背景情報を保護するため、MaskDPを提案する。
論文 参考訳(メタデータ) (2024-10-22T15:22:53Z) - Diff-Privacy: Diffusion-based Face Privacy Protection [58.1021066224765]
本稿では,Diff-Privacyと呼ばれる拡散モデルに基づく顔のプライバシー保護手法を提案する。
具体的には、提案したマルチスケール画像インバージョンモジュール(MSI)をトレーニングし、元の画像のSDMフォーマット条件付き埋め込みのセットを得る。
本研究は,条件付き埋め込みに基づいて,組込みスケジューリング戦略を設計し,デノナイズプロセス中に異なるエネルギー関数を構築し,匿名化と視覚的アイデンティティ情報隠蔽を実現する。
論文 参考訳(メタデータ) (2023-09-11T09:26:07Z) - Breaking the Communication-Privacy-Accuracy Tradeoff with
$f$-Differential Privacy [51.11280118806893]
サーバが複数のユーザの協調的なデータ分析を,プライバシの懸念と限られた通信能力で調整する,フェデレートされたデータ分析問題を考える。
有限出力空間を有する離散値機構の局所的差分プライバシー保証を$f$-differential privacy (DP) レンズを用いて検討する。
より具体的には、様々な離散的評価機構の厳密な$f$-DP保証を導出することにより、既存の文献を前進させる。
論文 参考訳(メタデータ) (2023-02-19T16:58:53Z) - How Do Input Attributes Impact the Privacy Loss in Differential Privacy? [55.492422758737575]
DPニューラルネットワークにおけるオブジェクトごとの規範と個人のプライバシ損失との関係について検討する。
プライバシ・ロス・インプット・サセプティビリティ(PLIS)と呼ばれる新しい指標を導入し、被験者のプライバシ・ロスを入力属性に適応させることを可能にした。
論文 参考訳(メタデータ) (2022-11-18T11:39:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。