Fugu-MT 論文翻訳(概要): Quantifying Privacy Risks of Masked Language Models Using Membership Inference Attacks

論文の概要: Quantifying Privacy Risks of Masked Language Models Using Membership Inference Attacks

arxiv url: http://arxiv.org/abs/2203.03929v1
Date: Tue, 8 Mar 2022 08:50:34 GMT
ステータス: 翻訳完了
システム内更新日: 2022-03-09 22:43:02.168675
Title: Quantifying Privacy Risks of Masked Language Models Using Membership Inference Attacks
Title（参考訳）: 会員推論攻撃を用いたマスケ言語モデルのプライバシーリスクの定量化
Authors: Fatemehsadat Mireshghallah, Kartik Goyal, Archit Uniyal, Taylor Berg-Kirkpatrick, Reza Shokri
Abstract要約: 我々は、確率比仮説テストに基づいて、より強力なメンバーシップ推論攻撃を考案する。我々の攻撃は、事前の会員推測攻撃の記憶を0.66から0.90レベルへと改善することを示します。
参考スコア（独自算出の注目度）: 34.17535942437515
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The wide adoption and application of Masked language models~(MLMs) on sensitive data (from legal to medical) necessitates a thorough quantitative investigation into their privacy vulnerabilities -- to what extent do MLMs leak information about their training data? Prior attempts at measuring leakage of MLMs via membership inference attacks have been inconclusive, implying the potential robustness of MLMs to privacy attacks. In this work, we posit that prior attempts were inconclusive because they based their attack solely on the MLM's model score. We devise a stronger membership inference attack based on likelihood ratio hypothesis testing that involves an additional reference MLM to more accurately quantify the privacy risks of memorization in MLMs. We show that masked language models are extremely susceptible to likelihood ratio membership inference attacks: Our empirical results, on models trained on medical notes, show that our attack improves the AUC of prior membership inference attacks from 0.66 to an alarmingly high 0.90 level, with a significant improvement in the low-error region: at 1% false positive rate, our attack is 51X more powerful than prior work.
Abstract（参考訳）: Masked Language Model~(MLM)の機密データ(法律から医療まで)への広範な採用と適用は、プライバシーの脆弱性に関する徹底的な定量的調査を必要とします。メンバーシップ推論攻撃によるMLMの漏洩を測定する以前の試みは決定的ではなく、プライバシー攻撃に対するMLMの潜在的堅牢性を示している。本研究は,MLMのモデルスコアにのみ基づいているため,以前の試みが不確定であったことを示唆する。我々は、MLMにおける記憶のプライバシーリスクをより正確に定量化するために、追加参照MLMを含む確率比仮説テストに基づいて、より強力なメンバーシップ推論攻撃を考案する。我々の実験結果は、医療用ノートでトレーニングされたモデルに基づいて、我々の攻撃が以前のメンバーシップ推論攻撃のaucを0.66から驚くほど高い0.90レベルに改善し、低エラー領域を大幅に改善したことを示している:1%の偽陽性率で、我々の攻撃は以前の仕事よりも51倍強力である。

関連論文リスト

SOFT: Selective Data Obfuscation for Protecting LLM Fine-tuning against Membership Inference Attacks [17.77094760401298]
メンバーシップ推論攻撃(MIA)に対する微調整大言語モデルの脆弱性について検討する。プライバシー保護とプライバシー保護のバランスをとるために,影響のあるデータ選択を調整可能なパラメータで活用することで,プライバシーの漏洩を緩和する新しい防衛手法であるSOFTを提案する。
論文参考訳（メタデータ） (2025-06-12T07:23:56Z)
Towards Harmless Multimodal Assistants with Blind Preference Optimization [49.044737689613164]
MLLM(Multimodal Large Language Models)は、マルチモーダル理解、推論、相互作用において印象的な能力を示す。 MLLMと人間の嗜好の整合における選好最適化の有効性から,MLLMの安全関連選好データが必要である。我々は、無害なマルチモーダルアシスタントに対してMMSafe-PO選好データセットを構築し、マルチモーダル命令、会話形式、人間のフィードバックからのランク付けされたペア応答を特徴付ける。
論文参考訳（メタデータ） (2025-03-18T12:02:38Z)
Differentially Private Steering for Large Language Model Alignment [55.30573701583768]
本稿では,大規模言語モデルとプライベートデータセットの整合性に関する最初の研究について述べる。本研究は,プライバシ保証付きアクティベーションを編集するPSA(Private Steering for LLM Alignment)アルゴリズムを提案する。以上の結果から,PSAはLPMアライメントのDP保証を実現し,性能の低下を最小限に抑えることができた。
論文参考訳（メタデータ） (2025-01-30T17:58:36Z)
Membership Inference Attacks Against Vision-Language Models [24.47069867575367]
VLM(Vision-Language Models)は、例外的なマルチモーダル理解とダイアログ機能を示す。データ誤用や漏洩のリスクは、ほとんど解明されていない。本研究では,背景知識の異なるレベルに合わせた4つのメンバーシップ推論手法を提案する。
論文参考訳（メタデータ） (2025-01-27T05:44:58Z)
Membership Inference Attack against Long-Context Large Language Models [8.788010048413188]
すべての情報を長いコンテキストに統合することで、センシティブな情報のリポジトリになる、と我々は主張する。 LCLMに適した6つのメンバシップ推論攻撃戦略を提案する。 LCLMがそのような会員情報を明らかにするのに有効な理由について検討する。
論文参考訳（メタデータ） (2024-11-18T09:50:54Z)
When LLMs Go Online: The Emerging Threat of Web-Enabled LLMs [26.2943792874156]
個人データを含むサイバー攻撃における大規模言語モデル(LLM)の誤用に関連するリスクについて検討する。具体的には,サイバーアタックの実施を指示されたLLMエージェントがいかに強力かを理解することを目的としている。本稿では,PII(Personally Identible Information)の収集,偽造投稿の生成,スピアフィッシングメールの作成の3つの攻撃シナリオについて検討する。
論文参考訳（メタデータ） (2024-10-18T16:16:34Z)
CoCA: Regaining Safety-awareness of Multimodal Large Language Models with Constitutional Calibration [90.36429361299807]
マルチモーダルな大言語モデル (MLLM) は、視覚的な入力を含む会話への関与において顕著な成功を収めている。視覚的モダリティの統合は、MLLMが悪意のある視覚的入力に影響を受けやすいという、ユニークな脆弱性を導入している。本稿では,出力分布を校正することでMLLMの安全性を向上するCoCA技術を紹介する。
論文参考訳（メタデータ） (2024-09-17T17:14:41Z)
Evaluating LLM-based Personal Information Extraction and Countermeasures [63.91918057570824]
大規模言語モデル(LLM)に基づく個人情報抽出をベンチマークすることができる。 LLMは攻撃者によって誤用され、個人プロファイルから様々な個人情報を正確に抽出する。プロンプトインジェクションは強力なLDMベースの攻撃に対して防御し、攻撃をより効果的でない従来の攻撃に還元する。
論文参考訳（メタデータ） (2024-08-14T04:49:30Z)
A Method to Facilitate Membership Inference Attacks in Deep Learning Models [5.724311218570013]
我々は,従来の技術よりも厳格に強力な新たな会員推論攻撃を実演する。私たちの攻撃は、敵がすべてのトレーニングサンプルを確実に識別する権限を与えます。これらのモデルは、共通の会員プライバシー監査の下で、増幅された会員リークを効果的に偽装できることを示す。
論文参考訳（メタデータ） (2024-07-02T03:33:42Z)
Do Membership Inference Attacks Work on Large Language Models? [141.2019867466968]
メンバーシップ推論攻撃(MIA)は、特定のデータポイントがターゲットモデルのトレーニングデータのメンバーであるかどうかを予測しようとする。我々は、Pileで訓練された言語モデルに対して、MIAの大規模評価を行い、そのパラメータは160Mから12Bまでである。様々な LLM サイズや領域にまたがるほとんどの設定において,MIA はランダムな推測よりもほとんど優れていないことがわかった。
論文参考訳（メタデータ） (2024-02-12T17:52:05Z)
MIA-BAD: An Approach for Enhancing Membership Inference Attack and its Mitigation with Federated Learning [6.510488168434277]
メンバシップ推論攻撃(MIA)は、機械学習(ML)モデルのプライバシを妥協するための一般的なパラダイムである。バッチ・ワイズ・アサート・データセット(MIA-BAD)を用いた強化されたメンバーシップ推論攻撃を提案する。 FLを用いたMLモデルのトレーニング方法を示すとともに,提案したMIA-BADアプローチによる脅威をFLアプローチで緩和する方法について検討する。
論文参考訳（メタデータ） (2023-11-28T06:51:26Z)
SmoothLLM: Defending Large Language Models Against Jailbreaking Attacks [99.23352758320945]
SmoothLLMは,大規模言語モデル(LLM)に対するジェイルブレーキング攻撃を軽減するために設計された,最初のアルゴリズムである。敵が生成したプロンプトが文字レベルの変化に対して脆弱であることから、我々の防衛はまず、与えられた入力プロンプトの複数のコピーをランダムに摂動し、対応する予測を集約し、敵の入力を検出する。
論文参考訳（メタデータ） (2023-10-05T17:01:53Z)
Defending Pre-trained Language Models as Few-shot Learners against Backdoor Attacks [72.03945355787776]
軽快でプラガブルで効果的な PLM 防御である MDP を,少人数の学習者として提唱する。我々は,MDPが攻撃の有効性と回避性の両方を選択できる興味深いジレンマを発生させることを解析的に示す。
論文参考訳（メタデータ） (2023-09-23T04:41:55Z)
Membership Inference Attacks Against Self-supervised Speech Models [62.73937175625953]
連続音声における自己教師付き学習(SSL)が注目されている。ブラックボックスアクセス下でのMIA(Commanship Inference Attacks)を用いたSSL音声モデルに対する最初のプライバシ分析を行う。
論文参考訳（メタデータ） (2021-11-09T13:00:24Z)
Membership Inference Attack Susceptibility of Clinical Language Models [9.823833005444493]
BERTやGPT2といったモデルアーキテクチャにおける経験的プライバシリークを推定するために,メンバシップ推論攻撃を設計し,採用する。以上の結果から,小型モデルは大規模モデルよりも経験的プライバシリークが低く,マスクされたLMは自己回帰型LMよりもリークが低いことがわかった。
論文参考訳（メタデータ） (2021-04-16T18:29:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。