論文の概要: What Really is a Member? Discrediting Membership Inference via Poisoning
- arxiv url: http://arxiv.org/abs/2506.06003v1
- Date: Fri, 06 Jun 2025 11:48:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 17:28:43.452697
- Title: What Really is a Member? Discrediting Membership Inference via Poisoning
- Title(参考訳): 会員とは何か?
- Authors: Neal Mangaokar, Ashish Hooda, Zhuohang Li, Bradley A. Malin, Kassem Fawaz, Somesh Jha, Atul Prakash, Amrita Roy Chowdhury,
- Abstract要約: メンバシップ推論テストは、特定のデータポイントが言語モデルのトレーニングセットに含まれるかどうかを決定することを目的としている。
近年の研究では、このようなテストは正確なマッチングに基づいて厳密なメンバーシップ定義の下で失敗することがしばしば示されている。
テストがターゲットポイントの誤った予測を発生させるような方法で、トレーニングデータセットに毒を与えることが可能である。
- 参考スコア(独自算出の注目度): 38.22047020077631
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Membership inference tests aim to determine whether a particular data point was included in a language model's training set. However, recent works have shown that such tests often fail under the strict definition of membership based on exact matching, and have suggested relaxing this definition to include semantic neighbors as members as well. In this work, we show that membership inference tests are still unreliable under this relaxation - it is possible to poison the training dataset in a way that causes the test to produce incorrect predictions for a target point. We theoretically reveal a trade-off between a test's accuracy and its robustness to poisoning. We also present a concrete instantiation of this poisoning attack and empirically validate its effectiveness. Our results show that it can degrade the performance of existing tests to well below random.
- Abstract(参考訳): メンバシップ推論テストは、特定のデータポイントが言語モデルのトレーニングセットに含まれるかどうかを決定することを目的としている。
しかし、最近の研究では、このようなテストは正確なマッチングに基づいて厳密なメンバーシップの定義の下で失敗することがしばしばあり、メンバーとしてセマンティックな隣人を含むようにこの定義を緩和することを示唆している。
この研究では、この緩和の下では、メンバーシップ推論テストは依然として信頼できないことが示され、トレーニングデータセットに、テストがターゲットポイントの誤った予測を発生させるような方法で毒を盛ることが可能である。
理論的には、検査の正確性とその中毒に対する堅牢性の間のトレードオフを明らかにする。
また、この毒殺攻撃の具体的なインスタンス化を提示し、その効果を実証的に検証する。
以上の結果から,既存テストの性能はランダムに低下する可能性が示唆された。
関連論文リスト
- Adversarial Resilience against Clean-Label Attacks in Realizable and Noisy Settings [0.0]
i.d.データのストリームから逐次学習する際、非依存的な保証を確立するという課題について検討する。
我々は学習者が不確実な場合に予測をしないことを許す。
我々は、ノイズのあるクリーンラベルの反対者の下で、不一致に基づくしきい値に対する学習者の理論的分析を初めて行った。
論文 参考訳(メタデータ) (2025-04-17T13:20:12Z) - FullCert: Deterministic End-to-End Certification for Training and Inference of Neural Networks [62.897993591443594]
FullCertは、音と決定論的境界を持つ最初のエンドツーエンドの認証器である。
2つのデータセットに対してFullCertの有効性を実験的に示す。
論文 参考訳(メタデータ) (2024-06-17T13:23:52Z) - Systematic Testing of the Data-Poisoning Robustness of KNN [8.028344363418865]
データ中毒は、機械学習ベースのソフトウェアコンポーネントを汚染し、トレーニングセットを汚染し、テスト入力の予測結果を変更することを目的としている。
データ・ポゾン・ロバスト性を決定する既存の方法には、精度が劣るか、長い実行時間がある。
本稿では,広く使用されている教師あり学習手法に対して,データ収集の堅牢性を証明するとともに,そのファルシフィケーションを図り得る系統的テストベース手法を提案する。
論文 参考訳(メタデータ) (2023-07-17T07:19:17Z) - On Degrees of Freedom in Defining and Testing Natural Language
Understanding [8.553766123004682]
自然言語理解研究は、しばしばシステムの能力を誇張または過小評価する。
これらの誤った評価は、NLUを適切に定義し、テストすることの難しさに起因する。
本稿では,テストコンポーネント間の一連の検証基準を構成するフレームワークである妥当性議論を提案する。
論文 参考訳(メタデータ) (2023-05-24T13:25:20Z) - Can Membership Inferencing be Refuted? [31.31060116447964]
本研究では,実際に会員推論攻撃の信頼性について検討する。
モデルオーナは,データポイント$x$のメンバシップ推論テストの結果に対して,検証の証明を構築することで,妥当に反証できることを示す。
本研究の結果は,実際に会員推論攻撃がもたらす影響を再評価するものである。
論文 参考訳(メタデータ) (2023-03-07T04:36:35Z) - Holistic Approach to Measure Sample-level Adversarial Vulnerability and
its Utility in Building Trustworthy Systems [17.707594255626216]
敵対的攻撃は、知覚不能な雑音を伴うイメージを摂動させ、誤ったモデル予測をもたらす。
本稿では,異なる視点を組み合わせることで,サンプルの敵対的脆弱性を定量化するための総合的アプローチを提案する。
サンプルレベルで確実に敵の脆弱性を推定することにより、信頼できるシステムを開発できることを実証する。
論文 参考訳(メタデータ) (2022-05-05T12:36:17Z) - Indiscriminate Poisoning Attacks Are Shortcuts [77.38947817228656]
その結果, 標的ラベルを付与した場合, 進行性毒素攻撃の摂動は, ほぼ分離可能であることがわかった。
このような合成摂動は、故意に作られた攻撃と同じくらい強力であることを示す。
我々の発見は、アンフショートカット学習の問題が以前考えられていたよりも深刻であることを示唆している。
論文 参考訳(メタデータ) (2021-11-01T12:44:26Z) - Causal Inference Under Unmeasured Confounding With Negative Controls: A
Minimax Learning Approach [84.29777236590674]
すべての共同設立者が観察されず、代わりに負の制御が利用可能である場合の因果パラメータの推定について検討する。
最近の研究は、2つのいわゆるブリッジ関数による同定と効率的な推定を可能にする方法を示している。
論文 参考訳(メタデータ) (2021-03-25T17:59:19Z) - Provable Defense Against Delusive Poisoning [64.69220849669948]
本研究は, 対人訓練が妄想性中毒に対する防御法であることを示す。
これは、敵の訓練が妄想的中毒に対する原則的な防御方法であることを意味している。
論文 参考訳(メタデータ) (2021-02-09T09:19:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。