論文の概要: Understanding Variation in Subpopulation Susceptibility to Poisoning
Attacks
- arxiv url: http://arxiv.org/abs/2311.11544v1
- Date: Mon, 20 Nov 2023 05:35:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-21 19:53:53.369632
- Title: Understanding Variation in Subpopulation Susceptibility to Poisoning
Attacks
- Title(参考訳): 殺虫攻撃に対するサブポピュレーション感受性の変動の理解
- Authors: Evan Rose, Fnu Suya, David Evans
- Abstract要約: 異なるサブポピュレーションに対する最先端の毒殺攻撃の有効性について検討した。
データセット分離性は、より分離性の低いデータセットのサブポピュレーション脆弱性において重要な役割を果たす。
クリーンモデルとターゲットモデルとのクリーンデータセットの損失差により、重要なサブポピュレーション特性をキャプチャする。
- 参考スコア(独自算出の注目度): 9.977765534931596
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning is susceptible to poisoning attacks, in which an attacker
controls a small fraction of the training data and chooses that data with the
goal of inducing some behavior unintended by the model developer in the trained
model. We consider a realistic setting in which the adversary with the ability
to insert a limited number of data points attempts to control the model's
behavior on a specific subpopulation. Inspired by previous observations on
disparate effectiveness of random label-flipping attacks on different
subpopulations, we investigate the properties that can impact the effectiveness
of state-of-the-art poisoning attacks against different subpopulations. For a
family of 2-dimensional synthetic datasets, we empirically find that dataset
separability plays a dominant role in subpopulation vulnerability for less
separable datasets. However, well-separated datasets exhibit more dependence on
individual subpopulation properties. We further discover that a crucial
subpopulation property is captured by the difference in loss on the clean
dataset between the clean model and a target model that misclassifies the
subpopulation, and a subpopulation is much easier to attack if the loss
difference is small. This property also generalizes to high-dimensional
benchmark datasets. For the Adult benchmark dataset, we show that we can find
semantically-meaningful subpopulation properties that are related to the
susceptibilities of a selected group of subpopulations. The results in this
paper are accompanied by a fully interactive web-based visualization of
subpopulation poisoning attacks found at
https://uvasrg.github.io/visualizing-poisoning
- Abstract(参考訳): 機械学習は、攻撃者がトレーニングデータのごく一部を制御し、訓練されたモデルでモデル開発者が意図しない振る舞いを誘発する目的でそのデータを選択する中毒攻撃の影響を受けやすい。
限られた数のデータポイントを挿入する能力を持つ敵が、特定のサブポピュレーションにおけるモデルの振る舞いを制御しようとする現実的な設定を考える。
異なる亜集団に対するランダムラベルフリッピング攻撃の無作為な有効性に関するこれまでの観察に触発され, 異なる亜集団に対する最先端の中毒攻撃の効果に影響を与える特性について検討した。
2次元の合成データセットのファミリーでは、データセット分離性は、より分離性の低いデータセットに対するサブポピュレーション脆弱性において支配的な役割を果たすことを実証的に見出した。
しかし、よく分離されたデータセットは個々のサブポピュレーション特性に依存している。
さらに, クリーンなデータ集合と, サブ集団を誤分類するターゲットモデルとの損失差によって, 重要なサブ集団特性が捉えられ, 損失差が小さい場合には, サブ集団が攻撃しやすいことを見出した。
この特性は、高次元ベンチマークデータセットにも一般化される。
アダルトベンチマークデータセットでは,選択されたサブ集団の感受性に関連する意味論的に意味的なサブポピュレーション特性を見出すことができる。
この論文の成果は、https://uvasrg.github.io/visualizing-poisoningで発見されたサブポピュレーション中毒攻撃の、完全にインタラクティブなwebベースの可視化を伴う。
関連論文リスト
- Boosting Test Performance with Importance Sampling--a Subpopulation Perspective [16.678910111353307]
本稿では,重要なサンプリングを,サブポピュレーション問題を解決するためのシンプルかつ強力なツールとして同定する。
サブポピュレーション問題の新しい体系的定式化を行い、既存の研究で明確に述べられていない仮定を明確に特定する。
アプリケーション側では、サブポピュレーション問題を解決するのに十分な1つの推定器を実証する。
論文 参考訳(メタデータ) (2024-12-17T15:25:24Z) - Data Pruning in Generative Diffusion Models [2.0111637969968]
生成モデルは、データの基盤となる分布を推定することを目的としている。
大規模データセットにおける冗長データやノイズデータの排除は,特に戦略的に行う場合,特に有益であることを示す。
論文 参考訳(メタデータ) (2024-11-19T14:13:25Z) - Fragile Giants: Understanding the Susceptibility of Models to Subpopulation Attacks [2.7016591543910717]
モデル複雑性がサブポピュレーション中毒に対する感受性にどのように影響するかを検討する。
以上の結果から,より多くのパラメータを持つモデルがサブポピュレーション中毒に対して有意に脆弱であることが示唆された。
これらの結果は、サブポピュレーションの脆弱性に対処する防衛を開発する必要性を強調している。
論文 参考訳(メタデータ) (2024-10-11T14:48:19Z) - Unlearnable Examples Detection via Iterative Filtering [84.59070204221366]
ディープニューラルネットワークは、データ中毒攻撃に弱いことが証明されている。
混合データセットから有毒なサンプルを検出することは極めて有益であり、困難である。
UE識別のための反復フィルタリング手法を提案する。
論文 参考訳(メタデータ) (2024-08-15T13:26:13Z) - Exploring Model Dynamics for Accumulative Poisoning Discovery [62.08553134316483]
そこで我々は,モデルレベルの情報を通して,防衛を探索するための新しい情報尺度,すなわち,記憶の離散性(Memorization Discrepancy)を提案する。
暗黙的にデータ操作の変更をモデル出力に転送することで、メモリ識別は許容できない毒のサンプルを発見することができる。
我々は、その性質を徹底的に探求し、累積中毒に対する防御のために、離散型サンプル補正(DSC)を提案する。
論文 参考訳(メタデータ) (2023-06-06T14:45:24Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - X-model: Improving Data Efficiency in Deep Learning with A Minimax Model [78.55482897452417]
ディープラーニングにおける分類と回帰設定の両面でのデータ効率の向上を目標とする。
両世界の力を生かすために,我々は新しいX-モデルを提案する。
X-モデルは、特徴抽出器とタスク固有のヘッドの間でミニマックスゲームを行う。
論文 参考訳(メタデータ) (2021-10-09T13:56:48Z) - Robin Hood and Matthew Effects -- Differential Privacy Has Disparate
Impact on Synthetic Data [3.2345600015792564]
我々は、差分プライバシーが生成モデルに与える影響を分析する。
生成した合成データにおいて,DPが逆サイズ分布となることを示す。
我々は、合成データに基づいてモデルを分析または訓練する際の注意を呼びかける。
論文 参考訳(メタデータ) (2021-09-23T15:14:52Z) - Balancing Biases and Preserving Privacy on Balanced Faces in the Wild [50.915684171879036]
現在の顔認識(FR)モデルには、人口統計バイアスが存在する。
さまざまな民族と性別のサブグループにまたがる偏見を測定するために、我々のバランス・フェイススをWildデータセットに導入します。
真偽と偽のサンプルペアを区別するために1点のスコアしきい値に依存すると、最適以下の結果が得られます。
本稿では,最先端ニューラルネットワークから抽出した顔特徴を用いたドメイン適応学習手法を提案する。
論文 参考訳(メタデータ) (2021-03-16T15:05:49Z) - BREEDS: Benchmarks for Subpopulation Shift [98.90314444545204]
本研究では,人口変動に対するモデルのロバスト性を評価する手法を開発した。
既存のデータセットの基盤となるクラス構造を利用して、トレーニングとテストの分散を構成するデータサブポピュレーションを制御する。
この手法をImageNetデータセットに適用し、様々な粒度のサブポピュレーションシフトベンチマークスイートを作成する。
論文 参考訳(メタデータ) (2020-08-11T17:04:47Z) - Subpopulation Data Poisoning Attacks [18.830579299974072]
機械学習に対する攻撃は、機械学習アルゴリズムが使用するデータの逆修正を誘導し、デプロイ時に出力を選択的に変更する。
本研究では,エフェサブポピュレーションアタック(emphsubpopulation attack)と呼ばれる新たなデータ中毒攻撃を導入する。
サブポピュレーション攻撃のためのモジュラーフレームワークを設計し、異なるビルディングブロックでインスタンス化し、その攻撃がさまざまなデータセットや機械学習モデルに有効であることを示す。
論文 参考訳(メタデータ) (2020-06-24T20:20:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。