論文の概要: Black-Box Audits for Group Distribution Shifts
- arxiv url: http://arxiv.org/abs/2209.03620v1
- Date: Thu, 8 Sep 2022 07:56:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-09 13:43:10.239859
- Title: Black-Box Audits for Group Distribution Shifts
- Title(参考訳): グループ分散シフトのためのブラックボックス監査
- Authors: Marc Juarez, Samuel Yeom, Matt Fredrikson
- Abstract要約: そこで我々は,分布シフトの症例を検出するためのブラックボックス監査手法を提案し,検討した。
モデルに問い合わせるだけで、外部監査者がこれらの分散シフトを特定するのに必要な情報を得ることができることを実証する。
- 参考スコア(独自算出の注目度): 25.621280373733605
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When a model informs decisions about people, distribution shifts can create
undue disparities. However, it is hard for external entities to check for
distribution shift, as the model and its training set are often proprietary. In
this paper, we introduce and study a black-box auditing method to detect cases
of distribution shift that lead to a performance disparity of the model across
demographic groups. By extending techniques used in membership and property
inference attacks -- which are designed to expose private information from
learned models -- we demonstrate that an external auditor can gain the
information needed to identify these distribution shifts solely by querying the
model. Our experimental results on real-world datasets show that this approach
is effective, achieving 80--100% AUC-ROC in detecting shifts involving the
underrepresentation of a demographic group in the training set. Researchers and
investigative journalists can use our tools to perform non-collaborative audits
of proprietary models and expose cases of underrepresentation in the training
datasets.
- Abstract(参考訳): モデルが人について決定を下すと、分散シフトは不適切な格差を生み出す。
しかしながら、モデルとそのトレーニングセットがプロプライエタリであることが多いため、外部エンティティが分散シフトをチェックすることは困難である。
本稿では,分布変化の事例を検知するブラックボックス監査手法を提案し,その効果について検討する。
学習モデルからプライベート情報を公開するために設計された,メンバシップとプロパティ推論攻撃で使用されるテクニックを拡張することで,モデルに問い合わせることのみで,これらの分散シフトを特定するために必要な情報を外部監査者が取得できることを実証する。
実世界のデータセットを用いた実験の結果,このアプローチが有効であることを示し,トレーニングセットにおける集団の過小表現を伴うシフトの検出において,80~100% auc-roc を実現する。
研究者や調査ジャーナリストは、当社のツールを使用して、プロプライエタリなモデルの非協力的な監査を行い、トレーニングデータセットに過小表現のケースを公開することができる。
関連論文リスト
- Supervised Algorithmic Fairness in Distribution Shifts: A Survey [17.826312801085052]
現実世界のアプリケーションでは、機械学習モデルは特定のデータセットでトレーニングされることが多いが、データ分散がシフトする可能性のある環境にデプロイされる。
この変化は、人種や性別などのセンシティブな属性によって特徴づけられる特定のグループに不公平な予測をもたらす可能性がある。
論文 参考訳(メタデータ) (2024-02-02T11:26:18Z) - Dirichlet-based Uncertainty Quantification for Personalized Federated
Learning with Improved Posterior Networks [9.54563359677778]
本稿では,グローバルおよびパーソナライズされたモデルの中からモデルを選択可能なフェデレーション学習への新たなアプローチを提案する。
これは、局所的およびグローバルな分布内および分布外データを検出するのに役立つ予測不確実性の慎重なモデリングによって達成される。
一般的な実世界の画像データセットに対する総合的な実験的評価は、アウト・オブ・ディストリビューション・データの存在下でのモデルの優れた性能を示している。
論文 参考訳(メタデータ) (2023-12-18T14:30:05Z) - Enhancing Robustness of Foundation Model Representations under
Provenance-related Distribution Shifts [8.298173603769063]
分布シフト下における基礎モデルに基づくモデルの安定性について検討する。
我々は,多施設データセットの文脈に現れる分布シフトの形式である,証明によるコンバウンディングに焦点をあてる。
その結果, 基礎モデルでは, コンバウンド・バイ・プロビデンス関係の分布シフトに対して, ある程度の頑健性を示すが, 調整により改善できることがわかった。
論文 参考訳(メタデータ) (2023-12-09T02:02:45Z) - Assessing Privacy Risks in Language Models: A Case Study on
Summarization Tasks [65.21536453075275]
我々は要約作業に焦点をあて、会員推測(MI)攻撃について調査する。
テキストの類似性や文書修正に対するモデルの抵抗をMI信号として活用する。
我々は、MI攻撃から保護するための要約モデルの訓練と、プライバシとユーティリティの本質的にのトレードオフについて議論する。
論文 参考訳(メタデータ) (2023-10-20T05:44:39Z) - Data Provenance via Differential Auditing [5.7962871424710665]
本稿では,データ提示を監査するための実践的フレームワークである差分監査(DPDA)によるデータ公開について紹介する。
本稿では,2つの効果的な監査機能実装,加算関数と乗算関数を提案する。
提案手法の有効性を示す実世界のデータセットの評価について報告する。
論文 参考訳(メタデータ) (2022-09-04T06:02:25Z) - Fair Group-Shared Representations with Normalizing Flows [68.29997072804537]
本研究では,異なるグループに属する個人を1つのグループにマッピングできる公正表現学習アルゴリズムを開発した。
提案手法は,他の公正表現学習アルゴリズムと競合することを示す。
論文 参考訳(メタデータ) (2022-01-17T10:49:49Z) - Explain, Edit, and Understand: Rethinking User Study Design for
Evaluating Model Explanations [97.91630330328815]
我々はクラウドソーシング研究を行い、真偽のホテルレビューと偽のホテルレビューを区別するために訓練された詐欺検出モデルと対話する。
単語の線形バッグモデルでは、トレーニング中に特徴係数にアクセスした参加者は、非説明制御と比較して、テストフェーズにおいてモデルの信頼性が大幅に低下する可能性があることを観察する。
論文 参考訳(メタデータ) (2021-12-17T18:29:56Z) - Examining and Combating Spurious Features under Distribution Shift [94.31956965507085]
我々は、最小限の統計量という情報理論の概念を用いて、ロバストで刺激的な表現を定義し、分析する。
入力分布のバイアスしか持たない場合でも、モデルはトレーニングデータから急激な特徴を拾い上げることができることを証明しています。
分析から着想を得た結果,グループDROは,グループ同士の相関関係を直接考慮しない場合に失敗する可能性が示唆された。
論文 参考訳(メタデータ) (2021-06-14T05:39:09Z) - Negative Data Augmentation [127.28042046152954]
負のデータ拡張サンプルは、データ分散のサポートに関する情報を提供することを示す。
我々は、NDAを識別器の合成データの追加源として利用する新しいGAN訓練目標を提案する。
実験により,本手法で訓練したモデルでは,異常検出能力の向上とともに条件付き・条件付き画像生成の改善を実現している。
論文 参考訳(メタデータ) (2021-02-09T20:28:35Z) - Mind the Trade-off: Debiasing NLU Models without Degrading the
In-distribution Performance [70.31427277842239]
信頼性正則化という新しいデバイアス化手法を導入する。
モデルがバイアスを悪用するのを防ぐと同時に、トレーニングのすべての例から学ぶのに十分なインセンティブを得られるようにします。
提案手法を3つのNLUタスクで評価し,前者とは対照的に,アウト・オブ・ディストリビューション・データセットの性能が向上することを示す。
論文 参考訳(メタデータ) (2020-05-01T11:22:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。