Fugu-MT 論文翻訳(概要): Balanced Filtering via Non-Disclosive Proxies

論文の概要: Balanced Filtering via Non-Disclosive Proxies

arxiv url: http://arxiv.org/abs/2306.15083v1
Date: Mon, 26 Jun 2023 21:55:24 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-28 15:29:55.934282
Title: Balanced Filtering via Non-Disclosive Proxies
Title（参考訳）: 非開示プロキシによる平衡フィルタ
Authors: Siqi Deng, Emily Diana, Michael Kearns, Aaron Roth
Abstract要約: 収集機構は、基準レートだけでは確認できないほど、個々のサンプルのグループメンバシップについてはあまり明らかにしない。アルゴリズム的な仮定では、そのようなプロキシはサンプルとオラクルの効率のよい方法で見つかることが示される。
参考スコア（独自算出の注目度）: 10.72315083265869
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We study the problem of non-disclosively collecting a sample of data that is balanced with respect to sensitive groups when group membership is unavailable or prohibited from use at collection time. Specifically, our collection mechanism does not reveal significantly more about group membership of any individual sample than can be ascertained from base rates alone. To do this, we adopt a fairness pipeline perspective, in which a learner can use a small set of labeled data to train a proxy function that can later be used for this filtering task. We then associate the range of the proxy function with sampling probabilities; given a new candidate, we classify it using our proxy function, and then select it for our sample with probability proportional to the sampling probability corresponding to its proxy classification. Importantly, we require that the proxy classification itself not reveal significant information about the sensitive group membership of any individual sample (i.e., it should be sufficiently non-disclosive). We show that under modest algorithmic assumptions, we find such a proxy in a sample- and oracle-efficient manner. Finally, we experimentally evaluate our algorithm and analyze generalization properties.
Abstract（参考訳）: グループメンバーシップが利用できない場合や、収集時に使用できない場合、センシティブなグループに対してバランスの取れたデータのサンプルを非開示的に収集する問題について検討する。特に,収集機構は,ベースレートのみから確認できるよりも,個々のサンプルのグループメンバシップについて明らかにしていない。これを実現するために、学習者が小さなラベル付きデータセットを使用して、後にこのフィルタリングタスクに使用できるプロキシ関数をトレーニングできる、公正なパイプラインパースペクティブを採用しています。次に、プロキシ関数の範囲をサンプリング確率に関連付け、新しい候補が与えられたら、プロキシ関数を使用してそれを分類し、そのプロキシ分類に対応するサンプリング確率に比例した確率でサンプルに対して選択する。重要なことに、プロキシの分類自体が個々のサンプルの敏感なグループメンバーシップに関する重要な情報を明かさない必要がある(つまり、十分に非開示である)。アルゴリズム的な仮定では、そのようなプロキシはサンプルとオラクルの効率のよい方法で見つかる。最後に,本アルゴリズムを実験的に評価し,一般化特性を解析する。

関連論文リスト

Project-Probe-Aggregate: Efficient Fine-Tuning for Group Robustness [53.96714099151378]
画像テキスト基礎モデルのパラメータ効率向上のための3段階のアプローチを提案する。本手法は, マイノリティ標本同定とロバストトレーニングアルゴリズムの2つの重要な要素を改良する。我々の理論分析は,PPAが少数群の識別を向上し,バランスの取れたグループエラーを最小限に抑えるためにベイズが最適であることを示している。
論文参考訳（メタデータ） (2025-03-12T15:46:12Z)
Sample size planning for conditional counterfactual mean estimation with a K-armed randomized experiment [0.0]
K$のランダム化実験で十分なサンプルサイズを決定する方法を示す。政策木を用いてサブグループを学習し、公開可能な大規模なランダム化実験データセットにおいて、我々の名目上の保証を評価する。
論文参考訳（メタデータ） (2024-03-06T20:37:29Z)
Correcting Underrepresentation and Intersectional Bias for Classification [49.1574468325115]
我々は、表現不足のバイアスによって破損したデータから学習する問題を考察する。偏りのないデータの少ない場合、グループワイドのドロップアウト率を効率的に推定できることが示される。本アルゴリズムは,有限VC次元のモデルクラスに対して,効率的な学習を可能にする。
論文参考訳（メタデータ） (2023-06-19T18:25:44Z)
Canary in a Coalmine: Better Membership Inference with Ensembled Adversarial Queries [53.222218035435006]
私たちは、差別的で多様なクエリを最適化するために、逆ツールを使用します。我々の改善は既存の方法よりもはるかに正確な会員推定を実現している。
論文参考訳（メタデータ） (2022-10-19T17:46:50Z)
Addressing Missing Sources with Adversarial Support-Matching [8.53946780558779]
そこで本研究では,データ内の2段階階層の2段階に,データの欠如が関係しているシナリオについて検討する。アルゴリズム的公正性から保護された群の概念に触発され、この第2階層によって彫られた分割を「部分群」と呼ぶ。私たちは、サブグループに不変な表現を学ぶために、"deployment set"と呼ばれる追加で多様だがラベルなしのデータセットを使用します。
論文参考訳（メタデータ） (2022-03-24T16:19:19Z)
Leveraging Ensembles and Self-Supervised Learning for Fully-Unsupervised Person Re-Identification and Text Authorship Attribution [77.85461690214551]
完全ラベル付きデータからの学習は、Person Re-IdentificationやText Authorship Attributionなどのマルチメディアフォレスト問題において困難である。近年の自己教師型学習法は,基礎となるクラスに意味的差異が有る場合に,完全ラベル付きデータを扱う際に有効であることが示されている。本研究では,異なるクラスからのサンプルが顕著に多様性を持っていない場合でも,ラベルのないデータから学習できるようにすることにより,個人再認識とテキストオーサシップの属性に対処する戦略を提案する。
論文参考訳（メタデータ） (2022-02-07T13:08:11Z)
Towards Group Robustness in the presence of Partial Group Labels [61.33713547766866]
入力サンプルとターゲットラベルの間に急激な相関関係があるニューラルネットワークの予測を誤った方向に導く本稿では,制約セットから最悪のグループ割り当てを最適化するアルゴリズムを提案する。グループ間で総合的な集計精度を維持しつつ,少数集団のパフォーマンス向上を示す。
論文参考訳（メタデータ） (2022-01-10T22:04:48Z)
Ranking Models in Unlabeled New Environments [74.33770013525647]
ラベルのない新しい環境におけるランキングモデルの問題を紹介する。 1)完全にラベル付けされたプロキシデータセットを使用し、2)所定のターゲット環境での真のモデルランキングをよく反映します。具体的には、ラベル付けされていないターゲットドメインに近いデータセットは、相対的なパフォーマンスランキングをよりよく保存する。
論文参考訳（メタデータ） (2021-08-23T17:57:15Z)
Rethinking Sampling Strategies for Unsupervised Person Re-identification [59.47536050785886]
我々は,同じフレームワーク下での各種サンプリング戦略と損失関数のパフォーマンス差の理由を解析した。グループサンプリングを提案し、同じクラスのサンプルをグループに集める。 Market-1501、DukeMTMC-reID、MSMT17の実験は、グループサンプリングが最先端の手法に匹敵する性能を達成することを示した。
論文参考訳（メタデータ） (2021-07-07T05:39:58Z)
Examining and Combating Spurious Features under Distribution Shift [94.31956965507085]
我々は、最小限の統計量という情報理論の概念を用いて、ロバストで刺激的な表現を定義し、分析する。入力分布のバイアスしか持たない場合でも、モデルはトレーニングデータから急激な特徴を拾い上げることができることを証明しています。分析から着想を得た結果,グループDROは,グループ同士の相関関係を直接考慮しない場合に失敗する可能性が示唆された。
論文参考訳（メタデータ） (2021-06-14T05:39:09Z)
Predicting the Accuracy of a Few-Shot Classifier [3.609538870261841]
まず,一般化性能の変動要因を解析する。我々は,検討された分類器の一般化能力と実証的に相関する合理的な尺度を提案する。
論文参考訳（メタデータ） (2020-07-08T16:31:28Z)
Group Membership Verification with Privacy: Sparse or Dense? [21.365032455883178]
グループメンバー認証は、生体特性がそのメンバーの同一性を明らかにすることなく、グループの1つのメンバーに対応するかどうかをチェックする。最近のコントリビューションは、2つのメカニズムの併用によるグループメンバシッププロトコルのプライバシを提供する。本稿では,セキュリティ,コンパクト性,検証性能の両面における疎性の影響を明らかにするために,グループメンバシップ検証の数学的モデルを提案する。
論文参考訳（メタデータ） (2020-02-24T16:47:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。