論文の概要: Private Multi-Winner Voting for Machine Learning
- arxiv url: http://arxiv.org/abs/2211.15410v1
- Date: Wed, 23 Nov 2022 20:06:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-04 14:17:20.114073
- Title: Private Multi-Winner Voting for Machine Learning
- Title(参考訳): 機械学習のためのプライベートマルチウィンナー投票
- Authors: Adam Dziedzic, Christopher A Choquette-Choo, Natalie Dullerud, Vinith
Menon Suriyakumar, Ali Shahin Shamsabadi, Muhammad Ahmad Kaleem, Somesh Jha,
Nicolas Papernot, Xiao Wang
- Abstract要約: 本稿では,2進数,$tau$,Powerset投票の3つの新しいDPマルチウィンナ機構を提案する。
バイナリ投票は、構成を通じてラベルごとに独立して行われる。
$tau$ voting bounds vote in their $ell$ norm for tight data-independent guarantees。
パワーセット投票は、可能な結果をパワーセットとして見ることによって、バイナリベクター全体を操作する。
- 参考スコア(独自算出の注目度): 48.0093793427039
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Private multi-winner voting is the task of revealing $k$-hot binary vectors
satisfying a bounded differential privacy (DP) guarantee. This task has been
understudied in machine learning literature despite its prevalence in many
domains such as healthcare. We propose three new DP multi-winner mechanisms:
Binary, $\tau$, and Powerset voting. Binary voting operates independently per
label through composition. $\tau$ voting bounds votes optimally in their
$\ell_2$ norm for tight data-independent guarantees. Powerset voting operates
over the entire binary vector by viewing the possible outcomes as a power set.
Our theoretical and empirical analysis shows that Binary voting can be a
competitive mechanism on many tasks unless there are strong correlations
between labels, in which case Powerset voting outperforms it. We use our
mechanisms to enable privacy-preserving multi-label learning in the central
setting by extending the canonical single-label technique: PATE. We find that
our techniques outperform current state-of-the-art approaches on large,
real-world healthcare data and standard multi-label benchmarks. We further
enable multi-label confidential and private collaborative (CaPC) learning and
show that model performance can be significantly improved in the multi-site
setting.
- Abstract(参考訳): プライベートマルチウィンナー投票は、制限付き差分プライバシー(DP)保証を満たす$k$-hotバイナリベクトルを明らかにするタスクである。
このタスクは、医療など多くの領域で普及しているにもかかわらず、機械学習の文献では未熟である。
本稿では,2進数,$\tau$,Powerset投票の3つの新しいDPマルチウィンナ機構を提案する。
バイナリ投票は、構成を通じてラベルごとに独立に行われる。
$\tau$ 投票バウンダリは、データ非依存の厳密な保証のために$\ell_2$の基準で最適に投票する。
パワーセット投票は、可能な結果をパワーセットとして見ることによって、バイナリベクター全体を操作する。
我々の理論的および実証的な分析は、ラベル間に強い相関関係がない限り、バイナリ投票が多くのタスクの競合メカニズムになり得ることを示している。
当社では,標準シングルラベル技術であるPATEを拡張して,プライバシ保護のためのマルチラベル学習を中央で実現している。
私たちの技術は、大規模で現実世界の医療データと標準のマルチラベルベンチマークにおいて、最先端のアプローチよりも優れています。
さらに,マルチラベル・シークレット・プライベート・コラボレーティブ(capc)学習を可能にし,マルチサイト環境においてモデル性能が大幅に向上することを示す。
関連論文リスト
- UniDEC : Unified Dual Encoder and Classifier Training for Extreme Multi-Label Classification [42.36546066941635]
Extreme Multi-label Classification (XMC) は非常に大きなラベル空間から関連するラベルのサブセットを予測する。
この研究は、デュアルエンコーダと分類器を同時に訓練する新しいエンドツーエンドのトレーニング可能なフレームワークであるUniDECを提案する。
論文 参考訳(メタデータ) (2024-05-04T17:27:51Z) - Data as voters: instance selection using approval-based multi-winner voting [1.597617022056624]
機械学習(あるいはデータマイニング)におけるインスタンス選択問題に対する新しいアプローチを提案する。
私たちのモデルでは、インスタンスは有権者と候補者として二重の役割を担います。
SVM では,EJR や PJR を満たすいくつかの投票規則を用いて,平均精度をわずかに向上させた。
論文 参考訳(メタデータ) (2023-04-19T22:00:23Z) - MultiGuard: Provably Robust Multi-label Classification against
Adversarial Examples [67.0982378001551]
MultiGuardは、マルチラベル分類に対する敵の例に対する証明可能な堅牢な防御である。
我々の主要な理論的貢献は、入力の基底真理ラベルの数が、MultiGuardによって予測されるラベルのセットで証明可能であることを示すことである。
論文 参考訳(メタデータ) (2022-10-03T17:50:57Z) - Optimizing Bi-Encoder for Named Entity Recognition via Contrastive
Learning [80.36076044023581]
名前付きエンティティ認識(NER)のための効率的なバイエンコーダフレームワークを提案する。
我々はNERを、エンティティ参照のベクトル表現とその型との類似性を最大化する計量学習問題とみなす。
NERのこのバイエンコーダの定式化における大きな課題は、エンティティの言及から非エンゲージスを分離することにある。
論文 参考訳(メタデータ) (2022-08-30T23:19:04Z) - A Reduction to Binary Approach for Debiasing Multiclass Datasets [12.885756277367443]
R2Bが最適性およびバイアス保証を満たすことを証明し、2つの基準線を越えれば改善につながることを実証的に証明する。
これらの結論は、社会科学、コンピュータビジョン、医療からの合成および実世界のデータセット上で検証される。
論文 参考訳(メタデータ) (2022-05-31T15:11:41Z) - Trustable Co-label Learning from Multiple Noisy Annotators [68.59187658490804]
監督されたディープラーニングは、大量の注釈付き例に依存している。
典型的な方法は、複数のノイズアノテータから学習することである。
本稿では,emphTrustable Co-label Learning (TCL)と呼ばれるデータ効率のよい手法を提案する。
論文 参考訳(メタデータ) (2022-03-08T16:57:00Z) - Selective-Supervised Contrastive Learning with Noisy Labels [73.81900964991092]
本稿では,頑健な表現を学習し,ノイズラベルを処理するために,選択的教師付きコントラスト学習(Sel-CL)を提案する。
具体的には、Sel-CLは、表現学習に強力な教師付きコントラスト学習(Sup-CL)を拡張しているが、ノイズラベルがある場合には劣化する。
セル-CLは、ノイズラベルによって構築されたノイズペアが表現学習を誤解させるという、Sup-CLの問題の直接的な原因に取り組む。
論文 参考訳(メタデータ) (2022-03-08T16:12:08Z) - Learning to Elect [7.893831644671976]
投票システムには、推薦システム、ウェブ検索、製品デザイン、選挙など幅広いアプリケーションがある。
本研究では,セットトランスフォーマーや完全連結グラフネットワーク,DeepSetsといったセットインプットニューラルネットワークアーキテクチャが,理論的にも経験的にも投票ルールの学習に適していることを示す。
論文 参考訳(メタデータ) (2021-08-05T17:55:46Z) - Classify and Generate Reciprocally: Simultaneous Positive-Unlabelled
Learning and Conditional Generation with Extra Data [77.31213472792088]
クラスラベルデータの不足は、多くの機械学習問題において、ユビキタスなボトルネックとなっている。
本稿では, 正負ラベル付き(PU)分類と, 余分なラベル付きデータによる条件生成を活用することで, この問題に対処する。
本稿では,PU分類と条件生成を併用した新たなトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-14T08:27:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。