論文の概要: Fairness in Streaming Submodular Maximization: Algorithms and Hardness
- arxiv url: http://arxiv.org/abs/2010.07431v2
- Date: Sun, 18 Oct 2020 18:05:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 14:30:34.591856
- Title: Fairness in Streaming Submodular Maximization: Algorithms and Hardness
- Title(参考訳): ストリーミングサブモジュール最大化の公正性:アルゴリズムと硬さ
- Authors: Marwa El Halabi, Slobodan Mitrovi\'c, Ashkan Norouzi-Fard, Jakab
Tardos, Jakub Tarnawski
- Abstract要約: 本研究では,モノトーン関数と非モノトーン関数の両方に対して,不均一条件下でのサブモジュラーに対する最初のストリーミング近似を開発した。
DPPに基づく映画レコメンデーション,クラスタリングによる要約,ソーシャルネットワークにおける最大カバレッジについて検討した。
- 参考スコア(独自算出の注目度): 20.003009252240222
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Submodular maximization has become established as the method of choice for
the task of selecting representative and diverse summaries of data. However, if
datapoints have sensitive attributes such as gender or age, such machine
learning algorithms, left unchecked, are known to exhibit bias: under- or
over-representation of particular groups. This has made the design of fair
machine learning algorithms increasingly important. In this work we address the
question: Is it possible to create fair summaries for massive datasets? To this
end, we develop the first streaming approximation algorithms for submodular
maximization under fairness constraints, for both monotone and non-monotone
functions. We validate our findings empirically on exemplar-based clustering,
movie recommendation, DPP-based summarization, and maximum coverage in social
networks, showing that fairness constraints do not significantly impact
utility.
- Abstract(参考訳): データの代表的および多種多様な要約を選択するタスクの選択方法として,部分モジュラ最大化が確立されている。
しかし、データポイントが性別や年齢などのセンシティブな属性を持つ場合、未確認の機械学習アルゴリズムは、特定のグループの下位または過剰表現のバイアスを示すことが知られている。
これにより、公正な機械学習アルゴリズムの設計がますます重要になっている。
大規模なデータセットに対して、公正な要約を作成することは可能か?
そこで本研究では, モノトーン関数と非モノトーン関数の両方に対して, 公平性制約下でのサブモジュラー最大化のための最初のストリーミング近似アルゴリズムを開発した。
本研究は,従来型のクラスタリング,映画レコメンデーション,DPPに基づく要約,ソーシャルネットワークにおける最大カバレッジについて実証的に検証し,公平性制約が実用性に大きく影響しないことを示した。
関連論文リスト
- A Weighted K-Center Algorithm for Data Subset Selection [70.49696246526199]
サブセット選択は、トレーニングデータの小さな部分を特定する上で重要な役割を果たす、基本的な問題である。
我々は,k中心および不確かさサンプリング目的関数の重み付け和に基づいて,サブセットを計算する新しい係数3近似アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-12-17T04:41:07Z) - Amortizing intractable inference in large language models [56.92471123778389]
難治性後部分布のサンプルとして, 償却ベイズ推定を用いる。
我々は,LLMファインチューニングの分散マッチングパラダイムが,最大習熟の代替となることを実証的に実証した。
重要な応用として、チェーン・オブ・ソート推論を潜在変数モデリング問題として解釈する。
論文 参考訳(メタデータ) (2023-10-06T16:36:08Z) - Fairness in Streaming Submodular Maximization over a Matroid Constraint [19.27202441717429]
この問題の自然な一般化をマトロイド制約に当てはめる。
ストリーミングアルゴリズムと、効率、品質、公正性のトレードオフを提供する非可視性結果を提供しています。
論文 参考訳(メタデータ) (2023-05-24T13:10:46Z) - Achieving Long-term Fairness in Submodular Maximization through
Randomization [16.33001220320682]
人種や性別などのセンシティブな属性を含む可能性のあるデータアイテムを扱う場合、公平性を意識したアルゴリズムを実装することが重要です。
群フェアネス制約を満たしながら単調部分モジュラ函数を最大化する問題について検討する。
論文 参考訳(メタデータ) (2023-04-10T16:39:19Z) - Group Fairness in Non-monotone Submodular Maximization [19.29174615532181]
群フェアネス制約を考慮した非単調部分モジュラー問題について検討する。
この問題に対する最初の定数近似アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-02-03T04:51:54Z) - Group Equality in Adaptive Submodular Maximization [13.619980548779687]
非適応的条件と適応的条件の両方で群等式制約を受ける古典的部分モジュラー問題について検討する。
この問題に対する最初の定数近似アルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-07-07T15:12:02Z) - Deep F-measure Maximization for End-to-End Speech Understanding [52.36496114728355]
本稿では,F測度に対する微分可能な近似法を提案し,標準バックプロパゲーションを用いてネットワークをトレーニングする。
我々は、アダルト、コミュニティ、犯罪の2つの標準フェアネスデータセットの実験を行い、ATISデータセットの音声・インテリジェンス検出と音声・COCOデータセットの音声・イメージ概念分類を行った。
これらの4つのタスクのすべてにおいて、F測定は、クロスエントロピー損失関数で訓練されたモデルと比較して、最大8%の絶対的な絶対的な改善を含む、マイクロF1スコアの改善をもたらす。
論文 参考訳(メタデータ) (2020-08-08T03:02:27Z) - Slice Sampling for General Completely Random Measures [74.24975039689893]
本稿では, 後続推定のためのマルコフ連鎖モンテカルロアルゴリズムについて, 補助スライス変数を用いてトランケーションレベルを適応的に設定する。
提案アルゴリズムの有効性は、いくつかの一般的な非パラメトリックモデルで評価される。
論文 参考訳(メタデータ) (2020-06-24T17:53:53Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z) - New advances in enumerative biclustering algorithms with online
partitioning [80.22629846165306]
さらに、数値データセットの列に定数値を持つ最大二クラスタの効率的で完全で正しい非冗長列挙を実現できる二クラスタリングアルゴリズムであるRIn-Close_CVCを拡張した。
改良されたアルゴリズムはRIn-Close_CVC3と呼ばれ、RIn-Close_CVCの魅力的な特性を保ちます。
論文 参考訳(メタデータ) (2020-03-07T14:54:26Z) - Margin Maximization as Lossless Maximal Compression [0.3007949058551534]
分類において、可能な限り多くのトレーニング例を最大限の信頼性で正しく分類する機能的マージンは、優れた一般化保証を持つモデルを構築することが知られている。
この研究は、雑音のないデータセットを最大限に圧縮するものとして、マージンを最大化する情報理論的な解釈を与える。
論文 参考訳(メタデータ) (2020-01-28T13:40:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。