論文の概要: Achieving Long-term Fairness in Submodular Maximization through
Randomization
- arxiv url: http://arxiv.org/abs/2304.04700v1
- Date: Mon, 10 Apr 2023 16:39:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-11 14:12:33.859342
- Title: Achieving Long-term Fairness in Submodular Maximization through
Randomization
- Title(参考訳): ランダム化による部分モジュラ最大化の長期公正化
- Authors: Shaojie Tang, Jing Yuan, Twumasi Mensah-Boateng
- Abstract要約: 人種や性別などのセンシティブな属性を含む可能性のあるデータアイテムを扱う場合、公平性を意識したアルゴリズムを実装することが重要です。
群フェアネス制約を満たしながら単調部分モジュラ函数を最大化する問題について検討する。
- 参考スコア(独自算出の注目度): 16.33001220320682
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Submodular function optimization has numerous applications in machine
learning and data analysis, including data summarization which aims to identify
a concise and diverse set of data points from a large dataset. It is important
to implement fairness-aware algorithms when dealing with data items that may
contain sensitive attributes like race or gender, to prevent biases that could
lead to unequal representation of different groups. With this in mind, we
investigate the problem of maximizing a monotone submodular function while
meeting group fairness constraints. Unlike previous studies in this area, we
allow for randomized solutions, with the objective being to calculate a
distribution over feasible sets such that the expected number of items selected
from each group is subject to constraints in the form of upper and lower
thresholds, ensuring that the representation of each group remains balanced in
the long term. Here a set is considered feasible if its size does not exceed a
constant value of $b$. Our research includes the development of a series of
approximation algorithms for this problem.
- Abstract(参考訳): サブモジュール関数最適化は、大規模なデータセットから簡潔で多様なデータポイントを識別することを目的としたデータ要約を含む、機械学習やデータ分析に多くの応用がある。
人種や性別などの繊細な属性を含む可能性のあるデータ項目を扱う場合、公平さを意識したアルゴリズムを実装し、異なるグループの不平等な表現につながるバイアスを防止することが重要である。
そこで,本研究では,群フェアネス制約を満たしながら単調部分モジュラー関数を最大化する問題を考察する。
この領域における以前の研究とは異なり、各群から選択される期待される項目数が上下のしきい値の形で制約を受けるような実現可能集合上の分布を計算し、各群の表現が長期的なバランスを保つことを目的としてランダム化解を許容する。
ここで集合は、そのサイズが定数値$b$を超えなければ実現可能であると考えられる。
我々の研究は、この問題に対する一連の近似アルゴリズムの開発を含む。
関連論文リスト
- Learning Submodular Sequencing from Samples [11.528995186765751]
本稿では,いくつかの複合部分モジュラー関数を最適化するために,シーケンス内の項目の選択とランク付けの問題に対処する。
本稿では,各部分モジュラ関数の曲率に依存する近似比を求めるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-09-09T01:33:13Z) - Beyond Submodularity: A Unified Framework of Randomized Set Selection
with Group Fairness Constraints [19.29174615532181]
グループフェアネス制約を組み込んだランダム化サブセット選択のための統一フレームワークを提案する。
我々の問題には、グローバルなユーティリティ関数と、各グループに対するグループユーティリティ関数のセットが含まれる。
我々の目的は、各実現可能な集合の選択確率を指定して、実現可能な部分集合にまたがる分布を生成することである。
論文 参考訳(メタデータ) (2023-04-13T15:02:37Z) - Group Fairness in Non-monotone Submodular Maximization [19.29174615532181]
群フェアネス制約を考慮した非単調部分モジュラー問題について検討する。
この問題に対する最初の定数近似アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-02-03T04:51:54Z) - Max-Min Diversification with Fairness Constraints: Exact and
Approximation Algorithms [17.57585822765145]
本稿では,小データセットに適した正確なアルゴリズムと,大データセットにスケールする任意の$varepsilon in (0, 1)$に対して$frac1-varepsilon integer 5$-approximationアルゴリズムを提案する。
実世界のデータセットに対する実験は、提案アルゴリズムが既存のデータセットよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-01-05T13:02:35Z) - Optimal Clustering with Bandit Feedback [57.672609011609886]
本稿では,バンディットフィードバックを用いたオンラインクラスタリングの問題点について考察する。
これは、NPハード重み付きクラスタリング問題をサブルーチンとして解決する必要性を回避するための、シーケンシャルなテストのための新しい停止規則を含む。
合成および実世界のデータセットの広範なシミュレーションを通して、BOCの性能は下界と一致し、非適応的ベースラインアルゴリズムよりも大幅に優れることを示す。
論文 参考訳(メタデータ) (2022-02-09T06:05:05Z) - Towards Group Robustness in the presence of Partial Group Labels [61.33713547766866]
入力サンプルとターゲットラベルの間に 急激な相関関係がある ニューラルネットワークの予測を誤った方向に導く
本稿では,制約セットから最悪のグループ割り当てを最適化するアルゴリズムを提案する。
グループ間で総合的な集計精度を維持しつつ,少数集団のパフォーマンス向上を示す。
論文 参考訳(メタデータ) (2022-01-10T22:04:48Z) - Fuzzy Clustering with Similarity Queries [56.96625809888241]
ファジィ(fuzzy, soft objective)は、よく知られた$k$-means問題の一般化である。
クエリを少なくすることで、問題の解決が容易になる。
論文 参考訳(メタデータ) (2021-06-04T02:32:26Z) - Fairness in Streaming Submodular Maximization: Algorithms and Hardness [20.003009252240222]
本研究では,モノトーン関数と非モノトーン関数の両方に対して,不均一条件下でのサブモジュラーに対する最初のストリーミング近似を開発した。
DPPに基づく映画レコメンデーション,クラスタリングによる要約,ソーシャルネットワークにおける最大カバレッジについて検討した。
論文 参考訳(メタデータ) (2020-10-14T22:57:07Z) - From Sets to Multisets: Provable Variational Inference for Probabilistic
Integer Submodular Models [82.95892656532696]
サブモジュール関数は機械学習やデータマイニングにおいて広く研究されている。
本研究では,整数部分モジュラ函数に対する連続DR-部分モジュラ拡張を提案する。
整数部分モジュラー関数によって定義される新しい確率モデルを定式化する。
論文 参考訳(メタデータ) (2020-06-01T22:20:45Z) - Non-Adaptive Adaptive Sampling on Turnstile Streams [57.619901304728366]
カラムサブセット選択、部分空間近似、射影クラスタリング、および空間サブリニアを$n$で使用するターンタイルストリームのボリュームに対する最初の相対エラーアルゴリズムを提供する。
我々の適応的なサンプリング手法は、様々なデータ要約問題に多くの応用をもたらしており、これは最先端を改善するか、より緩和された行列列モデルで以前に研究されただけである。
論文 参考訳(メタデータ) (2020-04-23T05:00:21Z) - Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。
最小クラスタ回復誤差率のアルゴリズムを考案する。
適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2019-10-14T09:18:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。