論文の概要: Fair Labeled Clustering
- arxiv url: http://arxiv.org/abs/2205.14358v2
- Date: Sun, 4 Jun 2023 23:50:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-07 05:24:21.761031
- Title: Fair Labeled Clustering
- Title(参考訳): フェアラベルクラスタリング
- Authors: Seyed A. Esmaeili, Sharmila Duppala, John P. Dickerson, Brian Brubach
- Abstract要約: クラスタリングのダウンストリーム適用と,そのような設定に対してグループフェアネスをどのように確保するかを検討する。
このような問題に対するアルゴリズムを提供し、グループフェアクラスタリングにおけるNPハードのアルゴリズムとは対照的に、効率的な解が可能であることを示す。
また、距離空間における中心位置に関係なく、意思決定者が自由にクラスタにラベルを割り当てることができるような、モチベーションのよい代替設定についても検討する。
- 参考スコア(独自算出の注目度): 28.297893914525517
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Numerous algorithms have been produced for the fundamental problem of
clustering under many different notions of fairness. Perhaps the most common
family of notions currently studied is group fairness, in which proportional
group representation is ensured in every cluster. We extend this direction by
considering the downstream application of clustering and how group fairness
should be ensured for such a setting. Specifically, we consider a common
setting in which a decision-maker runs a clustering algorithm, inspects the
center of each cluster, and decides an appropriate outcome (label) for its
corresponding cluster. In hiring for example, there could be two outcomes,
positive (hire) or negative (reject), and each cluster would be assigned one of
these two outcomes. To ensure group fairness in such a setting, we would desire
proportional group representation in every label but not necessarily in every
cluster as is done in group fair clustering. We provide algorithms for such
problems and show that in contrast to their NP-hard counterparts in group fair
clustering, they permit efficient solutions. We also consider a well-motivated
alternative setting where the decision-maker is free to assign labels to the
clusters regardless of the centers' positions in the metric space. We show that
this setting exhibits interesting transitions from computationally hard to easy
according to additional constraints on the problem. Moreover, when the
constraint parameters take on natural values we show a randomized algorithm for
this setting that always achieves an optimal clustering and satisfies the
fairness constraints in expectation. Finally, we run experiments on real world
datasets that validate the effectiveness of our algorithms.
- Abstract(参考訳): 様々なフェアネスの概念の下でクラスタリングの基本的な問題のために多くのアルゴリズムが作成されている。
おそらく、現在研究されている最も一般的な概念の族は群フェアネスであり、比例群表現はすべてのクラスターで保証される。
このような状況下でのクラスタ化の下流適用と,グループフェア性を保証する方法を考えることで,この方向を拡張する。
具体的には、意思決定者がクラスタリングアルゴリズムを実行し、各クラスタの中央を検査し、対応するクラスタの適切な結果(ラベル)を決定する共通設定を検討する。
例えば、採用する場合には、正(hire)と負(reject)の2つの結果があり、各クラスタには2つの結果のうちの1つが割り当てられる。
このような設定でグループフェア性を確保するためには、すべてのラベルに比例するグループ表現を希望するが、グループフェアクラスタリングで行われているように、すべてのクラスタで必ずしもそうではない。
このような問題に対するアルゴリズムを提供し,グループフェアクラスタリングにおけるnp-hard対応とは対照的に,効率的な解法を実現できることを示す。
また, 計量空間における中心の位置に関係なく, 意思決定者が自由にクラスタにラベルを割り当てることができるような, モチベーションの高い代替設定も検討する。
この設定は,問題に対する追加的な制約により計算困難から容易への興味深い遷移を示す。
さらに、制約パラメータが自然の値を取ると、常に最適なクラスタリングを達成し、期待される公正性制約を満たすこの設定に対するランダム化アルゴリズムを示す。
最後に,実世界のデータセットで実験を行い,アルゴリズムの有効性を検証する。
関連論文リスト
- ABCDE: Application-Based Cluster Diff Evals [49.1574468325115]
それは実用性を目指しており、アイテムはアプリケーション固有の重要な値を持つことができ、クラスタリングがどちらが優れているかを判断するときに人間の判断を使うのは粗悪であり、アイテムの任意のスライスのためのメトリクスを報告できる。
クラスタリング品質の差分を測定するアプローチは、高価な地平を前もって構築し、それに関して各クラスタリングを評価する代わりに、ABCDEはクラスタリング間の実際の差分に基づいて、判定のための質問をサンプリングする。
論文 参考訳(メタデータ) (2024-07-31T08:29:35Z) - Robust Fair Clustering with Group Membership Uncertainty Sets [31.29773979737976]
本研究では,各集団の集団レベルでの表現に近づき,各集団が制約される正準公正クラスタリング問題について検討する。
簡単なノイズモデルを導入し、意思決定者によって与えられるパラメータを少数必要とします。
本稿では,不規則性保証を証明可能なフェアクラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-02T03:11:31Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Cluster-level Group Representativity Fairness in $k$-means Clustering [3.420467786581458]
クラスタリングアルゴリズムは、異なるグループが異なるクラスタ内で不利になるようにクラスタを生成することができる。
我々は,古典的アルゴリズムに先駆けて,セントロイドクラスタリングパラダイムに基づくクラスタリングアルゴリズムを開発した。
本手法はクラスタレベルの表現性フェアネスを,クラスタのコヒーレンスに低い影響で向上させるのに有効であることを示す。
論文 参考訳(メタデータ) (2022-12-29T22:02:28Z) - Gradient Based Clustering [72.15857783681658]
本稿では,クラスタリングの品質を計測するコスト関数の勾配を用いて,距離に基づくクラスタリングの一般的な手法を提案する。
アプローチは反復的な2段階の手順(クラスタ割り当てとクラスタセンターのアップデートの代替)であり、幅広い機能に適用できる。
論文 参考訳(メタデータ) (2022-02-01T19:31:15Z) - You Never Cluster Alone [150.94921340034688]
我々は、主流のコントラスト学習パラダイムをクラスタレベルのスキームに拡張し、同じクラスタに属するすべてのデータが統一された表現に寄与する。
分類変数の集合をクラスタ化代入信頼度として定義し、インスタンスレベルの学習トラックとクラスタレベルの学習トラックを関連付ける。
代入変数を再パラメータ化することで、TCCはエンドツーエンドでトレーニングされる。
論文 参考訳(メタデータ) (2021-06-03T14:59:59Z) - Fair-Capacitated Clustering [5.127121704630949]
我々は、データを類似インスタンスのクラスタに分割する公平なクラスタリング問題を導入する。
本研究では,階層的クラスタリングとパーティショニングに基づくクラスタリングという2つのアプローチを提案する。
4つの教育データセットに関する実験では、公平性とカーディナリティの両面でバランスの取れたクラスタを提供するアプローチが示されています。
論文 参考訳(メタデータ) (2021-04-25T09:39:39Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Probabilistic Fair Clustering [31.628993679745292]
フェアクラスタリングにおける以前の仕事は、グループメンバーシップの完全な知識を前提としている。
近似比を保証したより一般的な設定でクラスタリングアルゴリズムを提案する。
また、異なる群が順序と距離の概念を持つ「計量的メンバーシップ」の問題にも対処する。
論文 参考訳(メタデータ) (2020-06-19T01:34:21Z) - Fair Algorithms for Hierarchical Agglomerative Clustering [17.66340013352806]
Hierarchical Agglomerative Clustering (HAC)アルゴリズムは、現代のデータサイエンスで広く利用されている。
たとえデータセットが特定の保護されたグループに対するバイアスを含むとしても、これらのアルゴリズムが公平であることを保証することが不可欠である。
公平性制約を強制するHACを行うための公正アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-07T01:41:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。