論文の概要: Fair-Capacitated Clustering
- arxiv url: http://arxiv.org/abs/2104.12116v1
- Date: Sun, 25 Apr 2021 09:39:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-28 09:33:37.090119
- Title: Fair-Capacitated Clustering
- Title(参考訳): Fair-Capacitated Clustering
- Authors: Tai Le Quy, Arjun Roy, Gunnar Friege and Eirini Ntoutsi
- Abstract要約: クラスタの公平性とクラスタ濃度のバランスを確保しつつ、データを同様のインスタンスのクラスタに分割する、フェアキャパシテーションクラスタリングの問題を導入する。
4つの教育データセットに関する実験では,クラスタ品質を維持しつつ,公平性と濃度の両面で,バランスの取れたクラスタを提供する方法が示されている。
- 参考スコア(独自算出の注目度): 5.127121704630949
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Traditionally, clustering algorithms focus on partitioning the data into
groups of similar instances. The similarity objective, however, is not
sufficient in applications where a fair-representation of the groups in terms
of protected attributes like gender or race, is required for each cluster.
Moreover, in many applications, to make the clusters useful for the end-user, a
balanced cardinality among the clusters is required. Our motivation comes from
the education domain where studies indicate that students might learn better in
diverse student groups and of course groups of similar cardinality are more
practical e.g., for group assignments.To this end, we introduce the
fair-capacitated clustering problem that partitions the data into clusters of
similar instances while ensuring cluster fairness and balancing cluster
cardinalities. We propose a two-step solution to the problem: i) we rely on
fairlets to generate minimal sets that satisfy the fair constraint and ii) we
propose two approaches, namely hierarchical clustering and partitioning-based
clustering, to obtain the fair-capacitated clustering. The hierarchical
approach embeds the additional cardinality requirements during the merging step
while the partitioning-based one alters the assignment step using a knapsack
problem formulation to satisfy the additional requirements. Our experiments on
four educational datasets show that our approaches deliver well-balanced
clusters in terms of both fairness and cardinality while maintaining a good
clustering quality.
- Abstract(参考訳): 従来、クラスタリングアルゴリズムは、データを同様のインスタンスのグループに分割することに重点を置いていた。
しかし、類似性の目的は、各クラスタに対して性別や人種などの保護された属性の観点からグループを公平に表現するアプリケーションでは不十分である。
さらに、多くのアプリケーションにおいて、クラスタをエンドユーザにとって有用なものにするためには、クラスタ間の平衡基数が必要である。
我々のモチベーションは、学生が多様な学生集団でより良く学ぶことができることを示し、もちろん、類似の濃度の集団は、例えば、グループ割り当てにおいてより実践的であることを示唆する教育分野から来ており、この目的のために、クラスタの公平性を確保し、クラスタの濃度のバランスを保ちながら、データを類似のインスタンスのクラスタに分割する公平なクラスタリング問題を導入する。
本稿では,この問題に対する2段階の解法を提案する。i) 公平制約を満たす最小集合を生成するために,fairletsに頼り,ii) 階層クラスタリングとパーティショニングベースのクラスタリングという2つのアプローチを提案する。
階層的アプローチはマージステップ中に追加の濃度要求を埋め込み、分割ベースは追加要件を満たすためにクナップサック問題定式化を使用して割り当てステップを変更する。
4つの教育データセットに関する実験では,クラスタ品質を維持しつつ,公平性と濃度の両面で,バランスの取れたクラスタを提供する方法が示されている。
関連論文リスト
- Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Fair Minimum Representation Clustering via Integer Programming [0.6906005491572401]
クラスタリングは、データをクラスタの集合に分割することを目的とした教師なしの学習タスクである。
本稿では,各群が最小表現レベルを持つ必要があるという制約を伴って,k平均とkメダニアンのクラスタリング問題を考察する。
フェアネス制約を直接組み込んだ,MiniReLと呼ばれる交代最小化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-09-04T00:13:40Z) - A3S: A General Active Clustering Method with Pairwise Constraints [66.74627463101837]
A3Sは、適応クラスタリングアルゴリズムによって得られる初期クラスタ結果に対して、戦略的にアクティブクラスタリングを調整する。
さまざまな実世界のデータセットにわたる広範な実験において、A3Sは、人間のクエリを著しく少なくして、望ましい結果を達成する。
論文 参考訳(メタデータ) (2024-07-14T13:37:03Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Cluster-level Group Representativity Fairness in $k$-means Clustering [3.420467786581458]
クラスタリングアルゴリズムは、異なるグループが異なるクラスタ内で不利になるようにクラスタを生成することができる。
我々は,古典的アルゴリズムに先駆けて,セントロイドクラスタリングパラダイムに基づくクラスタリングアルゴリズムを開発した。
本手法はクラスタレベルの表現性フェアネスを,クラスタのコヒーレンスに低い影響で向上させるのに有効であることを示す。
論文 参考訳(メタデータ) (2022-12-29T22:02:28Z) - Socially Fair Center-based and Linear Subspace Clustering [8.355270405285909]
センターベースのクラスタリングと線形サブスペースクラスタリングは、現実世界のデータを小さなクラスタに分割する一般的なテクニックである。
異なる敏感なグループに対する1点当たりのクラスタリングコストは、公平性に関連する害をもたらす可能性がある。
本稿では,社会的に公平なセンタベースのクラスタリングと線形サブスペースクラスタリングを解決するための統一的なフレームワークを提案する。
論文 参考訳(メタデータ) (2022-08-22T07:10:17Z) - Fair Labeled Clustering [28.297893914525517]
クラスタリングのダウンストリーム適用と,そのような設定に対してグループフェアネスをどのように確保するかを検討する。
このような問題に対するアルゴリズムを提供し、グループフェアクラスタリングにおけるNPハードのアルゴリズムとは対照的に、効率的な解が可能であることを示す。
また、距離空間における中心位置に関係なく、意思決定者が自由にクラスタにラベルを割り当てることができるような、モチベーションのよい代替設定についても検討する。
論文 参考訳(メタデータ) (2022-05-28T07:07:12Z) - Clustering to the Fewest Clusters Under Intra-Cluster Dissimilarity
Constraints [0.0]
均等なクラスタリングは、密度も期待されるクラスの数にも依存せず、相似性の閾値にも依存します。
このクラスタリング問題に対する様々な実践的ソリューション間のトレードオフを特定するために,適切なクラスタリングアルゴリズムをレビューし,評価する。
論文 参考訳(メタデータ) (2021-09-28T12:02:18Z) - You Never Cluster Alone [150.94921340034688]
我々は、主流のコントラスト学習パラダイムをクラスタレベルのスキームに拡張し、同じクラスタに属するすべてのデータが統一された表現に寄与する。
分類変数の集合をクラスタ化代入信頼度として定義し、インスタンスレベルの学習トラックとクラスタレベルの学習トラックを関連付ける。
代入変数を再パラメータ化することで、TCCはエンドツーエンドでトレーニングされる。
論文 参考訳(メタデータ) (2021-06-03T14:59:59Z) - Graph Contrastive Clustering [131.67881457114316]
本稿では,クラスタリングタスクに適用可能な新しいグラフコントラスト学習フレームワークを提案し,gcc(graph constrastive clustering)法を考案した。
特に、グラフラプラシアンに基づくコントラスト損失は、より識別的かつクラスタリングフレンドリーな特徴を学ぶために提案されている。
一方で、よりコンパクトなクラスタリング割り当てを学ぶために、グラフベースのコントラスト学習戦略が提案されている。
論文 参考訳(メタデータ) (2021-04-03T15:32:49Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。