論文の概要: A General Anchor-Based Framework for Scalable Fair Clustering
- arxiv url: http://arxiv.org/abs/2511.09889v1
- Date: Fri, 14 Nov 2025 01:16:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-14 22:53:22.551083
- Title: A General Anchor-Based Framework for Scalable Fair Clustering
- Title(参考訳): スケーラブルフェアクラスタリングのための一般的なアンカーベースフレームワーク
- Authors: Shengfei Wei, Suyuan Liu, Jun Wang, Ke Liang, Miaomiao Li, Lei Luo,
- Abstract要約: AnchorベースのFair Clustering Framework(AFCF)を紹介します。
AFCFは任意の公正クラスタリングアルゴリズムを線形時間拡張性で強化する。
理論的には、データセット全体における最終クラスタリングの公平性は、アンカークラスタリングの公平性と一致することが証明されている。
- 参考スコア(独自算出の注目度): 20.252573532319875
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fair clustering is crucial for mitigating bias in unsupervised learning, yet existing algorithms often suffer from quadratic or super-quadratic computational complexity, rendering them impractical for large-scale datasets. To bridge this gap, we introduce the Anchor-based Fair Clustering Framework (AFCF), a novel, general, and plug-and-play framework that empowers arbitrary fair clustering algorithms with linear-time scalability. Our approach first selects a small but representative set of anchors using a novel fair sampling strategy. Then, any off-the-shelf fair clustering algorithm can be applied to this small anchor set. The core of our framework lies in a novel anchor graph construction module, where we formulate an optimization problem to propagate labels while preserving fairness. This is achieved through a carefully designed group-label joint constraint, which we prove theoretically ensures that the fairness of the final clustering on the entire dataset matches that of the anchor clustering. We solve this optimization efficiently using an ADMM-based algorithm. Extensive experiments on multiple large-scale benchmarks demonstrate that AFCF drastically accelerates state-of-the-art methods, which reduces computational time by orders of magnitude while maintaining strong clustering performance and fairness guarantees.
- Abstract(参考訳): 公正クラスタリングは教師なし学習におけるバイアスを軽減するために不可欠だが、既存のアルゴリズムは2次的あるいは超四次計算の複雑さに悩まされ、大規模なデータセットでは実用的ではない。
このギャップを埋めるために、AnchorベースのFair Clustering Framework(AFCF)を紹介します。
提案手法は、まず、新しいフェアサンプリング戦略を用いて、小さいが代表的なアンカー群を選択する。
そして、この小さなアンカーセットに任意の既製のフェアクラスタリングアルゴリズムを適用することができる。
フレームワークのコアは、新しいアンカーグラフ構築モジュールにあり、公正性を維持しながらラベルを伝搬する最適化問題を定式化します。
これは、慎重に設計されたグループラベルのジョイント制約によって実現され、この制約は、データセット全体の最終的なクラスタリングの公平性がアンカークラスタリングの公正性に一致することを理論的に証明する。
我々はADMMに基づくアルゴリズムを用いて,この最適化を効率的に解く。
複数の大規模ベンチマークでの大規模な実験により、AFCFは最先端の手法を劇的に加速し、クラスタリング性能と公正性の保証を維持しながら、桁違いに計算時間を短縮することを示した。
関連論文リスト
- Accelerating Spectral Clustering under Fairness Constraints [56.865810822418744]
本研究では,Fair SC問題を凸関数(DC)フレームワークの差内にキャストすることで,フェアスペクトルクラスタリング(Fair SC)のための新しい効率的な手法を提案する。
本研究では,各サブプロブレムを効率よく解き,計算効率が先行処理よりも高いことを示す。
論文 参考訳(メタデータ) (2025-06-09T18:46:27Z) - Fair Clustering via Alignment [12.12426896501947]
クラスタリングにおけるアルゴリズムフェアネスは、与えられた機密属性に対して各クラスタに割り当てられたインスタンスの割合をバランスさせることを目的としている。
本稿では, 対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対
論文 参考訳(メタデータ) (2025-05-14T04:29:09Z) - Towards Learnable Anchor for Deep Multi-View Clustering [49.767879678193005]
本稿では,線形時間でクラスタリングを行うDeep Multi-view Anchor Clustering (DMAC)モデルを提案する。
最適なアンカーを用いて、全サンプルグラフを計算し、クラスタリングのための識別的埋め込みを導出する。
いくつかのデータセットの実験では、最先端の競合に比べてDMACの性能と効率が優れていることが示されている。
論文 参考訳(メタデータ) (2025-03-16T09:38:11Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Revisiting Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [85.51611950757643]
IAC (Instance-Adaptive Clustering, インスタンス適応クラスタリング) を提案する。
IACは$ MathcalO(n, textpolylog(n) $の計算複雑性を維持しており、大規模問題に対してスケーラブルで実用的なものである。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Proportionally Representative Clustering [17.5359577544947]
本稿では,クラスタリング問題を対象とした新しい公理比例代表フェアネス(PRF)を提案する。
我々のフェアネスの概念は、既存のフェアクラスタリングアルゴリズムで満たされていない。
制約のない設定に対する我々のアルゴリズムは、よく研究されたプロポーショナルフェアネス(PF)の公理に対する最初の既知時間近似アルゴリズムでもある。
論文 参考訳(メタデータ) (2023-04-27T02:01:24Z) - Deep Fair Discriminative Clustering [24.237000220172906]
2値および多状態保護状態変数(PSV)に対するグループレベルの公正性の一般概念について検討する。
本稿では,クラスタリング目標とフェアネス目標とを組み合わせて,フェアクラスタを適応的に学習する改良学習アルゴリズムを提案する。
本フレームワークは, フレキシブルフェアネス制約, マルチステートPSV, 予測クラスタリングなど, 新規なクラスタリングタスクに対して有望な結果を示す。
論文 参考訳(メタデータ) (2021-05-28T23:50:48Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。