論文の概要: Fairness, Semi-Supervised Learning, and More: A General Framework for
Clustering with Stochastic Pairwise Constraints
- arxiv url: http://arxiv.org/abs/2103.02013v1
- Date: Tue, 2 Mar 2021 20:27:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-04 14:49:23.157972
- Title: Fairness, Semi-Supervised Learning, and More: A General Framework for
Clustering with Stochastic Pairwise Constraints
- Title(参考訳): フェアネス、半教師付き学習など:確率的ペアワイズ制約によるクラスタリングの汎用フレームワーク
- Authors: Brian Brubach, Darshan Chakrabarti, John P. Dickerson, Aravind
Srinivasan, Leonidas Tsepenekas
- Abstract要約: 我々は,いくつかの本質的クラスタリングの目的に組み込んだ,新しいemphstochastic pairwise制約系を導入する。
これらの制約は,半教師付き学習における emphinvidual fairness や emphmust-link 制約など,興味をそそるアプリケーションの集合を簡潔にモデル化できることを示す。
- 参考スコア(独自算出の注目度): 32.19047459493177
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Metric clustering is fundamental in areas ranging from Combinatorial
Optimization and Data Mining, to Machine Learning and Operations Research.
However, in a variety of situations we may have additional requirements or
knowledge, distinct from the underlying metric, regarding which pairs of points
should be clustered together. To capture and analyze such scenarios, we
introduce a novel family of \emph{stochastic pairwise constraints}, which we
incorporate into several essential clustering objectives (radius/median/means).
Moreover, we demonstrate that these constraints can succinctly model an
intriguing collection of applications, including among others \emph{Individual
Fairness} in clustering and \emph{Must-link} constraints in semi-supervised
learning. Our main result consists of a general framework that yields
approximation algorithms with provable guarantees for important clustering
objectives, while at the same time producing solutions that respect the
stochastic pairwise constraints. Furthermore, for certain objectives we devise
improved results in the case of Must-link constraints, which are also the best
possible from a theoretical perspective. Finally, we present experimental
evidence that validates the effectiveness of our algorithms.
- Abstract(参考訳): メトリクスクラスタリングは、コンビナート最適化とデータマイニングから機械学習と運用研究まで、さまざまな分野で基本的です。
しかし、さまざまな状況では、どのペアのポイントを一緒にクラスタ化すべきかについて、基本的なメトリクスと異なる追加の要件や知識があるかもしれません。
このようなシナリオを捉え、分析するために、我々はいくつかの必須クラスタリングの目的(半径/中間/平均)に組み込む新しい \emph{確率対方向制約} ファミリーを紹介します。
さらに,これらの制約は,半教師付き学習において,クラスタリングにおける「emph{individual fairness}」や「emph{must-link}」制約を含む,興味をそそるアプリケーションの集合を簡潔にモデル化できることを実証する。
我々の主な成果は、重要なクラスタリング目的に対して証明可能な保証を持つ近似アルゴリズムを出力する一般的なフレームワークと、確率的対の制約を尊重するソリューションを作成することからなる。
さらに,特定の目的に対して,理論的な観点から可能な最善の条件である必然的制約の場合に,改良された結果を考案する。
最後に,アルゴリズムの有効性を検証する実験的な証拠を示す。
関連論文リスト
- Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - GCC: Generative Calibration Clustering [55.44944397168619]
本稿では,特徴学習と拡張をクラスタリングに組み込む新しいGCC法を提案する。
まず,実検体と実検体間の固有関係を識別する識別的特徴アライメント機構を開発する。
第二に、より信頼性の高いクラスタ割り当てを生成するための自己教師付きメトリック学習を設計する。
論文 参考訳(メタデータ) (2024-04-14T01:51:11Z) - Memetic Differential Evolution Methods for Semi-Supervised Clustering [0.8681835475119588]
MDEClustの半教師付き最小二乗クラスタリング(MSSC)問題に対する拡張を提案する。
我々の新しいフレームワークであるS-MDEClustは、最適な実現可能なソリューションを生成するために設計された最初のメメカティックな方法論である。
論文 参考訳(メタデータ) (2024-03-07T08:37:36Z) - Neural Capacitated Clustering [6.155158115218501]
本稿では,クラスタセンターへのポイントの割り当て確率を予測するニューラルネットワークを学習する,容量クラスタリング問題(CCP)の新しい手法を提案する。
人工データと2つの実世界のデータセットに関する実験では、我々のアプローチは文学の最先端の数学的および解法よりも優れています。
論文 参考訳(メタデータ) (2023-02-10T09:33:44Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Cluster-and-Conquer: A Framework For Time-Series Forecasting [94.63501563413725]
本稿では,高次元時系列データを予測するための3段階フレームワークを提案する。
当社のフレームワークは非常に汎用的で,各ステップで時系列予測やクラスタリングが利用可能です。
単純な線形自己回帰モデルでインスタンス化されると、いくつかのベンチマークデータセットで最先端の結果が得られる。
論文 参考訳(メタデータ) (2021-10-26T20:41:19Z) - Clustering to the Fewest Clusters Under Intra-Cluster Dissimilarity
Constraints [0.0]
均等なクラスタリングは、密度も期待されるクラスの数にも依存せず、相似性の閾値にも依存します。
このクラスタリング問題に対する様々な実践的ソリューション間のトレードオフを特定するために,適切なクラスタリングアルゴリズムをレビューし,評価する。
論文 参考訳(メタデータ) (2021-09-28T12:02:18Z) - Transductive Few-Shot Learning: Clustering is All You Need? [31.21306826132773]
そこで本研究では,プロトタイプをベースとした超越的数ショット学習の汎用的定式化について検討する。
提案手法は, 精度と最適化の観点から, 大きな問題にスケールアップしながら, 競争性能を向上する。
驚いたことに、私たちの一般的なモデルは、最先端の学習と比較して、すでに競争力のあるパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2021-06-16T16:14:01Z) - HAWKS: Evolving Challenging Benchmark Sets for Cluster Analysis [2.5329716878122404]
クラスタリングアルゴリズムの包括的なベンチマークは難しい。
厳格なベンチマークのベストプラクティスに関する合意はありません。
このようなベンチマークのフレキシブルな生成を支援するために,進化的アルゴリズムが果たす重要な役割を実証する。
論文 参考訳(メタデータ) (2021-02-13T15:01:34Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Combining Task Predictors via Enhancing Joint Predictability [53.46348489300652]
そこで本研究では,目標予測能力に基づいて参照の関連性を測定し,その関連性を高めるための新しい予測器組合せアルゴリズムを提案する。
提案アルゴリズムはベイズフレームワークを用いて,すべての参照の関連性について共同で評価する。
視覚属性ランキングとマルチクラス分類シナリオから得られた実世界の7つのデータセットの実験に基づいて,本アルゴリズムが性能向上に寄与し,既存の予測器の組み合わせアプローチの適用範囲を広くすることを示した。
論文 参考訳(メタデータ) (2020-07-15T21:58:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。