Fugu-MT 論文翻訳(概要): Deep Fair Clustering via Maximizing and Minimizing Mutual Information: Theory, Algorithm and Metric

論文の概要: Deep Fair Clustering via Maximizing and Minimizing Mutual Information: Theory, Algorithm and Metric

arxiv url: http://arxiv.org/abs/2209.12396v2
Date: Thu, 20 Apr 2023 04:07:41 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-24 18:08:51.214056
Title: Deep Fair Clustering via Maximizing and Minimizing Mutual Information: Theory, Algorithm and Metric
Title（参考訳）: 相互情報の最大化と最小化によるディープフェアクラスタリング:理論、アルゴリズム、メトリクス
Authors: Pengxin Zeng, Yunfan Li, Peng Hu, Dezhong Peng, Jiancheng Lv, Xi Peng
Abstract要約: 我々は,深層クラスタリングのための相互情報理論を開発し,FCMIと呼ばれる新しいアルゴリズムを設計する。 FCMIは、深い公正クラスタリング、例えば、コンパクトでバランスの取れた、公平なクラスタ、および情報的特徴によって期待される4つの特徴を達成するように設計されている。既存の評価指標とは異なり、我々の測定基準はクラスタリングの品質と公平さを個別の方法ではなく全体として測定します。
参考スコア（独自算出の注目度）: 28.40833362941683
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Fair clustering aims to divide data into distinct clusters while preventing sensitive attributes (\textit{e.g.}, gender, race, RNA sequencing technique) from dominating the clustering. Although a number of works have been conducted and achieved huge success recently, most of them are heuristical, and there lacks a unified theory for algorithm design. In this work, we fill this blank by developing a mutual information theory for deep fair clustering and accordingly designing a novel algorithm, dubbed FCMI. In brief, through maximizing and minimizing mutual information, FCMI is designed to achieve four characteristics highly expected by deep fair clustering, \textit{i.e.}, compact, balanced, and fair clusters, as well as informative features. Besides the contributions to theory and algorithm, another contribution of this work is proposing a novel fair clustering metric built upon information theory as well. Unlike existing evaluation metrics, our metric measures the clustering quality and fairness as a whole instead of separate manner. To verify the effectiveness of the proposed FCMI, we conduct experiments on six benchmarks including a single-cell RNA-seq atlas compared with 11 state-of-the-art methods in terms of five metrics. The code could be accessed from \url{ https://pengxi.me}.
Abstract（参考訳）: Fair Clusteringは、機密属性(\textit{e.}, gender, race, RNAシークエンシング技術)がクラスタリングを支配するのを防ぎながら、データを異なるクラスタに分割することを目的としている。近年、多くの研究が実施され大きな成功を収めているが、そのほとんどはヒューリスティックであり、アルゴリズム設計の統一理論が欠如している。本研究では, 深層クラスタリングのための相互情報理論を開発し, FCMIと呼ばれる新しいアルゴリズムを設計することによって, この空白を埋める。簡単に言うと、相互情報の最大化と最小化により、fcmiは、deep fair clustering、 \textit{i.e}、compact、 balanced、fair clusters、および情報的特徴により、非常に期待される4つの特徴を達成するように設計されている。理論とアルゴリズムへの貢献に加えて、この研究のもう一つの貢献は、情報理論に基づく新しい公正クラスタリング計量の提案である。既存の評価基準と異なり、当社のメトリクスはクラスタの品質と公平性を個別の方法で測定します。提案するFCMIの有効性を検証するため,単細胞RNA-seqアトラスを含む6つのベンチマーク実験を行った。コードは \url{ https://pengxi.me}からアクセスできる。

関連論文リスト

Fair Model-based Clustering [11.871560374559566]
FMC(Fair Model-based Clustering)と呼ばれる,有限混合モデルに基づく新しいフェアクラスタリングアルゴリズムを提案する。 FMCの主な利点は、学習可能なパラメータの数がサンプルサイズに依存しないため、容易にスケールアップできる点である。 FMCは、確率が適切に定義されている限り、非測定データに適用できる。
論文参考訳（メタデータ） (2026-02-25T02:41:16Z)
Scalable Parameter-Light Spectral Method for Clustering Short Text Embeddings with a Cohesion-Based Evaluation Metric [3.7723788828505125]
短いテキストの埋め込みをクラスタ化することは自然言語処理の基本的なタスクである。本稿では,ラプラシア固有スペクトルの構造から直接クラスタ数を推定するスケーラブルなスペクトル法を提案する。また、単純かつ解釈可能な評価指標である凝集比も提案する。
論文参考訳（メタデータ） (2025-11-24T17:52:58Z)
An Enhanced Model-based Approach for Short Text Clustering [58.60681789677676]
Twitter、Google+、Facebookなどのソーシャルメディアの人気が高まり、短いテキストのクラスタリングがますます重要になっている。既存の手法は、トピックモデルに基づくアプローチと深層表現学習に基づくアプローチの2つのパラダイムに大別することができる。短文の空間性と高次元性を効果的に扱えるDirichlet Multinomial Mixture Model (GSDMM) のギブスサンプリングアルゴリズムを提案する。さらなる改良を保証しているGSDMMのいくつかの側面に基づいて,さらなる性能向上を目的とした改良されたアプローチであるGSDMM+を提案する。
論文参考訳（メタデータ） (2025-07-18T10:07:42Z)
TNStream: Applying Tightest Neighbors to Micro-Clusters to Define Multi-Density Clusters in Streaming Data [1.2016321065590192]
本稿では,Tightest Neighbors の概念に基づくクラスタリングアルゴリズムを提案し,Skeleton Set に基づくデータストリームクラスタリング理論を提案する。これらの理論に基づいて,完全オンラインアルゴリズムであるTNStreamを開発した。実験により,マルチ密度データのクラスタリング品質向上効果と,提案したデータストリームクラスタリング理論の有効性が示された。
論文参考訳（メタデータ） (2025-05-01T07:15:20Z)
THESAURUS: Contrastive Graph Clustering by Swapping Fused Gromov-Wasserstein Couplings [9.805171821491207]
We present conTrastive grapH clustEring by SwApping fUsed gRomov-wasserstein couplingS (THESAURUS) 本手法では,コンテキスト情報を提供するためのセマンティックプロトタイプを導入し,クロスビュー代入予測プレテキストタスクを採用する。これはGromov-Wasserstein Optimal Transport (GW-OT) と提案したプロトタイプグラフを利用して、グラフ構造のクラスタ情報を徹底的に活用する。
論文参考訳（メタデータ） (2024-12-16T08:33:56Z)
Categorical Data Clustering via Value Order Estimated Distance Metric Learning [53.28598689867732]
本稿では,分類属性を直感的に表現する新しい順序距離計量学習手法を提案する。新しい共同学習パラダイムが開発され、クラスタリングとオーダー距離メートル法学習の代替となる。提案手法は分類および混合データセットのクラスタリング精度に優れる。
論文参考訳（メタデータ） (2024-11-19T08:23:25Z)
Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文参考訳（メタデータ） (2024-09-24T08:59:51Z)
ABCDE: Application-Based Cluster Diff Evals [49.1574468325115]
それは実用性を目指しており、アイテムはアプリケーション固有の重要な値を持つことができ、クラスタリングがどちらが優れているかを判断するときに人間の判断を使うのは粗悪であり、アイテムの任意のスライスのためのメトリクスを報告できる。クラスタリング品質の差分を測定するアプローチは、高価な地平を前もって構築し、それに関して各クラスタリングを評価する代わりに、ABCDEはクラスタリング間の実際の差分に基づいて、判定のための質問をサンプリングする。
論文参考訳（メタデータ） (2024-07-31T08:29:35Z)
OMH: Structured Sparsity via Optimally Matched Hierarchy for Unsupervised Semantic Segmentation [69.37484603556307]
Un Semantic segmenting (USS)は、事前に定義されたラベルに頼ることなく、イメージをセグメント化する。上記の問題を同時に解決するために,OMH (Optimally Matched Hierarchy) という新しいアプローチを導入する。我々のOMHは既存のUSS法と比較して教師なしセグメンテーション性能がよい。
論文参考訳（メタデータ） (2024-03-11T09:46:41Z)
Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文参考訳（メタデータ） (2023-08-13T18:12:28Z)
Hybrid Fuzzy-Crisp Clustering Algorithm: Theory and Experiments [0.0]
本稿では,対象関数の線形項と2次項を組み合わせたファジィクロップクラスタリングアルゴリズムを提案する。このアルゴリズムでは、クラスタへのデータポイントのメンバシップが、クラスタセンタから十分に離れていれば、自動的に正確にゼロに設定される。提案アルゴリズムは、不均衡なデータセットの従来の手法よりも優れており、よりバランスの取れたデータセットと競合することができる。
論文参考訳（メタデータ） (2023-03-25T05:27:26Z)
Clustering with minimum spanning trees: How good can it be? [1.9999259391104391]
低次元分割データクラスタリングタスクにおいて、最小分散木が意味のある範囲を定量化する。我々は、既存の最先端のMSTベースの分割スキームをレビューし、研究し、拡張し、一般化する。全体として、Genieと情報理論の手法は、MST以外のアルゴリズムよりも優れていることが多い。
論文参考訳（メタデータ） (2023-03-10T03:18:03Z)
Can Evolutionary Clustering Have Theoretical Guarantees? [21.343803954998915]
進化的クラスタリングは多くの成功例を見出したが、すべての結果は実証的であり、理論的な支持が欠如している。本稿では,GSEMOの近似性能を理論的に保証できることを証明して,このギャップを埋める。
論文参考訳（メタデータ） (2022-12-04T09:00:35Z)
Very Compact Clusters with Structural Regularization via Similarity and Connectivity [3.779514860341336]
本稿では,汎用データセットのためのエンドツーエンドのディープクラスタリングアルゴリズムであるVery Compact Clusters (VCC)を提案する。提案手法は,最先端のクラスタリング手法よりも優れたクラスタリング性能を実現する。
論文参考訳（メタデータ） (2021-06-09T23:22:03Z)
Unsupervised Visual Representation Learning by Online Constrained K-Means [44.38989920488318]
クラスタ識別は、教師なし表現学習の効果的な前提課題である。オンラインtextbfConstrained textbfK-mtextbfeans (textbfCoKe) を用いたクラスタリングに基づく新しいプリテキストタスクを提案する。当社のオンライン割当て方式は,グローバルな最適化に近づくための理論的保証を持っている。
論文参考訳（メタデータ） (2021-05-24T20:38:32Z)
Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文参考訳（メタデータ） (2020-10-22T15:58:35Z)
Structured Graph Learning for Clustering and Semi-supervised Classification [74.35376212789132]
データの局所構造とグローバル構造の両方を保存するためのグラフ学習フレームワークを提案する。本手法は, サンプルの自己表現性を利用して, 局所構造を尊重するために, 大域的構造と適応的隣接アプローチを捉える。我々のモデルは、ある条件下でのカーネルk平均法とk平均法の組合せと等価である。
論文参考訳（メタデータ） (2020-08-31T08:41:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。