論文の概要: A Tutorial on Discriminative Clustering and Mutual Information
- arxiv url: http://arxiv.org/abs/2505.04484v1
- Date: Wed, 07 May 2025 14:54:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-08 19:07:36.118503
- Title: A Tutorial on Discriminative Clustering and Mutual Information
- Title(参考訳): 識別的クラスタリングと相互情報に関する研究
- Authors: Louis Ohl, Pierre-Alexandre Mattei, Frédéric Precioso,
- Abstract要約: 本稿では,識別的クラスタリング手法の進化に関する歴史的考察を紹介する。
我々は、相互情報が、(深い)識別的クラスタリング手法の進歩の歴史的基盤となっている点を強調した。
また, 相互情報の制限や, 差別的クラスタリング手法の回避方法についても述べる。
- 参考スコア(独自算出の注目度): 20.636200089747867
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To cluster data is to separate samples into distinctive groups that should ideally have some cohesive properties. Today, numerous clustering algorithms exist, and their differences lie essentially in what can be perceived as ``cohesive properties''. Therefore, hypotheses on the nature of clusters must be set: they can be either generative or discriminative. As the last decade witnessed the impressive growth of deep clustering methods that involve neural networks to handle high-dimensional data often in a discriminative manner; we concentrate mainly on the discriminative hypotheses. In this paper, our aim is to provide an accessible historical perspective on the evolution of discriminative clustering methods and notably how the nature of assumptions of the discriminative models changed over time: from decision boundaries to invariance critics. We notably highlight how mutual information has been a historical cornerstone of the progress of (deep) discriminative clustering methods. We also show some known limitations of mutual information and how discriminative clustering methods tried to circumvent those. We then discuss the challenges that discriminative clustering faces with respect to the selection of the number of clusters. Finally, we showcase these techniques using the dedicated Python package, GemClus, that we have developed for discriminative clustering.
- Abstract(参考訳): クラスタデータとは、サンプルを、理想的には結合性を持つべき固有のグループに分離することである。
今日では、多数のクラスタリングアルゴリズムが存在し、それらの差は本質的に「粘性特性」と認識できるものである。
したがって、クラスターの性質に関する仮説は、それらが生成的または識別的である、という設定が必要である。
この10年で、ニューラルネットワークが高次元データをしばしば差別的に扱うようなディープクラスタリング手法が著しく成長するのを目撃した。
本稿では,差別的クラスタリング手法の進化,特に差別的モデルの仮定の性質が時間とともにどのように変化したかについて,決定境界から不均一な批判へ,アクセス可能な歴史的視点を提供することを目的とする。
特に,識別的クラスタリング手法の進歩の歴史的基盤として,相互情報がいかに重要かを強調した。
また, 相互情報の制限や, 差別的クラスタリング手法の回避方法についても述べる。
次に,クラスタ数の選択に関して,識別的クラスタリングが直面する課題について議論する。
最後に、識別クラスタリングのために開発した専用のPythonパッケージであるGemClusを使って、これらのテクニックを紹介します。
関連論文リスト
- Discriminative Ordering Through Ensemble Consensus [12.714723443928298]
コンセンサスクラスタリングからインスピレーションを得て、クラスタリングモデルのセットがデータに隠された構造を発見できると仮定します。
本稿では,クラスタリングモデルとコンセンサス行列との接続距離に基づいて,アンサンブルクラスタリングによる識別順序付けを提案する。
論文 参考訳(メタデータ) (2025-05-07T14:35:39Z) - Improving the Utility of Differentially Private Clustering through Dynamical Processing [4.6289929100615]
この研究は、ユーティリティとプライバシの差分なプライベートクラスタリングのトレードオフを軽減することを目的としている。
既存の作業は、パフォーマンスの低下を示す単純なメソッドに重点を置いている。
論文 参考訳(メタデータ) (2023-04-27T00:13:17Z) - Deep Clustering: A Comprehensive Survey [53.387957674512585]
クラスタリング分析は、機械学習とデータマイニングにおいて必須の役割を果たす。
ディープ・クラスタリングは、ディープ・ニューラルネットワークを使ってクラスタリングフレンドリーな表現を学習することができるが、幅広いクラスタリングタスクに広く適用されている。
ディープクラスタリングに関する既存の調査は、主にシングルビューフィールドとネットワークアーキテクチャに焦点を当てており、クラスタリングの複雑なアプリケーションシナリオを無視している。
論文 参考訳(メタデータ) (2022-10-09T02:31:32Z) - Discriminative Attribution from Counterfactuals [64.94009515033984]
本稿では,特徴属性と反実的説明を組み合わせたニューラルネットワークの解釈可能性について述べる。
本手法は,特徴属性法の性能を客観的に評価するために有効であることを示す。
論文 参考訳(メタデータ) (2021-09-28T00:53:34Z) - Clustering-friendly Representation Learning via Instance Discrimination
and Feature Decorrelation [0.0]
本稿では,インスタンス識別と特徴デコレーションを用いたクラスタリングに親しみやすい表現学習手法を提案する。
CIFAR-10とImageNet-10を用いた画像クラスタリングの評価では,それぞれ81.5%,95.4%の精度が得られた。
論文 参考訳(メタデータ) (2021-05-31T22:59:31Z) - Protecting Individual Interests across Clusters: Spectral Clustering
with Guarantees [20.350342151402963]
我々は、各クラスタが各クラスタに接続された適切なメンバー数を含む必要があるグラフ $mathcalg$ をクラスタリングするための個別フェアネス基準を提案する。
与えられた表現グラフの下で公正なクラスタを見つけるためのスペクトルクラスタリングアルゴリズムを考案する。
論文 参考訳(メタデータ) (2021-05-08T15:03:25Z) - Graph Contrastive Clustering [131.67881457114316]
本稿では,クラスタリングタスクに適用可能な新しいグラフコントラスト学習フレームワークを提案し,gcc(graph constrastive clustering)法を考案した。
特に、グラフラプラシアンに基づくコントラスト損失は、より識別的かつクラスタリングフレンドリーな特徴を学ぶために提案されている。
一方で、よりコンパクトなクラスタリング割り当てを学ぶために、グラフベースのコントラスト学習戦略が提案されている。
論文 参考訳(メタデータ) (2021-04-03T15:32:49Z) - Deep Clustering by Semantic Contrastive Learning [67.28140787010447]
Semantic Contrastive Learning (SCL) と呼ばれる新しい変種を紹介します。
従来のコントラスト学習とディープクラスタリングの両方の特徴を探求する。
コントラスト学習と深層クラスタリングの強みを統一的なアプローチで増幅することができる。
論文 参考訳(メタデータ) (2021-03-03T20:20:48Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Enhancing Facial Data Diversity with Style-based Face Aging [59.984134070735934]
特に、顔データセットは、通常、性別、年齢、人種などの属性の観点からバイアスされる。
本稿では, 細粒度の老化パターンをキャプチャするデータ拡張のための, 生成スタイルに基づく新しいアーキテクチャを提案する。
提案手法は, 年齢移動のための最先端アルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-06-06T21:53:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。