論文の概要: Rethinking Divisive Hierarchical Clustering from a Distributional Perspective
- arxiv url: http://arxiv.org/abs/2601.19718v1
- Date: Tue, 27 Jan 2026 15:41:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-28 15:26:51.373602
- Title: Rethinking Divisive Hierarchical Clustering from a Distributional Perspective
- Title(参考訳): 分散的階層的クラスタリングの再考
- Authors: Kaifeng Zhang, Kai Ming Ting, Tianrun Liang, Qiuran Zhao,
- Abstract要約: 分割階層クラスタリング(DHC)法は、3つの望ましい性質を持たないデンドログラムを生成する。
この欠点は、セット指向の基準ではなく、分散カーネルを用いて対処できることが示される。
提案手法は,空間トランスクリプトミクスデータセットの生物領域と整合したデンドログラムを生成する。
- 参考スコア(独自算出の注目度): 7.023830532843621
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We uncover that current objective-based Divisive Hierarchical Clustering (DHC) methods produce a dendrogram that does not have three desired properties i.e., no unwarranted splitting, group similar clusters into a same subset, ground-truth correspondence. This shortcoming has their root cause in using a set-oriented bisecting assessment criterion. We show that this shortcoming can be addressed by using a distributional kernel, instead of the set-oriented criterion; and the resultant clusters achieve a new distribution-oriented objective to maximize the total similarity of all clusters (TSC). Our theoretical analysis shows that the resultant dendrogram guarantees a lower bound of TSC. The empirical evaluation shows the effectiveness of our proposed method on artificial and Spatial Transcriptomics (bioinformatics) datasets. Our proposed method successfully creates a dendrogram that is consistent with the biological regions in a Spatial Transcriptomics dataset, whereas other contenders fail.
- Abstract(参考訳): 現在の目的に基づくディビジョン階層クラスタリング(Divisive Hierarchical Clustering, DHC)法は、3つの所望の性質を持たないデンドログラムを生成する。
この欠点は、設定指向の双方向評価基準を使用する際の根本原因となっている。
この欠点は, セット指向の基準ではなく, 分散カーネルを用いて対処できることを示し, 結果のクラスタは, 全クラスタ(TSC)の完全類似性を最大化するために, 新たな分散指向の目的を達成する。
以上の結果から, ドドログラムはTSCの低い境界を保証していることがわかった。
実験による評価は,提案手法が人工的および空間的トランスクリプトミクス(バイオインフォマティクス)データセットに与える影響を示す。
提案手法は,空間トランスクリプトミクスデータセットの生物領域と一致したデンドログラムを生成するが,他の競合者は失敗する。
関連論文リスト
- Causal Clustering for Conditional Average Treatment Effects Estimation and Subgroup Discovery [5.669361767058639]
パーソナライズされた医療、資源配分、政策評価などの領域では、不均一な治療効果の推定が重要である。
因果樹林から派生した学習カーネルを用いて,推定処理効果に基づいて個人をクラスタリングする新しい枠組みを提案する。
論文 参考訳(メタデータ) (2025-09-06T17:01:23Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Perfect Spectral Clustering with Discrete Covariates [68.8204255655161]
本稿では,大規模なスパースネットワークのクラスにおいて,高い確率で完全クラスタリングを実現するスペクトルアルゴリズムを提案する。
本手法は,スペクトルクラスタリングによる一貫した潜在構造回復を保証する最初の方法である。
論文 参考訳(メタデータ) (2022-05-17T01:41:06Z) - Contrastive Fine-grained Class Clustering via Generative Adversarial
Networks [9.667133604169829]
コントラスト学習を適用することでInfoGANのカテゴリ推論能力を活用する手法であるC3-GANを紹介する。
C3-GANは4つのきめ細かいベンチマークデータセットで最先端のクラスタリング性能を達成した。
論文 参考訳(メタデータ) (2021-12-30T08:57:11Z) - You Never Cluster Alone [150.94921340034688]
我々は、主流のコントラスト学習パラダイムをクラスタレベルのスキームに拡張し、同じクラスタに属するすべてのデータが統一された表現に寄与する。
分類変数の集合をクラスタ化代入信頼度として定義し、インスタンスレベルの学習トラックとクラスタレベルの学習トラックを関連付ける。
代入変数を再パラメータ化することで、TCCはエンドツーエンドでトレーニングされる。
論文 参考訳(メタデータ) (2021-06-03T14:59:59Z) - Towards Uncovering the Intrinsic Data Structures for Unsupervised Domain
Adaptation using Structurally Regularized Deep Clustering [119.88565565454378]
Unsupervised Domain Adapt (UDA) は、ターゲットドメイン上のラベルなしデータの予測を行う分類モデルを学ぶことである。
本稿では,対象データの正規化判別クラスタリングと生成クラスタリングを統合する構造的正規化深層クラスタリングのハイブリッドモデルを提案する。
提案するH-SRDCは, インダクティブ設定とトランスダクティブ設定の両方において, 既存の手法よりも優れている。
論文 参考訳(メタデータ) (2020-12-08T08:52:00Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Learning Embeddings for Image Clustering: An Empirical Study of Triplet
Loss Approaches [10.42820615166362]
我々は,Triplet Lossによる特徴空間埋め込みの文脈において,k平均クラスタリングと相関クラスタリングという2つの異なる画像クラスタリングの目的を評価する。
我々は、三重項損失の2つの人気のあるバージョンを最適化することで、差別的特徴を学習するために畳み込みニューラルネットワークを訓練する。
本稿では,形式的クラスタリングの目的に対して望ましい特性を示し,既存の手法より優れる,新しい単純なトリプルトロスの定式化を提案する。
論文 参考訳(メタデータ) (2020-07-06T23:38:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。