論文の概要: Hierarchical clustering: visualization, feature importance and model
selection
- arxiv url: http://arxiv.org/abs/2112.01372v1
- Date: Tue, 30 Nov 2021 20:38:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-03 17:32:58.231945
- Title: Hierarchical clustering: visualization, feature importance and model
selection
- Title(参考訳): 階層的クラスタリング:可視化、特徴重要度、モデル選択
- Authors: Luben M. C. Cabezas, Rafael Izbicki, Rafael B. Stern
- Abstract要約: 本稿では,デンドログラムによって提供されるマルチレゾリューション構造を完全に利用する階層クラスタリングの解析手法を提案する。
提案手法の背後にある重要な洞察は、デンドログラムを系統学として見ることである。
実データとシミュレートされたデータセットは、提案したフレームワークが望ましい結果をもたらす証拠となる。
- 参考スコア(独自算出の注目度): 4.017760528208122
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose methods for the analysis of hierarchical clustering that fully use
the multi-resolution structure provided by a dendrogram. Specifically, we
propose a loss for choosing between clustering methods, a feature importance
score and a graphical tool for visualizing the segmentation of features in a
dendrogram. Current approaches to these tasks lead to loss of information since
they require the user to generate a single partition of the instances by
cutting the dendrogram at a specified level. Our proposed methods, instead, use
the full structure of the dendrogram. The key insight behind the proposed
methods is to view a dendrogram as a phylogeny. This analogy permits the
assignment of a feature value to each internal node of a tree through ancestral
state reconstruction. Real and simulated datasets provide evidence that our
proposed framework has desirable outcomes. We provide an R package that
implements our methods.
- Abstract(参考訳): 本研究では,dendrogramによるマルチレゾリューション構造を十分に活用した階層クラスタリング解析手法を提案する。
具体的には,クラスタリング手法と特徴重要度スコア,およびデンドログラムにおける特徴のセグメンテーションを可視化するグラフィカルツールの相互選択の損失を提案する。
これらのタスクに対する現在のアプローチは、ユーザが指定されたレベルでデンドログラムをカットすることで、インスタンスの単一パーティションを生成する必要があるため、情報の損失につながる。
提案手法は代わりにデンドログラムの完全な構造を用いる。
提案手法の背景にある重要な知見は,デンドログラムを系統として見ることである。
このアナロジーは、祖先状態の再構築を通じて、ツリーの各内部ノードに特徴値の割り当てを可能にする。
実際のデータセットとシミュレーションデータセットは、提案するフレームワークが望ましい結果をもたらす証拠を提供します。
メソッドを実装するRパッケージを提供しています。
関連論文リスト
- ClusterGraph: a new tool for visualization and compression of multidimensional data [0.0]
本稿では,任意のクラスタリングアルゴリズムの出力に付加的なレイヤを提供する。
クラスタリングアルゴリズムから得られたクラスタのグローバルなレイアウトに関する情報を提供する。
論文 参考訳(メタデータ) (2024-11-08T09:40:54Z) - Fast and Scalable Semi-Supervised Learning for Multi-View Subspace Clustering [13.638434337947302]
FSSMSCは、既存のアプローチで一般的に見られる高い計算複雑性に対する新しいソリューションである。
この手法は、各データポイントを選択されたランドマークの疎線型結合として表現し、すべてのビューにまたがるコンセンサスアンカーグラフを生成する。
FSSMSCの有効性と効率は、様々なスケールの複数のベンチマークデータセットに対する広範な実験を通して検証される。
論文 参考訳(メタデータ) (2024-08-11T06:54:00Z) - Hierarchical clustering with dot products recovers hidden tree structure [53.68551192799585]
本稿では,階層構造の回復に着目した凝集クラスタリングアルゴリズムの新しい視点を提案する。
クラスタを最大平均点積でマージし、例えば最小距離やクラスタ内分散でマージしないような、標準的なアルゴリズムの単純な変種を推奨する。
このアルゴリズムにより得られた木は、汎用確率的グラフィカルモデルの下で、データ中の生成的階層構造をボナフェイド推定することを示した。
論文 参考訳(メタデータ) (2023-05-24T11:05:12Z) - GrannGAN: Graph annotation generative adversarial networks [72.66289932625742]
本稿では,高次元分布をモデル化し,グラフスケルトンと整合した複雑な関係特徴構造を持つデータの新しい例を生成することの問題点を考察する。
提案するモデルは,タスクを2つのフェーズに分割することで,各データポイントのグラフ構造に制約されたデータ特徴を生成する問題に対処する。
第一に、与えられたグラフのノードに関連する機能の分布をモデル化し、第二に、ノードのフィーチャに条件付きでエッジ機能を補完する。
論文 参考訳(メタデータ) (2022-12-01T11:49:07Z) - SHGNN: Structure-Aware Heterogeneous Graph Neural Network [77.78459918119536]
本稿では、上記の制約に対処する構造対応不均一グラフニューラルネットワーク(SHGNN)を提案する。
まず,メタパス内の中間ノードの局所構造情報を取得するために,特徴伝搬モジュールを利用する。
次に、ツリーアテンションアグリゲータを使用して、グラフ構造情報をメタパス上のアグリゲーションモジュールに組み込む。
最後に、メタパスアグリゲータを利用して、異なるメタパスから集約された情報を融合する。
論文 参考訳(メタデータ) (2021-12-12T14:18:18Z) - Effective and Efficient Graph Learning for Multi-view Clustering [173.8313827799077]
マルチビュークラスタリングのための効率的かつ効率的なグラフ学習モデルを提案する。
本手法はテンソルシャッテンp-ノルムの最小化により異なるビューのグラフ間のビュー類似性を利用する。
提案アルゴリズムは時間経済であり,安定した結果を得るとともに,データサイズによく対応している。
論文 参考訳(メタデータ) (2021-08-15T13:14:28Z) - Towards Clustering-friendly Representations: Subspace Clustering via
Graph Filtering [16.60975509085194]
本稿では,スムーズな表現を実現するグラフフィルタリング手法を提案する。
画像および文書クラスタリングデータセットの実験により、我々の手法は最先端のサブスペースクラスタリング技術により改善されていることを示す。
アブレーション研究では、グラフフィルタリングがノイズを除去し、画像の構造を保存し、クラスの分離性を高めることが示されている。
論文 参考訳(メタデータ) (2021-06-18T02:21:36Z) - Structured Graph Learning for Clustering and Semi-supervised
Classification [74.35376212789132]
データの局所構造とグローバル構造の両方を保存するためのグラフ学習フレームワークを提案する。
本手法は, サンプルの自己表現性を利用して, 局所構造を尊重するために, 大域的構造と適応的隣接アプローチを捉える。
我々のモデルは、ある条件下でのカーネルk平均法とk平均法の組合せと等価である。
論文 参考訳(メタデータ) (2020-08-31T08:41:20Z) - Graph Neural Networks with Composite Kernels [60.81504431653264]
カーネル重み付けの観点からノード集約を再解釈する。
本稿では,アグリゲーション方式における特徴類似性を考慮したフレームワークを提案する。
特徴空間における特徴類似性をエンコードするために,元の隣り合うカーネルと学習可能なカーネルの合成として特徴集約を提案する。
論文 参考訳(メタデータ) (2020-05-16T04:44:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。