論文の概要: Interactive Steering of Hierarchical Clustering
- arxiv url: http://arxiv.org/abs/2009.09618v1
- Date: Mon, 21 Sep 2020 05:26:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-16 04:16:16.935206
- Title: Interactive Steering of Hierarchical Clustering
- Title(参考訳): 階層的クラスタリングのインタラクティブステアリング
- Authors: Weikai Yang, Xiting Wang, Jie Lu, Wenwen Dou, Shixia Liu
- Abstract要約: 本稿では,公開知識(ウィキペディアなど)とユーザからのプライベート知識の両方を活用することで,制約付き階層的クラスタリングを視覚的に監視するインタラクティブなステアリング手法を提案する。
1)知識(知識駆動)と本質的なデータ分散(データ駆動)を用いて階層的クラスタリングの制約を自動的に構築する。
階層的クラスタリングの結果を明確に伝達するために,不確実性を考慮したツリー可視化が開発され,最も不確実なサブ階層を素早く見つけることができる。
- 参考スコア(独自算出の注目度): 30.371250297444703
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Hierarchical clustering is an important technique to organize big data for
exploratory data analysis. However, existing one-size-fits-all hierarchical
clustering methods often fail to meet the diverse needs of different users. To
address this challenge, we present an interactive steering method to visually
supervise constrained hierarchical clustering by utilizing both public
knowledge (e.g., Wikipedia) and private knowledge from users. The novelty of
our approach includes 1) automatically constructing constraints for
hierarchical clustering using knowledge (knowledge-driven) and intrinsic data
distribution (data-driven), and 2) enabling the interactive steering of
clustering through a visual interface (user-driven). Our method first maps each
data item to the most relevant items in a knowledge base. An initial constraint
tree is then extracted using the ant colony optimization algorithm. The
algorithm balances the tree width and depth and covers the data items with high
confidence. Given the constraint tree, the data items are hierarchically
clustered using evolutionary Bayesian rose tree. To clearly convey the
hierarchical clustering results, an uncertainty-aware tree visualization has
been developed to enable users to quickly locate the most uncertain
sub-hierarchies and interactively improve them. The quantitative evaluation and
case study demonstrate that the proposed approach facilitates the building of
customized clustering trees in an efficient and effective manner.
- Abstract(参考訳): 階層的クラスタリングは、探索データ分析のためにビッグデータを整理する重要なテクニックである。
しかし、既存の1サイズ対応の階層的クラスタリング手法は、さまざまなユーザのニーズを満たすことができないことが多い。
そこで本研究では,ユーザからの公的な知識(wikipediaなど)と私的な知識の両方を利用して,制約付き階層的クラスタリングを視覚的に監視する対話型ステアリング手法を提案する。
私たちのアプローチの新規性には
1)知識(知識駆動)と固有データ分散(データ駆動)を用いた階層的クラスタリングのための制約の自動構築
2)ビジュアルインターフェース(ユーザ駆動)によるクラスタのインタラクティブなステアリングを可能にする。
本手法はまず,各データ項目を知識ベースにおける最も関連する項目にマップする。
その後、antコロニー最適化アルゴリズムを用いて初期制約木を抽出する。
アルゴリズムは木幅と深さのバランスをとり、データ項目を高い信頼性でカバーする。
制約木を考えると、データ項目は進化的ベイズバラ木を用いて階層的にクラスタ化される。
階層的クラスタリング結果を明確化するために,不確実性を認識したツリービジュアライゼーションが開発され,ユーザが最も不確定なサブ階層を素早く見つけ出し,対話的に改善できるようになった。
定量的評価とケーススタディにより,提案手法が効率的かつ効果的なクラスタリングツリーの構築を促進できることが示されている。
関連論文リスト
- Order Is All You Need for Categorical Data Clustering [29.264630563297466]
名目価値属性からなる分類データは、知識発見やデータマイニングのタスクにおいてユビキタスである。
適切に定義された距離空間がないため、分類データの分布は直感的に理解することが難しい。
本稿では,属性値間の順序関係がクラスタリング精度の決定的要因であることを示す。
論文 参考訳(メタデータ) (2024-11-19T08:23:25Z) - scTree: Discovering Cellular Hierarchies in the Presence of Batch Effects in scRNA-seq Data [12.01555110624794]
scTreeは、ツリー構造データ表現を同時に学習しながら、バッチ効果を補正する。
scTreeがデータの基礎となるクラスタを発見できる7つのデータセットを実証的に示す。
論文 参考訳(メタデータ) (2024-06-27T16:16:55Z) - Cluster-based Graph Collaborative Filtering [55.929052969825825]
グラフ畳み込みネットワーク(GCN)は、レコメンデーションシステムのためのユーザおよびアイテム表現の学習に成功している。
既存のGCNベースのほとんどのメソッドは、高階グラフ畳み込みを実行しながら、ユーザの複数の関心事を見落としている。
クラスタベースグラフ協調フィルタリング(ClusterGCF)と呼ばれる新しいGCNベースのレコメンデーションモデルを提案する。
論文 参考訳(メタデータ) (2024-04-16T07:05:16Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Using Decision Trees for Interpretable Supervised Clustering [0.0]
教師付きクラスタリングは、高い確率密度でラベル付きデータのクラスタを形成することを目的としている。
特に、特定のクラスのデータのクラスタを見つけ、包括的なルールのセットでクラスタを記述することに興味があります。
論文 参考訳(メタデータ) (2023-07-16T17:12:45Z) - Hierarchical clustering with dot products recovers hidden tree structure [53.68551192799585]
本稿では,階層構造の回復に着目した凝集クラスタリングアルゴリズムの新しい視点を提案する。
クラスタを最大平均点積でマージし、例えば最小距離やクラスタ内分散でマージしないような、標準的なアルゴリズムの単純な変種を推奨する。
このアルゴリズムにより得られた木は、汎用確率的グラフィカルモデルの下で、データ中の生成的階層構造をボナフェイド推定することを示した。
論文 参考訳(メタデータ) (2023-05-24T11:05:12Z) - Deep Clustering: A Comprehensive Survey [53.387957674512585]
クラスタリング分析は、機械学習とデータマイニングにおいて必須の役割を果たす。
ディープ・クラスタリングは、ディープ・ニューラルネットワークを使ってクラスタリングフレンドリーな表現を学習することができるが、幅広いクラスタリングタスクに広く適用されている。
ディープクラスタリングに関する既存の調査は、主にシングルビューフィールドとネットワークアーキテクチャに焦点を当てており、クラスタリングの複雑なアプリケーションシナリオを無視している。
論文 参考訳(メタデータ) (2022-10-09T02:31:32Z) - Hierarchical clustering by aggregating representatives in
sub-minimum-spanning-trees [5.877624540482919]
本稿では,クラスタリングデンドログラムを構築しながら,代表点を効果的に検出できる階層的クラスタリングアルゴリズムを提案する。
解析の結果,提案アルゴリズムはO(nlogn)時間複雑度とO(nlogn)空間複雑度を有し,大規模データ処理のスケーラビリティを示す。
論文 参考訳(メタデータ) (2021-11-11T07:36:55Z) - Path Based Hierarchical Clustering on Knowledge Graphs [1.713291434132985]
対象クラスタの階層化を誘導する新しい手法を提案する。
この階層上のクラスタに対象を割り当てる前に、まずタグ階層を構築します。
実世界の3つのデータセット上で,コヒーレントクラスタ階層を誘導する手法の能力を定量的に示す。
論文 参考訳(メタデータ) (2021-09-27T16:42:43Z) - Exact and Approximate Hierarchical Clustering Using A* [51.187990314731344]
クラスタリングのA*探索に基づく新しいアプローチを紹介します。
A*と新しいエンフォレリスデータ構造を組み合わせることで、禁止的に大きな検索空間を克服します。
実験により,本手法は粒子物理利用事例や他のクラスタリングベンチマークにおいて,ベースラインよりもかなり高品質な結果が得られることを示した。
論文 参考訳(メタデータ) (2021-04-14T18:15:27Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。