論文の概要: CLAMS: A Cluster Ambiguity Measure for Estimating Perceptual Variability
in Visual Clustering
- arxiv url: http://arxiv.org/abs/2308.00284v2
- Date: Fri, 11 Aug 2023 04:43:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-14 16:24:16.922689
- Title: CLAMS: A Cluster Ambiguity Measure for Estimating Perceptual Variability
in Visual Clustering
- Title(参考訳): CLAMS:ビジュアルクラスタリングにおける知覚変数推定のためのクラスタ曖昧度測定
- Authors: Hyeon Jeon, Ghulam Jilani Quadri, Hyunwook Lee, Paul Rosen, Danielle
Albers Szafir, and Jinwook Seo
- Abstract要約: 本稿では,クラスタアンビグニティ(Cluster Ambiguity)と呼ばれる視覚的クラスタリングを行う際の知覚的変動について検討する。
我々は,モノクローム散乱体におけるクラスタのあいまいさを自動的に予測する,データ駆動型視覚品質尺度であるCLAMSを紹介する。
- 参考スコア(独自算出の注目度): 23.625877882403227
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Visual clustering is a common perceptual task in scatterplots that supports
diverse analytics tasks (e.g., cluster identification). However, even with the
same scatterplot, the ways of perceiving clusters (i.e., conducting visual
clustering) can differ due to the differences among individuals and ambiguous
cluster boundaries. Although such perceptual variability casts doubt on the
reliability of data analysis based on visual clustering, we lack a systematic
way to efficiently assess this variability. In this research, we study
perceptual variability in conducting visual clustering, which we call Cluster
Ambiguity. To this end, we introduce CLAMS, a data-driven visual quality
measure for automatically predicting cluster ambiguity in monochrome
scatterplots. We first conduct a qualitative study to identify key factors that
affect the visual separation of clusters (e.g., proximity or size difference
between clusters). Based on study findings, we deploy a regression module that
estimates the human-judged separability of two clusters. Then, CLAMS predicts
cluster ambiguity by analyzing the aggregated results of all pairwise
separability between clusters that are generated by the module. CLAMS
outperforms widely-used clustering techniques in predicting ground truth
cluster ambiguity. Meanwhile, CLAMS exhibits performance on par with human
annotators. We conclude our work by presenting two applications for optimizing
and benchmarking data mining techniques using CLAMS. The interactive demo of
CLAMS is available at clusterambiguity.dev.
- Abstract(参考訳): 視覚的クラスタリングは、さまざまな分析タスク(例えば、クラスタ識別)をサポートする分散プロットにおける一般的な知覚タスクである。
しかし、同じ散乱体であっても、個人差とあいまいなクラスタ境界により、クラスタの知覚方法(すなわち、視覚的クラスタリング)が異なる可能性がある。
このような知覚的変動性は、視覚的クラスタリングに基づくデータ解析の信頼性に疑問を呈するが、この変動性を効果的に評価する体系的な方法が欠如している。
本研究では,クラスタアンビグニティ(Cluster Ambiguity)と呼ばれる視覚クラスタリングの実行における知覚的変動について検討する。
この目的のために,モノクロ散乱体におけるクラスタのあいまいさを自動的に予測するデータ駆動型視覚品質尺度であるCLAMSを導入する。
まず、クラスタの視覚的分離(例えば、クラスタ間の近接やサイズの違い)に影響を与える重要な要因を特定するための質的研究を行う。
研究結果に基づき,2つのクラスタの分離性を評価する回帰モジュールを配置した。
次に、clamは、モジュールが生成するクラスタ間の全ての対分離性の集計結果を分析することにより、クラスタのあいまいさを予測する。
CLAMSは、基底真理クラスタの曖昧さを予測するために広く使われているクラスタリング技術より優れている。
一方、CLAMSは人間のアノテーションと同等の性能を示す。
CLAMSを用いたデータマイニング手法の最適化とベンチマークのための2つのアプリケーションを提案することで,本研究を締めくくっている。
CLAMSのインタラクティブなデモは clusterambiguity.dev で公開されている。
関連論文リスト
- Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Self Supervised Correlation-based Permutations for Multi-View Clustering [7.972599673048582]
汎用データのためのエンドツーエンドのディープラーニングベースのMVCフレームワークを提案する。
我々のアプローチは、新しい置換に基づく正準相関目標を用いて有意義な融合データ表現を学習することである。
10つのMVCベンチマークデータセットを用いて、モデルの有効性を実証する。
論文 参考訳(メタデータ) (2024-02-26T08:08:30Z) - ClusterNet: A Perception-Based Clustering Model for Scattered Data [16.326062082938215]
クラスタ分離は、一般的に広く使用されているクラスタリング技術によって取り組まれるタスクである。
本稿では,分散データを直接操作する学習戦略を提案する。
私たちは、ポイントベースのディープラーニングモデルであるClusterNetをトレーニングし、クラスタ分離性に対する人間の認識を反映するように訓練します。
論文 参考訳(メタデータ) (2023-04-27T13:41:12Z) - Enhancing cluster analysis via topological manifold learning [0.3823356975862006]
クラスタ化前にデータセットのトポロジ構造を推定することで,クラスタ検出を大幅に向上させることができることを示す。
位相構造を推定するための多様体学習法UMAPと密度に基づくクラスタリング法DBSCANを組み合わせた。
論文 参考訳(メタデータ) (2022-07-01T15:53:39Z) - ACTIVE:Augmentation-Free Graph Contrastive Learning for Partial
Multi-View Clustering [52.491074276133325]
部分的マルチビュークラスタリングの問題を解決するために,拡張自由グラフコントラスト学習フレームワークを提案する。
提案手法は、インスタンスレベルのコントラスト学習と欠落データ推論をクラスタレベルに高め、個々の欠落データがクラスタリングに与える影響を効果的に軽減する。
論文 参考訳(メタデータ) (2022-03-01T02:32:25Z) - Self-supervised Contrastive Attributed Graph Clustering [110.52694943592974]
我々は,自己教師型コントラストグラフクラスタリング(SCAGC)という,新たな属性グラフクラスタリングネットワークを提案する。
SCAGCでは,不正確なクラスタリングラベルを活用することで,ノード表現学習のための自己教師付きコントラスト損失を設計する。
OOSノードでは、SCAGCはクラスタリングラベルを直接計算できる。
論文 参考訳(メタデータ) (2021-10-15T03:25:28Z) - Learning Statistical Representation with Joint Deep Embedded Clustering [2.1267423178232407]
StatDECは、共同統計表現学習とクラスタリングのための教師なしのフレームワークである。
実験により,これらの表現を用いることで,様々な画像データセットにまたがる不均衡な画像クラスタリングの結果を大幅に改善できることが示された。
論文 参考訳(メタデータ) (2021-09-11T09:26:52Z) - You Never Cluster Alone [150.94921340034688]
我々は、主流のコントラスト学習パラダイムをクラスタレベルのスキームに拡張し、同じクラスタに属するすべてのデータが統一された表現に寄与する。
分類変数の集合をクラスタ化代入信頼度として定義し、インスタンスレベルの学習トラックとクラスタレベルの学習トラックを関連付ける。
代入変数を再パラメータ化することで、TCCはエンドツーエンドでトレーニングされる。
論文 参考訳(メタデータ) (2021-06-03T14:59:59Z) - Graph Contrastive Clustering [131.67881457114316]
本稿では,クラスタリングタスクに適用可能な新しいグラフコントラスト学習フレームワークを提案し,gcc(graph constrastive clustering)法を考案した。
特に、グラフラプラシアンに基づくコントラスト損失は、より識別的かつクラスタリングフレンドリーな特徴を学ぶために提案されている。
一方で、よりコンパクトなクラスタリング割り当てを学ぶために、グラフベースのコントラスト学習戦略が提案されている。
論文 参考訳(メタデータ) (2021-04-03T15:32:49Z) - Multiscale Clustering of Hyperspectral Images Through Spectral-Spatial
Diffusion Geometry [9.619814126465206]
クラスタリングアルゴリズムはデータセットを類似点のグループに分割する。
本論文の主な貢献は,マルチスケール空間規則化拡散学習(M-SRDL)クラスタリングアルゴリズムである。
マルチスケールクラスタリングフレームワークに空間正規化を組み込むことは、hsiデータに適用するとより滑らかでより一貫性のあるクラスタに対応できることを示す。
論文 参考訳(メタデータ) (2021-03-29T17:24:28Z) - LSD-C: Linearly Separable Deep Clusters [145.89790963544314]
ラベルなしデータセットのクラスタを識別する新しい手法であるLSD-Cを提案する。
本手法は,最近の半教師付き学習の実践からインスピレーションを得て,クラスタリングアルゴリズムと自己教師付き事前学習と強力なデータ拡張を組み合わせることを提案する。
CIFAR 10/100, STL 10, MNIST, および文書分類データセットReuters 10Kなど, 一般的な公開画像ベンチマークにおいて, 当社のアプローチが競合より大幅に優れていたことを示す。
論文 参考訳(メタデータ) (2020-06-17T17:58:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。