論文の概要: Class Angular Distortion Index for Dimensionality Reduction
- arxiv url: http://arxiv.org/abs/2605.00637v1
- Date: Fri, 01 May 2026 13:19:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.958967
- Title: Class Angular Distortion Index for Dimensionality Reduction
- Title(参考訳): 次元減少のためのクラス角歪指数
- Authors: Kaviru Gunaratne, Stephen Kobourov, Jacob Miller,
- Abstract要約: Class Angular Distortion Index(CADI)は、投影におけるクラスタ組織の忠実度を決定するために、ポイントトリプル間の内部角度を使用するメトリクスである。
既存のクラスタメトリクスがフェールした場合、実データと合成データの両方でケースを示すが、CADIは解釈可能な結果を提供する。
- 参考スコア(独自算出の注目度): 0.22940141855172028
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Dimensionality reduction (DR) techniques are often characterized by whether they preserve global, high-level structures in the data or local, neighborhood structures. This distinction matters in visualization: global methods can obscure clusters while local methods can over-emphasize them. Yet, even when clusters appear distinct, their relative arrangement in the projection may be arbitrary or misleading, a common issue in techniques such as t-SNE and UMAP. Existing cluster quality metrics either only measure cluster separability or assume spherical, globular clusters in the original space. We introduce the Class Angular Distortion Index (CADI), a metric that uses internal angles among point triples to determine the faithfulness of cluster organization in a projection. We show cases on both real and synthetic data where existing cluster metrics fail, but CADI provides an interpretable result. Since it relies on computing angles, CADI is also differentiable, enabling optimization. We demonstrate this with a CADI-based DR technique.
- Abstract(参考訳): 次元性低減(DR)技術は、しばしば、データ内の大域的、高レベルな構造を保存するか、あるいは局所的な近傍構造を保持するかによって特徴づけられる。
グローバルメソッドはクラスタを隠蔽し、ローカルメソッドはクラスタを過度に強調する。
しかし、クラスターが異なっていたとしても、射影における相対的な配置は任意あるいは誤解を招く可能性があり、t-SNEやUMAPのような技術では共通の問題である。
既存のクラスタ品質メトリクスは、クラスタ分離性を測定するか、または元の空間で球状で球形のクラスタを仮定するのみである。
投影におけるクラスタ・オーガナイゼーションの忠実度を決定するために、ポイント・トリプル間の内角を利用する計量であるClass Angular Distortion Index (CADI)を導入する。
既存のクラスタメトリクスがフェールした場合、実データと合成データの両方でケースを示すが、CADIは解釈可能な結果を提供する。
計算角度に依存するため、CADIも微分可能であり、最適化が可能である。
これをCADIベースのDR技術で実証する。
関連論文リスト
- Scalable Context-Preserving Model-Aware Deep Clustering for Hyperspectral Images [51.95768218975529]
ハイパースペクトル画像(HSI)の教師なし解析にサブスペースクラスタリングが広く採用されている。
近年のモデル対応深層空間クラスタリング手法では、O(n2)の複雑性を持つ自己表現行列の計算とスペクトルクラスタリングを含む2段階のフレームワークを用いることが多い。
本稿では,HSIクラスタリングを効率的に行うために,局所構造と非局所構造を協調的にキャプチャする,ベース表現に基づく拡張性のあるコンテキスト保存深層クラスタリング手法を提案する。
論文 参考訳(メタデータ) (2025-06-12T16:43:09Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Can an unsupervised clustering algorithm reproduce a categorization system? [1.0485739694839669]
ラベル付きデータセットにおいて、教師なしクラスタリングが真理クラスを再現できるかどうかを検討する。
成功は特徴選択と選択した距離測定に依存することを示す。
論文 参考訳(メタデータ) (2024-08-19T18:27:14Z) - ABCDE: Application-Based Cluster Diff Evals [49.1574468325115]
それは実用性を目指しており、アイテムはアプリケーション固有の重要な値を持つことができ、クラスタリングがどちらが優れているかを判断するときに人間の判断を使うのは粗悪であり、アイテムの任意のスライスのためのメトリクスを報告できる。
クラスタリング品質の差分を測定するアプローチは、高価な地平を前もって構築し、それに関して各クラスタリングを評価する代わりに、ABCDEはクラスタリング間の実際の差分に基づいて、判定のための質問をサンプリングする。
論文 参考訳(メタデータ) (2024-07-31T08:29:35Z) - High-dimensional Clustering onto Hamiltonian Cycle [30.17605416237686]
クラスタリングは、類似性に基づいてアンラベリングされたサンプルをグループ化することを目的としている。
本稿では,ハミルトンサイクル上での高次元クラスタリングという新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-27T20:59:45Z) - Enhancing cluster analysis via topological manifold learning [0.3823356975862006]
クラスタ化前にデータセットのトポロジ構造を推定することで,クラスタ検出を大幅に向上させることができることを示す。
位相構造を推定するための多様体学習法UMAPと密度に基づくクラスタリング法DBSCANを組み合わせた。
論文 参考訳(メタデータ) (2022-07-01T15:53:39Z) - Swarm Intelligence for Self-Organized Clustering [6.85316573653194]
Databionic Swarm(DBS)と呼ばれるSwarmシステムが導入された。
スウォームインテリジェンス、自己組織化、出現の相互関係を利用して、DBSはクラスタリングのタスクにおけるグローバルな目的関数の最適化に対する代替アプローチとして機能する。
論文 参考訳(メタデータ) (2021-06-10T06:21:48Z) - Towards Uncovering the Intrinsic Data Structures for Unsupervised Domain
Adaptation using Structurally Regularized Deep Clustering [119.88565565454378]
Unsupervised Domain Adapt (UDA) は、ターゲットドメイン上のラベルなしデータの予測を行う分類モデルを学ぶことである。
本稿では,対象データの正規化判別クラスタリングと生成クラスタリングを統合する構造的正規化深層クラスタリングのハイブリッドモデルを提案する。
提案するH-SRDCは, インダクティブ設定とトランスダクティブ設定の両方において, 既存の手法よりも優れている。
論文 参考訳(メタデータ) (2020-12-08T08:52:00Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。