論文の概要: On clustering uncertain and structured data with Wasserstein barycenters
and a geodesic criterion for the number of clusters
- arxiv url: http://arxiv.org/abs/1912.11801v3
- Date: Tue, 13 Sep 2022 13:16:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-10 08:31:14.234015
- Title: On clustering uncertain and structured data with Wasserstein barycenters
and a geodesic criterion for the number of clusters
- Title(参考訳): Wasserstein Barycentersによるクラスタリングの不確かで構造化されたデータとクラスタ数の測地基準について
- Authors: G.I. Papayiannis, G.N. Domazakis, D. Drivaliaris, S. Koukoulas, A.E.
Tsekrekos, A.N. Yannacopoulos
- Abstract要約: この研究は、ワッサーシュタインのバリセンターの概念を考察し、クラスタリングタスクが実行されるワッサーシュタイン空間の内在幾何学に基づく適切なクラスタリング指標を伴って考える。
このようなクラスタリング手法は、観測/実験誤差が重要である多くの分野において高く評価されている。
この観点から、各観測は適切な確率尺度によって識別され、提案したクラスタリングスキームは識別基準に依存する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work clustering schemes for uncertain and structured data are
considered relying on the notion of Wasserstein barycenters, accompanied by
appropriate clustering indices based on the intrinsic geometry of the
Wasserstein space where the clustering task is performed. Such type of
clustering approaches are highly appreciated in many fields where the
observational/experimental error is significant (e.g. astronomy, biology,
remote sensing, etc.) or the data nature is more complex and the traditional
learning algorithms are not applicable or effective to treat them (e.g. network
data, interval data, high frequency records, matrix data, etc.). Under this
perspective, each observation is identified by an appropriate probability
measure and the proposed clustering schemes rely on discrimination criteria
that utilize the geometric structure of the space of probability measures
through core techniques from the optimal transport theory. The advantages and
capabilities of the proposed approach and the geodesic criterion performance
are illustrated through a simulation study and the implementation in two real
world applications: (a) clustering eurozone countries according to their
observed government bond yield curves and (b) classifying the areas of a
satellite image to certain land uses categories, a standard task in remote
sensing.
- Abstract(参考訳): この作業では、不確実で構造化されたデータに対するクラスタリングスキームは、クラスタリングタスクが実行されるwasserstein空間の固有幾何に基づく適切なクラスタリングインデックスとともに、wasserstein barycentersの概念に依存すると考えられる。
このようなクラスタリングアプローチは、観測/実験誤差が重要である(天文学、生物学、リモートセンシングなど)、あるいはデータの性質がより複雑であり、従来の学習アルゴリズムはそれらを扱うには適用できない、あるいは効果的である(ネットワークデータ、インターバルデータ、高周波レコード、行列データなど)多くの分野で高く評価されている。
この観点から、各観測は適切な確率測度によって識別され、提案されたクラスタリングスキームは、最適輸送理論のコア技術による確率測度の空間の幾何学的構造を利用する識別基準に依存する。
提案手法の利点と性能と測地基準の性能はシミュレーション研究と2つの実世界の応用における実装を通して説明される。
(a)観察された国債利回り曲線によるユーロ圏諸国のクラスタリング
b)衛星画像の領域を特定の土地利用カテゴリーに分類することは、リモートセンシングの標準課題である。
関連論文リスト
- From A-to-Z Review of Clustering Validation Indices [4.08908337437878]
我々は、最も一般的なクラスタリングアルゴリズムを用いて、内部および外部クラスタリング検証指標の性能をレビューし、評価する。
内部クラスタリング検証と外部クラスタリング検証の両方の機能を調べるための分類フレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-18T13:52:02Z) - GCC: Generative Calibration Clustering [55.44944397168619]
本稿では,特徴学習と拡張をクラスタリングに組み込む新しいGCC法を提案する。
まず,実検体と実検体間の固有関係を識別する識別的特徴アライメント機構を開発する。
第二に、より信頼性の高いクラスタ割り当てを生成するための自己教師付きメトリック学習を設計する。
論文 参考訳(メタデータ) (2024-04-14T01:51:11Z) - Robust and Automatic Data Clustering: Dirichlet Process meets
Median-of-Means [18.3248037914529]
本稿では,モデルに基づく手法とセントロイド方式の原理を統合することにより,効率的かつ自動的なクラスタリング手法を提案する。
クラスタリング誤差の上限に関する統計的保証は,既存のクラスタリングアルゴリズムよりも提案手法の利点を示唆している。
論文 参考訳(メタデータ) (2023-11-26T19:01:15Z) - Circular Clustering with Polar Coordinate Reconstruction [6.598049778463762]
伝統的なクラスタリングアルゴリズムは、周期成分の違いを区別する能力が限られているため、しばしば不十分である。
そこで本研究では,円筒座標系への射影を利用した新たな解析フレームワークを提案し,偏座標系における物体の表現性を向上する。
我々のアプローチは一般に適用可能であり、ほとんどの最先端のクラスタリングアルゴリズムに組み込むことができる。
論文 参考訳(メタデータ) (2023-09-15T20:56:01Z) - Deep Clustering: A Comprehensive Survey [53.387957674512585]
クラスタリング分析は、機械学習とデータマイニングにおいて必須の役割を果たす。
ディープ・クラスタリングは、ディープ・ニューラルネットワークを使ってクラスタリングフレンドリーな表現を学習することができるが、幅広いクラスタリングタスクに広く適用されている。
ディープクラスタリングに関する既存の調査は、主にシングルビューフィールドとネットワークアーキテクチャに焦点を当てており、クラスタリングの複雑なアプリケーションシナリオを無視している。
論文 参考訳(メタデータ) (2022-10-09T02:31:32Z) - Detection and Evaluation of Clusters within Sequential Data [58.720142291102135]
Block Markov Chainsのクラスタリングアルゴリズムは理論的最適性を保証する。
特に、私たちのシーケンシャルデータは、ヒトのDNA、テキスト、動物運動データ、金融市場から派生しています。
ブロックマルコフ連鎖モデルの仮定は、実際に探索データ解析において有意義な洞察を得られることが判明した。
論文 参考訳(メタデータ) (2022-10-04T15:22:39Z) - Enhancing cluster analysis via topological manifold learning [0.3823356975862006]
クラスタ化前にデータセットのトポロジ構造を推定することで,クラスタ検出を大幅に向上させることができることを示す。
位相構造を推定するための多様体学習法UMAPと密度に基づくクラスタリング法DBSCANを組み合わせた。
論文 参考訳(メタデータ) (2022-07-01T15:53:39Z) - Anomaly Clustering: Grouping Images into Coherent Clusters of Anomaly
Types [60.45942774425782]
我々は異常クラスタリングを導入し、その目標はデータを異常型の一貫性のあるクラスタにまとめることである。
これは異常検出とは違い、その目標は異常を通常のデータから分割することである。
パッチベースの事前訓練されたディープ埋め込みとオフザシェルフクラスタリング手法を用いた,単純で効果的なクラスタリングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-21T23:11:33Z) - Spatially Coherent Clustering Based on Orthogonal Nonnegative Matrix
Factorization [0.0]
本稿では,クラスタメンバシップ行列の総変動(TV)正規化手順に基づく作業クラスタリングモデルを紹介する。
マトリックス支援レーザー脱離イオン化イメージング測定から得られた超スペクトルデータセット上の提案手法をすべて数値的に評価する。
論文 参考訳(メタデータ) (2021-04-25T23:40:41Z) - Towards Uncovering the Intrinsic Data Structures for Unsupervised Domain
Adaptation using Structurally Regularized Deep Clustering [119.88565565454378]
Unsupervised Domain Adapt (UDA) は、ターゲットドメイン上のラベルなしデータの予測を行う分類モデルを学ぶことである。
本稿では,対象データの正規化判別クラスタリングと生成クラスタリングを統合する構造的正規化深層クラスタリングのハイブリッドモデルを提案する。
提案するH-SRDCは, インダクティブ設定とトランスダクティブ設定の両方において, 既存の手法よりも優れている。
論文 参考訳(メタデータ) (2020-12-08T08:52:00Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。