Fugu-MT 論文翻訳(概要): On clustering uncertain and structured data with Wasserstein barycenters and a geodesic criterion for the number of clusters

論文の概要: On clustering uncertain and structured data with Wasserstein barycenters and a geodesic criterion for the number of clusters

arxiv url: http://arxiv.org/abs/1912.11801v3
Date: Tue, 13 Sep 2022 13:16:35 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-10 08:31:14.234015
Title: On clustering uncertain and structured data with Wasserstein barycenters and a geodesic criterion for the number of clusters
Title（参考訳）: Wasserstein Barycentersによるクラスタリングの不確かで構造化されたデータとクラスタ数の測地基準について
Authors: G.I. Papayiannis, G.N. Domazakis, D. Drivaliaris, S. Koukoulas, A.E. Tsekrekos, A.N. Yannacopoulos
Abstract要約: この研究は、ワッサーシュタインのバリセンターの概念を考察し、クラスタリングタスクが実行されるワッサーシュタイン空間の内在幾何学に基づく適切なクラスタリング指標を伴って考える。このようなクラスタリング手法は、観測/実験誤差が重要である多くの分野において高く評価されている。この観点から、各観測は適切な確率尺度によって識別され、提案したクラスタリングスキームは識別基準に依存する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this work clustering schemes for uncertain and structured data are considered relying on the notion of Wasserstein barycenters, accompanied by appropriate clustering indices based on the intrinsic geometry of the Wasserstein space where the clustering task is performed. Such type of clustering approaches are highly appreciated in many fields where the observational/experimental error is significant (e.g. astronomy, biology, remote sensing, etc.) or the data nature is more complex and the traditional learning algorithms are not applicable or effective to treat them (e.g. network data, interval data, high frequency records, matrix data, etc.). Under this perspective, each observation is identified by an appropriate probability measure and the proposed clustering schemes rely on discrimination criteria that utilize the geometric structure of the space of probability measures through core techniques from the optimal transport theory. The advantages and capabilities of the proposed approach and the geodesic criterion performance are illustrated through a simulation study and the implementation in two real world applications: (a) clustering eurozone countries according to their observed government bond yield curves and (b) classifying the areas of a satellite image to certain land uses categories, a standard task in remote sensing.
Abstract（参考訳）: この作業では、不確実で構造化されたデータに対するクラスタリングスキームは、クラスタリングタスクが実行されるwasserstein空間の固有幾何に基づく適切なクラスタリングインデックスとともに、wasserstein barycentersの概念に依存すると考えられる。このようなクラスタリングアプローチは、観測/実験誤差が重要である(天文学、生物学、リモートセンシングなど)、あるいはデータの性質がより複雑であり、従来の学習アルゴリズムはそれらを扱うには適用できない、あるいは効果的である(ネットワークデータ、インターバルデータ、高周波レコード、行列データなど)多くの分野で高く評価されている。この観点から、各観測は適切な確率測度によって識別され、提案されたクラスタリングスキームは、最適輸送理論のコア技術による確率測度の空間の幾何学的構造を利用する識別基準に依存する。提案手法の利点と性能と測地基準の性能はシミュレーション研究と2つの実世界の応用における実装を通して説明される。 (a)観察された国債利回り曲線によるユーロ圏諸国のクラスタリング b)衛星画像の領域を特定の土地利用カテゴリーに分類することは、リモートセンシングの標準課題である。

関連論文リスト

Sparse clustering via the Deterministic Information Bottleneck algorithm [0.0]
クラスタ構造が機能領域のサブセットに限定されている場合、従来のクラスタリング技術は前例のない課題に直面します。本稿では,スパースデータに関連する問題を克服し,特徴量の重み付けとクラスタリングを可能にする情報理論フレームワークを提案する。
論文参考訳（メタデータ） (2026-01-28T14:05:44Z)
Scalable Context-Preserving Model-Aware Deep Clustering for Hyperspectral Images [51.95768218975529]
ハイパースペクトル画像(HSI)の教師なし解析にサブスペースクラスタリングが広く採用されている。近年のモデル対応深層空間クラスタリング手法では、O(n2)の複雑性を持つ自己表現行列の計算とスペクトルクラスタリングを含む2段階のフレームワークを用いることが多い。本稿では,HSIクラスタリングを効率的に行うために,局所構造と非局所構造を協調的にキャプチャする,ベース表現に基づく拡張性のあるコンテキスト保存深層クラスタリング手法を提案する。
論文参考訳（メタデータ） (2025-06-12T16:43:09Z)
Topology-Driven Clustering: Enhancing Performance with Betti Number Filtration [14.904264782690639]
絡み合った形状を含む複雑なデータセットのクラスタリングは、大きな課題となる。トポロジカル構造からフレキシブルに不可欠な特徴を捉えるためにベッチ列の概念を導入する。提案アルゴリズムは,データセットに含まれる複雑で絡み合った形状のクラスタリングに有効である。
論文参考訳（メタデータ） (2025-05-07T11:46:02Z)
Adaptive and Robust DBSCAN with Multi-agent Reinforcement Learning [53.527506374566485]
本稿では,多エージェント強化学習クラスタフレームワーク,すなわちAR-DBSCANを用いた新しいAdaptive and Robust DBSCANを提案する。我々は、AR-DBSCANが、NMIおよびARIメトリクスの最大144.1%と175.3%のクラスタリング精度を向上するだけでなく、支配的なパラメータを確実に見つけることができることを示した。
論文参考訳（メタデータ） (2025-05-07T11:37:23Z)
Random Normed k-Means: A Paradigm-Shift in Clustering within Probabilistic Metric Spaces [0.7864304771129751]
確率的距離空間内で機能する文献において、最初のk-平均変種を導入する。確率論的視点を採用することで,本手法は新たなパラダイムを導入するだけでなく,厳密な理論的枠組みも確立する。提案したランダムノルムk平均(RNKM)アルゴリズムは,非線形に分離可能な構造を識別する顕著な能力を示す。
論文参考訳（メタデータ） (2025-04-04T20:48:43Z)
From A-to-Z Review of Clustering Validation Indices [4.08908337437878]
我々は、最も一般的なクラスタリングアルゴリズムを用いて、内部および外部クラスタリング検証指標の性能をレビューし、評価する。内部クラスタリング検証と外部クラスタリング検証の両方の機能を調べるための分類フレームワークを提案する。
論文参考訳（メタデータ） (2024-07-18T13:52:02Z)
GCC: Generative Calibration Clustering [55.44944397168619]
本稿では,特徴学習と拡張をクラスタリングに組み込む新しいGCC法を提案する。まず,実検体と実検体間の固有関係を識別する識別的特徴アライメント機構を開発する。第二に、より信頼性の高いクラスタ割り当てを生成するための自己教師付きメトリック学習を設計する。
論文参考訳（メタデータ） (2024-04-14T01:51:11Z)
Robust and Automatic Data Clustering: Dirichlet Process meets Median-of-Means [18.3248037914529]
本稿では,モデルに基づく手法とセントロイド方式の原理を統合することにより,効率的かつ自動的なクラスタリング手法を提案する。クラスタリング誤差の上限に関する統計的保証は,既存のクラスタリングアルゴリズムよりも提案手法の利点を示唆している。
論文参考訳（メタデータ） (2023-11-26T19:01:15Z)
Circular Clustering with Polar Coordinate Reconstruction [6.598049778463762]
伝統的なクラスタリングアルゴリズムは、周期成分の違いを区別する能力が限られているため、しばしば不十分である。そこで本研究では,円筒座標系への射影を利用した新たな解析フレームワークを提案し,偏座標系における物体の表現性を向上する。我々のアプローチは一般に適用可能であり、ほとんどの最先端のクラスタリングアルゴリズムに組み込むことができる。
論文参考訳（メタデータ） (2023-09-15T20:56:01Z)
Deep Clustering: A Comprehensive Survey [53.387957674512585]
クラスタリング分析は、機械学習とデータマイニングにおいて必須の役割を果たす。ディープ・クラスタリングは、ディープ・ニューラルネットワークを使ってクラスタリングフレンドリーな表現を学習することができるが、幅広いクラスタリングタスクに広く適用されている。ディープクラスタリングに関する既存の調査は、主にシングルビューフィールドとネットワークアーキテクチャに焦点を当てており、クラスタリングの複雑なアプリケーションシナリオを無視している。
論文参考訳（メタデータ） (2022-10-09T02:31:32Z)
Detection and Evaluation of Clusters within Sequential Data [58.720142291102135]
Block Markov Chainsのクラスタリングアルゴリズムは理論的最適性を保証する。特に、私たちのシーケンシャルデータは、ヒトのDNA、テキスト、動物運動データ、金融市場から派生しています。ブロックマルコフ連鎖モデルの仮定は、実際に探索データ解析において有意義な洞察を得られることが判明した。
論文参考訳（メタデータ） (2022-10-04T15:22:39Z)
Enhancing cluster analysis via topological manifold learning [0.3823356975862006]
クラスタ化前にデータセットのトポロジ構造を推定することで,クラスタ検出を大幅に向上させることができることを示す。位相構造を推定するための多様体学習法UMAPと密度に基づくクラスタリング法DBSCANを組み合わせた。
論文参考訳（メタデータ） (2022-07-01T15:53:39Z)
Anomaly Clustering: Grouping Images into Coherent Clusters of Anomaly Types [60.45942774425782]
我々は異常クラスタリングを導入し、その目標はデータを異常型の一貫性のあるクラスタにまとめることである。これは異常検出とは違い、その目標は異常を通常のデータから分割することである。パッチベースの事前訓練されたディープ埋め込みとオフザシェルフクラスタリング手法を用いた,単純で効果的なクラスタリングフレームワークを提案する。
論文参考訳（メタデータ） (2021-12-21T23:11:33Z)
Spatially Coherent Clustering Based on Orthogonal Nonnegative Matrix Factorization [0.0]
本稿では,クラスタメンバシップ行列の総変動(TV)正規化手順に基づく作業クラスタリングモデルを紹介する。マトリックス支援レーザー脱離イオン化イメージング測定から得られた超スペクトルデータセット上の提案手法をすべて数値的に評価する。
論文参考訳（メタデータ） (2021-04-25T23:40:41Z)
Towards Uncovering the Intrinsic Data Structures for Unsupervised Domain Adaptation using Structurally Regularized Deep Clustering [119.88565565454378]
Unsupervised Domain Adapt (UDA) は、ターゲットドメイン上のラベルなしデータの予測を行う分類モデルを学ぶことである。本稿では,対象データの正規化判別クラスタリングと生成クラスタリングを統合する構造的正規化深層クラスタリングのハイブリッドモデルを提案する。提案するH-SRDCは, インダクティブ設定とトランスダクティブ設定の両方において, 既存の手法よりも優れている。
論文参考訳（メタデータ） (2020-12-08T08:52:00Z)
Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文参考訳（メタデータ） (2020-10-22T15:58:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。