論文の概要: Wasserstein-based Kernels for Clustering: Application to Power Distribution Graphs
- arxiv url: http://arxiv.org/abs/2503.14357v1
- Date: Tue, 18 Mar 2025 15:40:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-19 14:14:15.385675
- Title: Wasserstein-based Kernels for Clustering: Application to Power Distribution Graphs
- Title(参考訳): クラスタリングのためのWassersteinベースのカーネル:電力分配グラフへの応用
- Authors: Alfredo Oneto, Blazhe Gjorgiev, Giovanni Sansavini,
- Abstract要約: この研究は、カーネルメソッドとワッサーシュタイン距離メトリクスを探索し、計算的に抽出可能なクラスタリングフレームワークを開発する。
このフレームワークは、グラフ解析や画像処理など、さまざまな領域に適用できるほど柔軟である。
879と34,920の分散グラフの2つのデータセットを含むケーススタディは、フレームワークの有効性と効率を実証している。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Many data clustering applications must handle objects that cannot be represented as vector data. In this context, the bag-of-vectors representation can be leveraged to describe complex objects through discrete distributions, and the Wasserstein distance can effectively measure the dissimilarity between them. Additionally, kernel methods can be used to embed data into feature spaces that are easier to analyze. Despite significant progress in data clustering, a method that simultaneously accounts for distributional and vectorial dissimilarity measures is still lacking. To tackle this gap, this work explores kernel methods and Wasserstein distance metrics to develop a computationally tractable clustering framework. The compositional properties of kernels allow the simultaneous handling of different metrics, enabling the integration of both vectors and discrete distributions for object representation. This approach is flexible enough to be applied in various domains, such as graph analysis and image processing. The framework consists of three main components. First, we efficiently approximate pairwise Wasserstein distances using multiple reference distributions. Second, we employ kernel functions based on Wasserstein distances and present ways of composing kernels to express different types of information. Finally, we use the kernels to cluster data and evaluate the quality of the results using scalable and distance-agnostic validity indices. A case study involving two datasets of 879 and 34,920 power distribution graphs demonstrates the framework's effectiveness and efficiency.
- Abstract(参考訳): 多くのデータクラスタリングアプリケーションは、ベクトルデータとして表現できないオブジェクトを扱う必要があります。
この文脈では、ベクトル場表現は離散分布を通して複素対象を記述するために利用することができ、ワッサーシュタイン距離はそれらの間の相似性を効果的に測定することができる。
さらに、カーネルメソッドを使用して、分析しやすい機能空間にデータを埋め込むこともできる。
データクラスタリングの大幅な進歩にもかかわらず、分布的およびベクトル的相似性尺度を同時に説明する手法はいまだに不足している。
このギャップに対処するため、この研究はカーネルメソッドとワッサーシュタイン距離メトリクスを探索し、計算的に抽出可能なクラスタリングフレームワークを開発する。
カーネルの構成的性質は、異なるメトリクスの同時処理を可能にし、オブジェクト表現のためのベクトルと離散分布の統合を可能にする。
このアプローチは、グラフ解析や画像処理など、さまざまな領域に適用できるほど柔軟である。
フレームワークは3つの主要コンポーネントで構成されている。
まず、複数の参照分布を用いたペアワイズワッサースタイン距離を効率よく近似する。
第2に、ワッサーシュタイン距離に基づくカーネル関数と、異なる種類の情報を表現するためにカーネルを構成する方法を提案する。
最後に、カーネルを用いてデータをクラスタリングし、スケーラブルで距離に依存しない妥当性指標を用いて結果の品質を評価する。
879と34,920の分散グラフの2つのデータセットを含むケーススタディは、フレームワークの有効性と効率を実証している。
関連論文リスト
- Faithful Density-Peaks Clustering via Matrix Computations on MPI Parallelization System [7.594123537718585]
密度ピーククラスタリング(DP)は任意の形状のクラスタを検出し、非ユークリッド空間データをクラスタリングする能力を持つ。
本稿では,2種類のベクトル状距離行列と逆前ノードファイリングポリシを併用した忠実かつ並列なDP法を提案する。
本手法は,コミュニティ検出などの非ユークリッドデータをクラスタリングすると同時に,大規模ユークリッドデータをクラスタリングする場合の精度において,最先端の手法よりも優れる。
論文 参考訳(メタデータ) (2024-06-18T06:05:45Z) - Spectral Clustering for Discrete Distributions [22.450518079181542]
伝統的に、離散分布(D2C)のクラスタリングは、Wasserstein Barycenter法を用いてアプローチされてきた。
本研究では, スペクトルクラスタリングと分布親和性尺度を組み合わせることで, バリセンタ法よりも精度が高く, 効率的であることを示す。
クラスタリング分布における手法の成功を理論的に保証する。
論文 参考訳(メタデータ) (2024-01-25T03:17:03Z) - Bures-Wasserstein Means of Graphs [60.42414991820453]
本研究では,スムーズなグラフ信号分布の空間への埋め込みを通じて,グラフ平均を定義する新しいフレームワークを提案する。
この埋め込み空間において平均を求めることにより、構造情報を保存する平均グラフを復元することができる。
我々は,新しいグラフの意味の存在と特異性を確立し,それを計算するための反復アルゴリズムを提供する。
論文 参考訳(メタデータ) (2023-05-31T11:04:53Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Efficient Graph Field Integrators Meet Point Clouds [59.27295475120132]
点雲を符号化するグラフ上での効率的な場積分のためのアルゴリズムを2種類提案する。
第1のクラスであるSeparatorFactorization(SF)は、ポイントメッシュグラフの有界属を利用するが、第2のクラスであるRFDiffusion(RFD)は、ポイントクラウドの一般的なepsilon-nearest-neighborグラフ表現を使用する。
論文 参考訳(メタデータ) (2023-02-02T08:33:36Z) - Wasserstein $K$-means for clustering probability distributions [16.153709556346417]
ユークリッド空間では、セントロイドと距離に基づくK$平均の定式化は同値である。
現代の機械学習アプリケーションでは、データは確率分布として発生し、測度値のデータを扱う自然な一般化は最適な輸送距離を使用する。
SDP緩和ワッサースタイン$K$-平均は、クラスターが2ドルワッサースタイン計量の下で十分に分離されているため、正確な回復を達成することができることを示す。
論文 参考訳(メタデータ) (2022-09-14T23:43:16Z) - Learning non-Gaussian graphical models via Hessian scores and triangular
transport [6.308539010172309]
連続分布と非ガウス分布のマルコフ構造を学習するアルゴリズムを提案する。
このアルゴリズムは三角トランスポートマップによって誘導される決定論的結合を用いて密度を推定し、グラフのスパース性を明らかにするために地図内のスパース構造を反復的に活用する。
論文 参考訳(メタデータ) (2021-01-08T16:42:42Z) - Kernel learning approaches for summarising and combining posterior
similarity matrices [68.8204255655161]
我々は,ベイズクラスタリングモデルに対するMCMCアルゴリズムの出力を要約するための新しいアプローチを提案するために,後部類似性行列(PSM)の概念を構築した。
我々の研究の重要な貢献は、PSMが正の半定値であり、したがって確率的に動機付けられたカーネル行列を定義するのに使用できることである。
論文 参考訳(メタデータ) (2020-09-27T14:16:14Z) - Graph Neural Networks with Composite Kernels [60.81504431653264]
カーネル重み付けの観点からノード集約を再解釈する。
本稿では,アグリゲーション方式における特徴類似性を考慮したフレームワークを提案する。
特徴空間における特徴類似性をエンコードするために,元の隣り合うカーネルと学習可能なカーネルの合成として特徴集約を提案する。
論文 参考訳(メタデータ) (2020-05-16T04:44:29Z) - Block-Approximated Exponential Random Graphs [77.4792558024487]
指数乱グラフ(ERG)の分野における重要な課題は、大きなグラフ上の非自明なERGの適合である。
本稿では,非自明なERGに対する近似フレームワークを提案する。
我々の手法は、数百万のノードからなるスパースグラフにスケーラブルである。
論文 参考訳(メタデータ) (2020-02-14T11:42:16Z) - Wasserstein Exponential Kernels [13.136143245702915]
正規化ワッサーシュタイン距離によって定義される指数核の利用について検討する。
我々は、ワッサーシュタイン二乗指数核が、小さなトレーニングセットの形状に対してより小さな分類誤差をもたらすことを示す。
論文 参考訳(メタデータ) (2020-02-05T17:31:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。