論文の概要: Untangling Gaussian Mixtures
- arxiv url: http://arxiv.org/abs/2403.06671v1
- Date: Mon, 11 Mar 2024 12:42:31 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-12 19:15:25.759632
- Title: Untangling Gaussian Mixtures
- Title(参考訳): ガウス混合のアンタングリング
- Authors: Eva Fluck, Sandra Kiefer, Christoph Standke
- Abstract要約: タングルはもともとグラフの高接続領域を形式化する概念として導入された。
近年、構造グラフ理論とデータ科学の結びつきとして発見されている。
本稿では,クラスタの形式的研究の手段として,データセットにおけるタングルの可能性について検討する。
- 参考スコア(独自算出の注目度): 0.7499722271664147
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Tangles were originally introduced as a concept to formalize regions of high
connectivity in graphs. In recent years, they have also been discovered as a
link between structural graph theory and data science: when interpreting
similarity in data sets as connectivity between points, finding clusters in the
data essentially amounts to finding tangles in the underlying graphs. This
paper further explores the potential of tangles in data sets as a means for a
formal study of clusters. Real-world data often follow a normal distribution.
Accounting for this, we develop a quantitative theory of tangles in data sets
drawn from Gaussian mixtures. To this end, we equip the data with a graph
structure that models similarity between the points and allows us to apply
tangle theory to the data. We provide explicit conditions under which tangles
associated with the marginal Gaussian distributions exist asymptotically almost
surely. This can be considered as a sufficient formal criterion for the
separabability of clusters in the data.
- Abstract(参考訳): タングルはもともとグラフの高接続領域を形式化する概念として導入された。
近年では、構造グラフ理論とデータ科学の結びつきとして発見されており、データセットの類似性を点間の接続性として解釈する場合、データ内のクラスタを見つけることは本質的に、基礎となるグラフの三角形を見つけることに相当する。
本稿では,クラスタの形式的研究の手段として,データセットにおけるタングルの可能性についても検討する。
現実世界のデータはしばしば正規分布に従う。
そこで本研究では,ガウス混合系から得られたデータセットにおけるタングルの定量理論を考案する。
この目的のために、データに点間の類似性をモデル化し、データに接線理論を適用することができるグラフ構造を具備する。
境界ガウス分布に付随する接点が漸近的にほぼ確実に存在する明示的な条件を与える。
これは、データ内のクラスタの分離可能性に対する十分な形式的基準と考えることができる。
関連論文リスト
- Improving embedding of graphs with missing data by soft manifolds [51.425411400683565]
グラフ埋め込みの信頼性は、連続空間の幾何がグラフ構造とどの程度一致しているかに依存する。
我々は、この問題を解決することができる、ソフト多様体と呼ばれる新しい多様体のクラスを導入する。
グラフ埋め込みにソフト多様体を用いることで、複雑なデータセット上のデータ解析における任意のタスクを追求するための連続空間を提供できる。
論文 参考訳(メタデータ) (2023-11-29T12:48:33Z) - Graph Out-of-Distribution Generalization with Controllable Data
Augmentation [51.17476258673232]
グラフニューラルネットワーク(GNN)は,グラフ特性の分類において異常な性能を示した。
トレーニングとテストデータの選択バイアスが原因で、分散偏差が広まっています。
仮想サンプルの分布偏差を測定するためのOODキャリブレーションを提案する。
論文 参考訳(メタデータ) (2023-08-16T13:10:27Z) - Score Approximation, Estimation and Distribution Recovery of Diffusion
Models on Low-Dimensional Data [68.62134204367668]
本稿では,未知の低次元線形部分空間上でデータをサポートする場合の拡散モデルのスコア近似,推定,分布回復について検討する。
適切に選択されたニューラルネットワークアーキテクチャでは、スコア関数を正確に近似し、効率的に推定することができる。
推定スコア関数に基づいて生成された分布は、データ幾何学構造を捕捉し、データ分布の近傍に収束する。
論文 参考訳(メタデータ) (2023-02-14T17:02:35Z) - Gaussian Universality of Linear Classifiers with Random Labels in
High-Dimension [24.503842578208268]
高次元における生成モデルから得られるデータは、ガウスデータと対応するデータ共分散の最小限の訓練損失を持つことを示す。
特に,同質なガウス雲と多モード生成ニューラルネットワークの任意の混合によって生成されたデータについて述べる。
論文 参考訳(メタデータ) (2022-05-26T12:25:24Z) - A Robust and Flexible EM Algorithm for Mixtures of Elliptical
Distributions with Missing Data [71.9573352891936]
本稿では、ノイズや非ガウス的なデータに対するデータ計算の欠如に対処する。
楕円分布と潜在的な欠落データを扱う特性を混合した新しいEMアルゴリズムについて検討した。
合成データの実験的結果は,提案アルゴリズムが外れ値に対して頑健であり,非ガウスデータで使用可能であることを示す。
論文 参考訳(メタデータ) (2022-01-28T10:01:37Z) - Graph Convolution for Semi-Supervised Classification: Improved Linear
Separability and Out-of-Distribution Generalization [3.308743964406687]
グラフ畳み込みを適用した後にデータを分類することに最も基本的なレベルで依存する新しいクラスの学習モデルが登場しました。
グラフの畳み込みは、データを約1/sqrtD$の係数で線形に分離できる状態を拡張していることを示す。
論文 参考訳(メタデータ) (2021-02-13T17:46:57Z) - Learning non-Gaussian graphical models via Hessian scores and triangular
transport [6.308539010172309]
連続分布と非ガウス分布のマルコフ構造を学習するアルゴリズムを提案する。
このアルゴリズムは三角トランスポートマップによって誘導される決定論的結合を用いて密度を推定し、グラフのスパース性を明らかにするために地図内のスパース構造を反復的に活用する。
論文 参考訳(メタデータ) (2021-01-08T16:42:42Z) - Hyperbolic Graph Embedding with Enhanced Semi-Implicit Variational
Inference [48.63194907060615]
半単純グラフ変分自動エンコーダを用いて,低次元グラフ潜在表現における高次統計量を取得する。
我々は、階層構造を示すグラフを効率的に表現するために、ポインケア埋め込みを通して潜在空間に双曲幾何学を組み込む。
論文 参考訳(メタデータ) (2020-10-31T05:48:34Z) - Geometric graphs from data to aid classification tasks with graph
convolutional networks [0.0]
データセットに付加的な関係情報が得られなくても,特徴量自体から幾何グラフを構築して分類を改善することができることを示す。
分類精度の向上は、比較的低いエッジ密度のサンプル類似性をキャプチャするグラフによって最大化される。
論文 参考訳(メタデータ) (2020-05-08T15:00:45Z) - Block-Approximated Exponential Random Graphs [77.4792558024487]
指数乱グラフ(ERG)の分野における重要な課題は、大きなグラフ上の非自明なERGの適合である。
本稿では,非自明なERGに対する近似フレームワークを提案する。
我々の手法は、数百万のノードからなるスパースグラフにスケーラブルである。
論文 参考訳(メタデータ) (2020-02-14T11:42:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。