論文の概要: Intrinsic Sliced Wasserstein Distances for Comparing Collections of
Probability Distributions on Manifolds and Graphs
- arxiv url: http://arxiv.org/abs/2010.15285v3
- Date: Wed, 14 Jun 2023 21:21:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-17 04:40:57.099018
- Title: Intrinsic Sliced Wasserstein Distances for Comparing Collections of
Probability Distributions on Manifolds and Graphs
- Title(参考訳): 多様体とグラフ上の確率分布のコレクションの比較のための固有スライスワッサースタイン距離
- Authors: Raif Rustamov and Subhabrata Majumdar
- Abstract要約: 確率分布のコレクションは、ユーザアクティビティパターン分析から脳コネクトロミクスまで、さまざまなアプリケーションで発生します。
本稿では、そのような一般領域上の2つの分布の集合の違いを検出するアプローチを提案する。
我々は、再サンプリングに基づく2つのテスト手順と、座標ワイドテストからのp値の組み合わせを提供する。
種々の合成および実データ設定実験により、結果の試験が強力であり、p値が良好に校正されていることを示す。
- 参考スコア(独自算出の注目度): 4.133655523622441
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Collections of probability distributions arise in a variety of applications
ranging from user activity pattern analysis to brain connectomics. In practice
these distributions can be defined over diverse domain types including finite
intervals, circles, cylinders, spheres, other manifolds, and graphs. This paper
introduces an approach for detecting differences between two collections of
distributions over such general domains. To this end, we propose the intrinsic
slicing construction that yields a novel class of Wasserstein distances on
manifolds and graphs. These distances are Hilbert embeddable, allowing us to
reduce the distribution collection comparison problem to a more familiar mean
testing problem in a Hilbert space. We provide two testing procedures one based
on resampling and another on combining p-values from coordinate-wise tests. Our
experiments in various synthetic and real data settings show that the resulting
tests are powerful and the p-values are well-calibrated.
- Abstract(参考訳): 確率分布のコレクションは、ユーザアクティビティパターン分析から脳コネクトミクスまで、さまざまなアプリケーションで発生します。
実際には、これらの分布は有限区間、円、シリンダー、球面、他の多様体、グラフを含む様々な領域タイプで定義される。
本稿では,そのような一般領域上の分布の2つの集合間の差を検出する手法を提案する。
そこで本研究では,多様体とグラフ上の新たなワッサースタイン距離クラスを導出する本質的スライシング構成を提案する。
これらの距離はヒルベルト埋め込み可能であり、分布コレクション比較問題をヒルベルト空間におけるより親しみやすい平均テスト問題に還元することができる。
我々は、再サンプリングに基づく2つのテスト手順と、座標ワイドテストからのp値の組み合わせを提供する。
種々の合成および実データ設定実験により、結果の試験が強力であり、p値が良好に校正されていることを示す。
関連論文リスト
- New Lower Bounds for Testing Monotonicity and Log Concavity of
Distributions [11.1508968670589]
本研究では,分布のビン確率を含む不等式で定義される特性に対して,分布の下位境界を検証するための新しい手法を開発した。
我々の基本的な手法は、一組のビンの確率を微調整し、一方のファミリーが定義の不等式を維持し、他方のファミリーがそれらの不等式に違反しているようにすることで、一組の分布のモーメントマッチングファミリを構築することである。
論文 参考訳(メタデータ) (2023-07-31T19:01:38Z) - Bootstrapped Edge Count Tests for Nonparametric Two-Sample Inference
Under Heterogeneity [5.8010446129208155]
両試料間の差異を正確に検出する新しい非パラメトリック試験法を開発した。
オンラインゲームにおけるユーザ行動検出のための総合シミュレーション研究と応用により,提案試験の非漸近性能が向上したことを示す。
論文 参考訳(メタデータ) (2023-04-26T22:25:44Z) - Kullback-Leibler and Renyi divergences in reproducing kernel Hilbert
space and Gaussian process settings [0.0]
正規化Kullback-LeiblerとR'enyiの発散をAlpha Log-Det(Log-Det)発散により定式化する。
特徴的核について、最初の設定は、完全可分な距離空間上の任意のボレル確率測度の間の分岐をもたらす。
我々は、Alpha Log-Detの発散がヒルベルト-シュミットノルムにおいて連続であることを示し、ヒルベルト空間値の確率変数に対して大数の法則を適用することができる。
論文 参考訳(メタデータ) (2022-07-18T06:40:46Z) - Joint Probability Estimation Using Tensor Decomposition and Dictionaries [3.4720326275851994]
本研究では, 与えられた離散確率と連続確率変数の連立確率の非パラメトリック推定を, それらの(経験的推定)2次元境界値から検討した。
我々は、データを調べて分布の様々なファミリーの辞書を作成し、それを混合した製品の各分解因子を近似するために利用する。
論文 参考訳(メタデータ) (2022-03-03T11:55:51Z) - Partial Counterfactual Identification from Observational and
Experimental Data [83.798237968683]
観測データと実験データの任意の組み合わせから最適境界を近似する有効なモンテカルロアルゴリズムを開発した。
我々のアルゴリズムは、合成および実世界のデータセットに基づいて広範囲に検証されている。
論文 参考訳(メタデータ) (2021-10-12T02:21:30Z) - Local versions of sum-of-norms clustering [77.34726150561087]
本手法はボールモデルにおいて任意に閉じた球を分離できることを示す。
我々は、不連結連結集合のクラスタリングで発生する誤差に定量的な有界性を証明した。
論文 参考訳(メタデータ) (2021-09-20T14:45:29Z) - Optimal oracle inequalities for solving projected fixed-point equations [53.31620399640334]
ヒルベルト空間の既知の低次元部分空間を探索することにより、確率観測の集合を用いて近似解を計算する手法を検討する。
本稿では,線形関数近似を用いた政策評価問題に対する時間差分学習手法の誤差を正確に評価する方法について述べる。
論文 参考訳(メタデータ) (2020-12-09T20:19:32Z) - GANs with Variational Entropy Regularizers: Applications in Mitigating
the Mode-Collapse Issue [95.23775347605923]
深層学習の成功に基づいて、GAN(Generative Adversarial Networks)は、観測されたサンプルから確率分布を学習するための現代的なアプローチを提供する。
GANはしばしば、ジェネレータが入力分布の既存のすべてのモードをキャプチャできないモード崩壊問題に悩まされる。
情報理論のアプローチを採り、生成したサンプルのエントロピーの変動的下限を最大化し、それらの多様性を増大させる。
論文 参考訳(メタデータ) (2020-09-24T19:34:37Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Differentially Private Assouad, Fano, and Le Cam [32.509176784239216]
ル・カムの方法、ファノの不等式、アスードの補題は、統計的推定タスクの下位境界を証明する3つの手法である。
偏微分プライバシーの下でそれらの類似性を提案する。その結果は単純で、適用が容易であり、いくつかの推定タスクにおいてサンプル複雑性境界を確立するためにそれらを用いる。
論文 参考訳(メタデータ) (2020-04-14T23:10:38Z) - Distributed, partially collapsed MCMC for Bayesian Nonparametrics [68.5279360794418]
ディリクレ法やベータ・ベルヌーリ法のようなモデルでよく用いられる完全無作為測度は独立な部分測度に分解可能であるという事実を利用する。
この分解を用いて、潜在測度を、インスタンス化された成分のみを含む有限測度と、他のすべての成分を含む無限測度に分割する。
得られたハイブリッドアルゴリズムは、収束保証を犠牲にすることなくスケーラブルな推論を可能にすることができる。
論文 参考訳(メタデータ) (2020-01-15T23:10:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。