論文の概要: Projected Statistical Methods for Distributional Data on the Real Line
with the Wasserstein Metric
- arxiv url: http://arxiv.org/abs/2101.09039v1
- Date: Fri, 22 Jan 2021 10:24:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-20 17:18:47.368921
- Title: Projected Statistical Methods for Distributional Data on the Real Line
with the Wasserstein Metric
- Title(参考訳): ワッサーシュタイン計量を用いた実数直線上の分布データの投影統計法
- Authors: Matteo Pegoraro and Mario Beraha
- Abstract要約: 本研究では,実線上の確率分布のデータセットに関する統計解析を行うための,新規な予測手法を提案する。
特に主成分分析(PCA)と回帰に重点を置いています。
モデルのいくつかの理論的性質が研究され、一貫性が証明される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a novel class of projected methods, to perform statistical
analysis on a data set of probability distributions on the real line, with the
2-Wasserstein metric. We focus in particular on Principal Component Analysis
(PCA) and regression. To define these models, we exploit a representation of
the Wasserstein space closely related to its weak Riemannian structure, by
mapping the data to a suitable linear space and using a metric projection
operator to constrain the results in the Wasserstein space. By carefully
choosing the tangent point, we are able to derive fast empirical methods,
exploiting a constrained B-spline approximation. As a byproduct of our
approach, we are also able to derive faster routines for previous work on PCA
for distributions. By means of simulation studies, we compare our approaches to
previously proposed methods, showing that our projected PCA has similar
performance for a fraction of the computational cost and that the projected
regression is extremely flexible even under misspecification. Several
theoretical properties of the models are investigated and asymptotic
consistency is proven. Two real world applications to Covid-19 mortality in the
US and wind speed forecasting are discussed.
- Abstract(参考訳): 実数直線上の確率分布のデータセットを2-ワッサーシュタイン計量を用いて統計的に解析する新しい手法のクラスを提案する。
特に、主成分分析(PCA)と回帰に注目します。
これらのモデルを定義するために、ワッサーシュタイン空間の弱リーマン構造と密接に関連する表現を利用して、データを適当な線型空間にマッピングし、計量射影作用素を用いてワッサーシュタイン空間の結果を制約する。
接点を慎重に選択することで、制約付きB-スプライン近似を利用して高速な経験的手法を導出することができる。
提案手法の副産物として,配電用PCAにおける以前の作業よりも高速なルーチンを導出することができる。
シミュレーション研究により,提案手法との比較を行い,予測PCAは計算コストのごく一部で類似した性能を示し,予測回帰は不特定条件下でも極めて柔軟であることを示した。
モデルのいくつかの理論的特性が研究され、漸近的一貫性が証明された。
米国におけるCovid-19死亡率と風速予測の2つの現実的応用について論じる。
関連論文リスト
- Iterative Methods for Full-Scale Gaussian Process Approximations for Large Spatial Data [9.913418444556486]
本稿では, FSAを用いた確率, 勾配, 予測分布の計算コストの削減に, 反復法をどのように利用できるかを示す。
また,推定法や反復法に依存する予測分散を計算する新しい,正確かつ高速な手法を提案する。
すべてのメソッドは、ハイレベルなPythonとRパッケージを備えたフリーのC++ソフトウェアライブラリで実装されている。
論文 参考訳(メタデータ) (2024-05-23T12:25:22Z) - Bayesian Nonparametrics Meets Data-Driven Distributionally Robust Optimization [29.24821214671497]
機械学習と統計モデルのトレーニングは、しばしばデータ駆動型リスク基準の最適化を伴う。
ベイズ的非パラメトリック(ディリクレ過程)理論と、スムーズなあいまいさ-逆選好の最近の決定論的モデルを組み合わせた、新しいロバストな基準を提案する。
実用的な実装として、よく知られたディリクレプロセスの表現に基づいて、評価基準の抽出可能な近似を提案し、研究する。
論文 参考訳(メタデータ) (2024-01-28T21:19:15Z) - Statistical Efficiency of Score Matching: The View from Isoperimetry [96.65637602827942]
本研究では, スコアマッチングの統計的効率と推定される分布の等尺性との間に, 密接な関係を示す。
これらの結果はサンプル状態と有限状態の両方で定式化する。
論文 参考訳(メタデータ) (2022-10-03T06:09:01Z) - Sparse high-dimensional linear regression with a partitioned empirical
Bayes ECM algorithm [62.997667081978825]
疎高次元線形回帰に対する計算効率が高く強力なベイズ的手法を提案する。
パラメータに関する最小の事前仮定は、プラグイン経験的ベイズ推定(英語版)を用いて用いられる。
提案手法はRパッケージプローブに実装されている。
論文 参考訳(メタデータ) (2022-09-16T19:15:50Z) - Strong posterior contraction rates via Wasserstein dynamics [8.479040075763892]
ベイズ統計学において、後部収縮率(PCR)は、後部分布が真のモデルの任意の小さな近傍に集中する速度を定量化する。
我々は,関数のパラメータ空間上での強いノルム距離に関して,PCRに対する新しいアプローチを開発する。
論文 参考訳(メタデータ) (2022-03-21T06:53:35Z) - Efficient CDF Approximations for Normalizing Flows [64.60846767084877]
正規化フローの微分同相性に基づいて、閉領域上の累積分布関数(CDF)を推定する。
一般的なフローアーキテクチャとUCIデータセットに関する実験は,従来の推定器と比較して,サンプル効率が著しく向上したことを示している。
論文 参考訳(メタデータ) (2022-02-23T06:11:49Z) - Latent Space Model for Higher-order Networks and Generalized Tensor
Decomposition [18.07071669486882]
我々は、複雑な高次ネットワーク相互作用を研究するために、一般的な潜在空間モデルとして定式化された統一フレームワークを導入する。
一般化された多線形カーネルをリンク関数として、潜伏位置と観測データとの関係を定式化する。
本手法が合成データに与える影響を実証する。
論文 参考訳(メタデータ) (2021-06-30T13:11:17Z) - GELATO: Geometrically Enriched Latent Model for Offline Reinforcement
Learning [54.291331971813364]
オフライン強化学習アプローチは、近近法と不確実性認識法に分けられる。
本研究では,この2つを潜在変動モデルに組み合わせることのメリットを実証する。
提案したメトリクスは、分布サンプルのアウトの品質と、データ内のサンプルの不一致の両方を測定します。
論文 参考訳(メタデータ) (2021-02-22T19:42:40Z) - On Projection Robust Optimal Transport: Sample Complexity and Model
Misspecification [101.0377583883137]
射影ロバスト(PR)OTは、2つの測度の間のOTコストを最大化するために、射影可能な$k$次元部分空間を選択する。
私たちの最初の貢献は、PRワッサーシュタイン距離のいくつかの基本的な統計的性質を確立することである。
次に、部分空間を最適化するのではなく平均化することにより、PRW距離の代替として積分PRワッサーシュタイン距離(IPRW)を提案する。
論文 参考訳(メタデータ) (2020-06-22T14:35:33Z) - Projection Robust Wasserstein Distance and Riemannian Optimization [107.93250306339694]
プロジェクション・ソリッドスタイン(PRW)は、ワッサーシュタイン・プロジェクション(WPP)のロバストな変種であることを示す。
本稿では,PRW距離の計算への第一歩として,その理論と実データに関する実験の関連について述べる。
論文 参考訳(メタデータ) (2020-06-12T20:40:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。