論文の概要: Asymptotic Analysis of Sampling Estimators for Randomized Numerical
Linear Algebra Algorithms
- arxiv url: http://arxiv.org/abs/2002.10526v1
- Date: Mon, 24 Feb 2020 20:34:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-29 03:38:02.730010
- Title: Asymptotic Analysis of Sampling Estimators for Randomized Numerical
Linear Algebra Algorithms
- Title(参考訳): ランダム化数値線形代数アルゴリズムのためのサンプリング推定器の漸近解析
- Authors: Ping Ma, Xinlian Zhang, Xin Xing, Jingyi Ma, and Michael W. Mahoney
- Abstract要約: 最小二乗問題に対するRandNLAサンプリング推定器の分布を導出する解析法を開発した。
AAMSE(Asymptotic Mean Squared Error)とEAMSE(Asymsymotic Mean Squared Error)に基づく最適なサンプリング確率の同定を行った。
提案手法は, サンプリングプロセスにおけるレバレッジの役割を明らかにするとともに, 実験により既存の手法よりも改善したことを示す。
- 参考スコア(独自算出の注目度): 43.134933182911766
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The statistical analysis of Randomized Numerical Linear Algebra (RandNLA)
algorithms within the past few years has mostly focused on their performance as
point estimators. However, this is insufficient for conducting statistical
inference, e.g., constructing confidence intervals and hypothesis testing,
since the distribution of the estimator is lacking. In this article, we develop
an asymptotic analysis to derive the distribution of RandNLA sampling
estimators for the least-squares problem. In particular, we derive the
asymptotic distribution of a general sampling estimator with arbitrary sampling
probabilities. The analysis is conducted in two complementary settings, i.e.,
when the objective of interest is to approximate the full sample estimator or
is to infer the underlying ground truth model parameters. For each setting, we
show that the sampling estimator is asymptotically normally distributed under
mild regularity conditions. Moreover, the sampling estimator is asymptotically
unbiased in both settings. Based on our asymptotic analysis, we use two
criteria, the Asymptotic Mean Squared Error (AMSE) and the Expected Asymptotic
Mean Squared Error (EAMSE), to identify optimal sampling probabilities. Several
of these optimal sampling probability distributions are new to the literature,
e.g., the root leverage sampling estimator and the predictor length sampling
estimator. Our theoretical results clarify the role of leverage in the sampling
process, and our empirical results demonstrate improvements over existing
methods.
- Abstract(参考訳): 過去数年間のランダム化数値線形代数(RandNLA)アルゴリズムの統計的解析は、主に点推定器としての性能に焦点を当ててきた。
しかし、推定器の分布が不足しているため、信頼区間の構築や仮説検証など、統計的推論を行うには不十分である。
本稿では,最小二乗問題に対するRandNLAサンプリング推定器の分布を導出する漸近解析を開発する。
特に,任意のサンプリング確率を持つ一般サンプリング推定器の漸近分布を導出する。
分析は2つの相補的な設定、すなわち、興味の対象が全サンプル推定器を近似すること、または基礎となる基底真理モデルパラメータを推測することである。
各設定について,サンプリング推定器は漸近的に通常,穏やかな正規性条件下で分布することを示す。
さらに、サンプリング推定器は、両方の設定で漸近的に偏りがない。
症状分析では,Asymptotic Mean Squared Error (AMSE) とAsymptotic Mean Squared Error (EAMSE) の2つの基準を用いて,最適なサンプリング確率の同定を行った。
これらの最適なサンプリング確率分布のいくつかは、例えばルートレバレッジサンプリング推定器と予測長サンプリング推定器のような文献に新しいものである。
実験結果は, サンプリングプロセスにおけるレバレッジの役割を明らかにするとともに, 既存の方法よりも改善することを示す。
関連論文リスト
- Robust Estimation for Kernel Exponential Families with Smoothed Total Variation Distances [2.317910166616341]
統計的推測では、標本は独立であり、確率分布から同一に分布していると一般的に仮定する。
本稿では,GAN-like 推定器の一般統計モデルへの応用について検討する。
論文 参考訳(メタデータ) (2024-10-28T05:50:47Z) - A Provably Accurate Randomized Sampling Algorithm for Logistic Regression [2.7930955543692817]
本稿では,ロジスティック回帰問題に対する単純なランダム化サンプリングに基づくアルゴリズムを提案する。
正確な近似は、観測総数よりもはるかに小さい試料で達成できることを示す。
概して、ロジスティック回帰における推定確率を効率的に近似するためにランダム化サンプリング手法を用いる可能性に光を当てている。
論文 参考訳(メタデータ) (2024-02-26T06:20:28Z) - Mean-Square Analysis of Discretized It\^o Diffusions for Heavy-tailed
Sampling [17.415391025051434]
重み付きポインカーの不等式に関連する伊藤拡散の自然クラスを離散化することにより、重み付き分布のクラスからのサンプリングの複雑さを分析する。
平均二乗解析に基づいて、ワッサーシュタイン2計量のターゲット分布に近い分布が$epsilon$のサンプルを得るための反復複雑性を確立する。
論文 参考訳(メタデータ) (2023-03-01T15:16:03Z) - Heavy-tailed Streaming Statistical Estimation [58.70341336199497]
ストリーミング$p$のサンプルから重み付き統計推定の課題を考察する。
そこで我々は,傾きの雑音に対して,よりニュアンスな条件下での傾きの傾きの低下を設計し,より詳細な解析を行う。
論文 参考訳(メタデータ) (2021-08-25T21:30:27Z) - Near-optimal inference in adaptive linear regression [60.08422051718195]
最小二乗法のような単純な方法でさえ、データが適応的に収集されるときの非正規な振る舞いを示すことができる。
我々は,これらの分布異常を少なくとも2乗推定で補正するオンラインデバイアス推定器のファミリーを提案する。
我々は,マルチアームバンディット,自己回帰時系列推定,探索による能動的学習などの応用を通して,我々の理論の有用性を実証する。
論文 参考訳(メタデータ) (2021-07-05T21:05:11Z) - Maximum sampled conditional likelihood for informative subsampling [4.708378681950648]
サブサンプリングは、計算資源が限られているときに大量のデータセットから情報を抽出する、計算学的に効果的な手法である。
そこで本研究では,サンプルデータに基づく最大条件付き確率推定器(MSCLE)を提案する。
論文 参考訳(メタデータ) (2020-11-11T16:01:17Z) - Distributionally Robust Parametric Maximum Likelihood Estimation [13.09499764232737]
パラメトリックな名目分布に対して,最悪の場合のログロスを均一に最小化する,分布的に頑健な最大確率推定器を提案する。
我々の新しい頑健な推定器は、統計的整合性も享受し、回帰と分類の両方に有望な実験結果を提供する。
論文 参考訳(メタデータ) (2020-10-11T19:05:49Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z) - Minimax Optimal Estimation of KL Divergence for Continuous Distributions [56.29748742084386]
Kullback-Leibler の同一および独立に分布するサンプルからの発散は、様々な領域において重要な問題である。
単純で効果的な推定器の1つは、これらのサンプル間の近辺 k に基づいている。
論文 参考訳(メタデータ) (2020-02-26T16:37:37Z) - Estimating Gradients for Discrete Random Variables by Sampling without
Replacement [93.09326095997336]
我々は、置換のないサンプリングに基づいて、離散確率変数に対する期待値の偏りのない推定器を導出する。
推定器は3つの異なる推定器のラオ・ブラックウェル化として導出可能であることを示す。
論文 参考訳(メタデータ) (2020-02-14T14:15:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。