論文の概要: Estimation of multiple mean vectors in high dimension
- arxiv url: http://arxiv.org/abs/2403.15038v1
- Date: Fri, 22 Mar 2024 08:42:41 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-25 18:08:17.698404
- Title: Estimation of multiple mean vectors in high dimension
- Title(参考訳): 高次元における複数平均ベクトルの推定
- Authors: Gilles Blanchard, Jean-Baptiste Fermanian, Hannah Marienwald,
- Abstract要約: 我々は,独立標本に基づいて,共通空間上の様々な確率分布の多次元的手段を推定する。
我々のアプローチは、これらのサンプルから得られた経験的手段の凸結合による推定器の形成である。
- 参考スコア(独自算出の注目度): 4.2466572124753
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We endeavour to estimate numerous multi-dimensional means of various probability distributions on a common space based on independent samples. Our approach involves forming estimators through convex combinations of empirical means derived from these samples. We introduce two strategies to find appropriate data-dependent convex combination weights: a first one employing a testing procedure to identify neighbouring means with low variance, which results in a closed-form plug-in formula for the weights, and a second one determining weights via minimization of an upper confidence bound on the quadratic risk.Through theoretical analysis, we evaluate the improvement in quadratic risk offered by our methods compared to the empirical means. Our analysis focuses on a dimensional asymptotics perspective, showing that our methods asymptotically approach an oracle (minimax) improvement as the effective dimension of the data increases.We demonstrate the efficacy of our methods in estimating multiple kernel mean embeddings through experiments on both simulated and real-world datasets.
- Abstract(参考訳): 我々は,独立標本に基づいて,共通空間上の様々な確率分布の多次元的手段を推定する。
我々のアプローチは、これらのサンプルから得られた経験的手段の凸結合による推定器の形成である。
本稿では,2次リスクに縛られた上位信頼度を最小化することにより,2次重み付けを行う方法と,2次重み付けを行う方法とを比較検討し,2次重み付け法と2次重み付け法を比較検討した。
本分析は,データの有効次元が増大するにつれて,我々の手法がオラクル(minimax)改善に漸近的にアプローチすることを示し,シミュレーションと実世界の両方のデータセットの実験を通して,複数のカーネルの平均埋め込みを推定する手法の有効性を実証する。
関連論文リスト
- Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。
異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文 参考訳(メタデータ) (2024-04-24T09:04:36Z) - Mixed Matrix Completion in Complex Survey Sampling under Heterogeneous
Missingness [6.278498348219109]
サブ線形収束を実現する高速でスケーラブルな推定アルゴリズムを提案する。
本手法は,全国保健栄養検査調査データの分析に応用される。
論文 参考訳(メタデータ) (2024-02-06T12:26:58Z) - Empirical fits to inclusive electron-carbon scattering data obtained by deep-learning methods [0.0]
広い運動領域における炭素の電子散乱断面積に対する経験的適合性を得る。
このようなモデル非依存のパラメトリゼーションを得るための2つの異なる方法とそれに対応する不確実性を考える。
論文 参考訳(メタデータ) (2023-12-28T17:03:17Z) - A Multivariate Unimodality Test Harnessing the Dip Statistic of Mahalanobis Distances Over Random Projections [0.18416014644193066]
線形ランダムプロジェクションとポイント・ツー・ポイント・ディスタンシングにより、一次元の一様性原理を多次元空間に拡張する。
我々の手法は$alpha$-unimodalityの仮定に根ざし、泥ッドと呼ばれる新しい一様性試験を提示する。
理論的および実証的研究は,多次元データセットの一様性評価における本手法の有効性を確認した。
論文 参考訳(メタデータ) (2023-11-28T09:11:02Z) - Inference and Sampling for Archimax Copulas [29.864637081333097]
アルキマックスコプラ(Archimax copulas)は、分布のバルクと尾の同時モデリングを可能にする正確な表現を持つ分布の族である。
我々はArchimax copulasの表現に基づいて、非パラメトリック推論法とサンプリングアルゴリズムを開発した。
実験により, 最先端密度モデリング手法と比較し, 提案手法は高次元データへのスケーリングにおいて, 尾部を効果的に外挿することを示した。
論文 参考訳(メタデータ) (2022-05-27T14:55:40Z) - Manifold Hypothesis in Data Analysis: Double Geometrically-Probabilistic
Approach to Manifold Dimension Estimation [92.81218653234669]
本稿では, 多様体仮説の検証と基礎となる多様体次元推定に対する新しいアプローチを提案する。
我々の幾何学的手法はミンコフスキー次元計算のためのよく知られたボックスカウントアルゴリズムのスパースデータの修正である。
実データセットの実験では、2つの手法の組み合わせに基づく提案されたアプローチが強力で効果的であることが示されている。
論文 参考訳(メタデータ) (2021-07-08T15:35:54Z) - MINIMALIST: Mutual INformatIon Maximization for Amortized Likelihood
Inference from Sampled Trajectories [61.3299263929289]
シミュレーションベースの推論は、その可能性が実際に計算できない場合でもモデルのパラメータを学習することができる。
あるクラスのメソッドは、異なるパラメータでシミュレートされたデータを使用して、確率とエビデンス比の償却推定器を推定する。
モデルパラメータとシミュレーションデータ間の相互情報の観点から,本手法が定式化可能であることを示す。
論文 参考訳(メタデータ) (2021-06-03T12:59:16Z) - Continuous Wasserstein-2 Barycenter Estimation without Minimax
Optimization [94.18714844247766]
ワッサーシュタイン・バリセンターは、最適輸送に基づく確率測度の重み付き平均の幾何学的概念を提供する。
本稿では,Wasserstein-2 バリセンタのサンプルアクセスを演算するスケーラブルなアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-02T21:01:13Z) - A similarity-based Bayesian mixture-of-experts model [0.5156484100374058]
多変量回帰問題に対する新しい非パラメトリック混合実験モデルを提案する。
条件付きモデルを用いて、サンプル外入力の予測は、観測された各データポイントと類似性に基づいて行われる。
混合物のパラメータと距離測定値に基づいて後部推論を行う。
論文 参考訳(メタデータ) (2020-12-03T18:08:30Z) - A One-step Approach to Covariate Shift Adaptation [82.01909503235385]
多くの機械学習シナリオにおけるデフォルトの前提は、トレーニングとテストサンプルは同じ確率分布から引き出されることである。
予測モデルと関連する重みを1つの最適化で共同で学習する新しいワンステップアプローチを提案する。
論文 参考訳(メタデータ) (2020-07-08T11:35:47Z) - Distributed Averaging Methods for Randomized Second Order Optimization [54.51566432934556]
我々はヘッセン語の形成が計算的に困難であり、通信がボトルネックとなる分散最適化問題を考察する。
我々は、ヘッセンのサンプリングとスケッチを用いたランダム化二階最適化のための非バイアスパラメータ平均化手法を開発した。
また、不均一なコンピューティングシステムのための非バイアス分散最適化フレームワークを導入するために、二階平均化手法のフレームワークを拡張した。
論文 参考訳(メタデータ) (2020-02-16T09:01:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。