論文の概要: Distributed Learning of Finite Gaussian Mixtures
- arxiv url: http://arxiv.org/abs/2010.10412v3
- Date: Wed, 10 Nov 2021 20:55:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 07:41:43.551646
- Title: Distributed Learning of Finite Gaussian Mixtures
- Title(参考訳): 有限ガウス混合系の分散学習
- Authors: Qiong Zhang and Jiahua Chen
- Abstract要約: 有限ガウス混合系の分散学習における分割・対数アプローチについて検討する。
新しい推定器は整合性を示し、いくつかの一般的な条件下ではルート-nの整合性を保持する。
シミュレーションおよび実世界のデータに基づく実験により、提案手法はグローバル推定器と同等の統計的性能を有することが示された。
- 参考スコア(独自算出の注目度): 21.652015112462
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Advances in information technology have led to extremely large datasets that
are often kept in different storage centers. Existing statistical methods must
be adapted to overcome the resulting computational obstacles while retaining
statistical validity and efficiency. Split-and-conquer approaches have been
applied in many areas, including quantile processes, regression analysis,
principal eigenspaces, and exponential families. We study split-and-conquer
approaches for the distributed learning of finite Gaussian mixtures. We
recommend a reduction strategy and develop an effective MM algorithm. The new
estimator is shown to be consistent and retains root-n consistency under some
general conditions. Experiments based on simulated and real-world data show
that the proposed split-and-conquer approach has comparable statistical
performance with the global estimator based on the full dataset, if the latter
is feasible. It can even slightly outperform the global estimator if the model
assumption does not match the real-world data. It also has better statistical
and computational performance than some existing methods.
- Abstract(参考訳): 情報技術の進歩は、しばしば異なるストレージセンターに保存される非常に大きなデータセットにつながった。
既存の統計手法は、統計的妥当性と効率を保ちながら、結果の計算障害を克服するために適応する必要がある。
分数過程、回帰解析、主固有空間、指数族など、多くの領域でスプリット・アンド・コンカレントアプローチが適用されている。
有限ガウス混合系の分散学習における分割・対数アプローチについて検討する。
我々は,削減戦略を推奨し,効果的なmmアルゴリズムを開発した。
新しい推定器は整合性を示し、いくつかの一般的な条件下でルート-n整合性を保持する。
シミュレーションと実世界のデータに基づく実験では、もし後者が実現可能であれば、提案手法が全データセットに基づくグローバル推定器と同等の統計性能を持つことを示す。
モデル仮定が実世界データと一致しない場合、グローバル推定器をわずかに上回ることさえある。
また、既存の手法よりも統計や計算性能が優れている。
関連論文リスト
- Uncertainty estimation in satellite precipitation spatial prediction by combining distributional regression algorithms [3.8623569699070353]
データマージによって降水データセットを作成するエンジニアリングタスクに対して,分散回帰の概念を導入する。
本研究では,空間予測だけでなく,一般の予測問題にも有用な新しいアンサンブル学習手法を提案する。
論文 参考訳(メタデータ) (2024-06-29T05:58:00Z) - Iterative Methods for Full-Scale Gaussian Process Approximations for Large Spatial Data [9.913418444556486]
本稿では, FSAを用いた確率, 勾配, 予測分布の計算コストの削減に, 反復法をどのように利用できるかを示す。
また,推定法や反復法に依存する予測分散を計算する新しい,正確かつ高速な手法を提案する。
すべてのメソッドは、ハイレベルなPythonとRパッケージを備えたフリーのC++ソフトウェアライブラリで実装されている。
論文 参考訳(メタデータ) (2024-05-23T12:25:22Z) - Distributed Learning of Mixtures of Experts [0.0]
私たちは、自然に分散されたデータセットや、計算を分散する潜在的に大きなデータセットを扱います。
本研究では,データ分散サブセットに並列に適合する局所的推定器から還元推定器を構築するために,専門家(MoE)モデルとアグリゲーション戦略を併用した分散学習手法を提案する。
論文 参考訳(メタデータ) (2023-12-15T15:26:13Z) - Deep Ensembles Meets Quantile Regression: Uncertainty-aware Imputation
for Time Series [49.992908221544624]
時系列データは、しばしば多くの欠落した値を示し、これは時系列計算タスクである。
従来の深層学習法は時系列計算に有効であることが示されている。
本研究では,不確実性のある高精度な計算を行う非生成時系列計算法を提案する。
論文 参考訳(メタデータ) (2023-12-03T05:52:30Z) - Improved Distribution Matching for Dataset Condensation [91.55972945798531]
本稿では,分布マッチングに基づく新しいデータセット凝縮法を提案する。
提案手法は,計算資源の少ない従来の最適化指向手法よりも優れている。
論文 参考訳(メタデータ) (2023-07-19T04:07:33Z) - Distributed Semi-Supervised Sparse Statistical Inference [6.685997976921953]
縮退推定器は高次元モデルパラメータの統計的推測において重要なツールである。
従来の手法では、すべてのマシンで偏りのある推定器を計算する必要がある。
ラベル付きデータと非ラベル付きデータを統合した効率的なマルチラウンド分散脱バイアス推定器を開発した。
論文 参考訳(メタデータ) (2023-06-17T17:30:43Z) - DRFLM: Distributionally Robust Federated Learning with Inter-client
Noise via Local Mixup [58.894901088797376]
連合学習は、生データをリークすることなく、複数の組織のデータを使用してグローバルモデルをトレーニングするための有望なアプローチとして登場した。
上記の2つの課題を同時に解決するための一般的な枠組みを提案する。
我々は、ロバストネス解析、収束解析、一般化能力を含む包括的理論的解析を提供する。
論文 参考訳(メタデータ) (2022-04-16T08:08:29Z) - Optimal Ensemble Construction for Multi-Study Prediction with
Applications to COVID-19 Excess Mortality Estimation [7.02598981483736]
マルチスタディ・アンサンブルは、研究固有のモデルに適合し、アンサンブル重みを別々に推定する2段階戦略を用いる。
このアプローチは、モデル適合段階でのアンサンブル特性を無視し、効率を損なう可能性がある。
パンデミックの開始前にはほとんどデータが入手できない場合、他の国のデータを活用することで、予測精度が大幅に向上することを示した。
論文 参考訳(メタデータ) (2021-09-19T16:52:41Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z) - Real-Time Regression with Dividing Local Gaussian Processes [62.01822866877782]
局所ガウス過程は、ガウス過程の回帰に基づく新しい、計算効率の良いモデリング手法である。
入力空間の反復的データ駆動分割により、実際にはトレーニングポイントの総数において、サブ線形計算複雑性が達成される。
実世界のデータセットに対する数値的な評価は、予測と更新の速度だけでなく、精度の点で他の最先端手法よりも有利であることを示している。
論文 参考訳(メタデータ) (2020-06-16T18:43:31Z) - Instability, Computational Efficiency and Statistical Accuracy [101.32305022521024]
我々は,人口レベルでのアルゴリズムの決定論的収束率と,$n$サンプルに基づく経験的対象に適用した場合の(不安定性)の間の相互作用に基づいて,統計的精度を得るフレームワークを開発する。
本稿では,ガウス混合推定,非線形回帰モデル,情報的非応答モデルなど,いくつかの具体的なモデルに対する一般結果の応用について述べる。
論文 参考訳(メタデータ) (2020-05-22T22:30:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。