論文の概要: Influence of parallel computing strategies of iterative imputation of
missing data: a case study on missForest
- arxiv url: http://arxiv.org/abs/2004.11195v1
- Date: Thu, 23 Apr 2020 14:41:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-10 10:04:39.763036
- Title: Influence of parallel computing strategies of iterative imputation of
missing data: a case study on missForest
- Title(参考訳): 欠落データの反復計算における並列計算戦略の影響:MissForestを事例として
- Authors: Shangzhi Hong, Yuqi Sun, Hanying Li, Henry S. Lynn
- Abstract要約: 本研究では,ランダムフォレスト計算法であるミスフォレストに実装された2つの並列戦略(可変分散およびモデル分散計算)について検討する。
シミュレーション実験の結果,2つの並列戦略が計算過程と最終計算結果の両方に異なる影響を与えることがわかった。
- 参考スコア(独自算出の注目度): 0.716879432974126
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning iterative imputation methods have been well accepted by
researchers for imputing missing data, but they can be time-consuming when
handling large datasets. To overcome this drawback, parallel computing
strategies have been proposed but their impact on imputation results and
subsequent statistical analyses are relatively unknown. This study examines the
two parallel strategies (variable-wise distributed computation and model-wise
distributed computation) implemented in the random-forest imputation method,
missForest. Results from the simulation experiments showed that the two
parallel strategies can influence both the imputation process and the final
imputation results differently. Specifically, even though both strategies
produced similar normalized root mean squared prediction errors, the
variable-wise distributed strategy led to additional biases when estimating the
mean and inter-correlation of the covariates and their regression coefficients.
- Abstract(参考訳): 機械学習の反復的計算手法は、欠落したデータを計算するために研究者によってよく受け入れられているが、大規模なデータセットを扱うには時間がかかる。
この欠点を克服するため、並列コンピューティング戦略が提案されているが、計算結果やその後の統計分析への影響は比較的分かっていない。
本研究では,ランダムフォレスト計算法であるミスフォレストに実装された2つの並列戦略(可変分散計算とモデル分散計算)について検討する。
シミュレーション実験の結果,2つの並列戦略はインプテーション過程と最終インプテーション結果の両方に異なる影響を与えることがわかった。
具体的には、どちらの戦略も同様に正規化されたルート平均2乗予測誤差を生じるが、変数分布戦略は、共変量の平均とそれらの回帰係数の相関を推定する際に、さらなるバイアスをもたらす。
関連論文リスト
- Estimating Conditional Average Treatment Effects via Sufficient Representation Learning [31.822980052107496]
本稿では,その特徴を十分に表現するためにtextbfCrossNet という新しいニューラルネットワークアプローチを提案し,条件平均処理効果(CATE)を推定する。
数値シミュレーションと実験により,本手法が競合手法より優れていることを示す。
論文 参考訳(メタデータ) (2024-08-30T07:23:59Z) - Structured Radial Basis Function Network: Modelling Diversity for
Multiple Hypotheses Prediction [51.82628081279621]
多重モード回帰は非定常過程の予測や分布の複雑な混合において重要である。
構造的放射基底関数ネットワークは回帰問題に対する複数の仮説予測器のアンサンブルとして提示される。
この構造モデルにより, このテッセルレーションを効率よく補間し, 複数の仮説対象分布を近似することが可能であることが証明された。
論文 参考訳(メタデータ) (2023-09-02T01:27:53Z) - Achieving Sample and Computational Efficient Reinforcement Learning by
Action Space Reduction via Grouping [7.691755449724638]
強化学習は、しばしば高次元空間における状態や行動の指数的な成長に対処する必要がある。
我々は、動作に類似したMDPの固有の構造を学び、性能劣化とサンプル/計算の複雑さを適切にバランスさせる。
論文 参考訳(メタデータ) (2023-06-22T15:40:10Z) - Coordinated Double Machine Learning [8.808993671472349]
本稿では、ディープニューラルネットワークのための注意深く調整された学習アルゴリズムにより、推定バイアスを低減できると主張している。
シミュレーションデータと実データの両方を用いた数値実験により,提案手法の実証性能が向上したことを示す。
論文 参考訳(メタデータ) (2022-06-02T05:56:21Z) - Generalization bounds and algorithms for estimating conditional average
treatment effect of dosage [13.867315751451494]
本研究では,治療薬対の条件付き平均因果効果を観測データと仮定の組み合わせで推定する作業について検討した。
これは疫学や経済学など、意思決定のために治療薬対を必要とする分野における長年にわたる課題である。
この問題に対するいくつかのベンチマークデータセットに対して、実証的に新しい最先端のパフォーマンス結果を示す。
論文 参考訳(メタデータ) (2022-05-29T15:26:59Z) - Scalable Intervention Target Estimation in Linear Models [52.60799340056917]
因果構造学習への現在のアプローチは、既知の介入目標を扱うか、仮説テストを使用して未知の介入目標を発見する。
本稿では、全ての介入対象を一貫して識別するスケーラブルで効率的なアルゴリズムを提案する。
提案アルゴリズムは、与えられた観測マルコフ同値クラスを介入マルコフ同値クラスに更新することも可能である。
論文 参考訳(メタデータ) (2021-11-15T03:16:56Z) - Convolutional generative adversarial imputation networks for
spatio-temporal missing data in storm surge simulations [86.5302150777089]
GAN(Generative Adversarial Imputation Nets)とGANベースの技術は、教師なし機械学習手法として注目されている。
提案手法を Con Conval Generative Adversarial Imputation Nets (Conv-GAIN) と呼ぶ。
論文 参考訳(メタデータ) (2021-11-03T03:50:48Z) - Nonparametric Estimation of Heterogeneous Treatment Effects: From Theory
to Learning Algorithms [91.3755431537592]
プラグイン推定と擬似出力回帰に依存する4つの幅広いメタ学習戦略を解析する。
この理論的推論を用いて、アルゴリズム設計の原則を導出し、分析を実践に翻訳する方法について強調する。
論文 参考訳(メタデータ) (2021-01-26T17:11:40Z) - Distributed Learning of Finite Gaussian Mixtures [21.652015112462]
有限ガウス混合系の分散学習における分割・対数アプローチについて検討する。
新しい推定器は整合性を示し、いくつかの一般的な条件下ではルート-nの整合性を保持する。
シミュレーションおよび実世界のデータに基づく実験により、提案手法はグローバル推定器と同等の統計的性能を有することが示された。
論文 参考訳(メタデータ) (2020-10-20T16:17:47Z) - Double Robust Representation Learning for Counterfactual Prediction [68.78210173955001]
そこで本稿では, 対実予測のための2次ロバスト表現を学習するための, スケーラブルな新しい手法を提案する。
我々は、個々の治療効果と平均的な治療効果の両方に対して、堅牢で効率的な対実的予測を行う。
このアルゴリズムは,実世界の最先端技術と合成データとの競合性能を示す。
論文 参考訳(メタデータ) (2020-10-15T16:39:26Z) - Real-Time Regression with Dividing Local Gaussian Processes [62.01822866877782]
局所ガウス過程は、ガウス過程の回帰に基づく新しい、計算効率の良いモデリング手法である。
入力空間の反復的データ駆動分割により、実際にはトレーニングポイントの総数において、サブ線形計算複雑性が達成される。
実世界のデータセットに対する数値的な評価は、予測と更新の速度だけでなく、精度の点で他の最先端手法よりも有利であることを示している。
論文 参考訳(メタデータ) (2020-06-16T18:43:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。