論文の概要: Parallel Approaches to Accelerate Bayesian Decision Trees
- arxiv url: http://arxiv.org/abs/2301.09090v1
- Date: Sun, 22 Jan 2023 09:56:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-24 14:54:35.778808
- Title: Parallel Approaches to Accelerate Bayesian Decision Trees
- Title(参考訳): ベイズ決定木を加速する並列アプローチ
- Authors: Efthyvoulos Drousiotis, Paul G. Spirakis, and Simon Maskell
- Abstract要約: 本稿では,MCMCにおける並列性を利用した2つの手法を提案する。
第一に、MCMCを別の数値ベイズ的アプローチで置き換える。
第2に、データのパーティショニングについて検討する。
- 参考スコア(独自算出の注目度): 1.9728521995447947
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Markov Chain Monte Carlo (MCMC) is a well-established family of algorithms
primarily used in Bayesian statistics to sample from a target distribution when
direct sampling is challenging. Existing work on Bayesian decision trees uses
MCMC. Unfortunately, this can be slow, especially when considering large
volumes of data. It is hard to parallelise the accept-reject component of the
MCMC. None-the-less, we propose two methods for exploiting parallelism in the
MCMC: in the first, we replace the MCMC with another numerical Bayesian
approach, the Sequential Monte Carlo (SMC) sampler, which has the appealing
property that it is an inherently parallel algorithm; in the second, we
consider data partitioning. Both methods use multi-core processing with a
HighPerformance Computing (HPC) resource. We test the two methods in various
study settings to determine which method is the most beneficial for each test
case. Experiments show that data partitioning has limited utility in the
settings we consider and that the use of the SMC sampler can improve run-time
(compared to the sequential implementation) by up to a factor of 343.
- Abstract(参考訳): マルコフ連鎖モンテカルロ(英: markov chain monte carlo、mcmc)は、ベイズ統計学において、直接サンプリングが難しい場合にターゲット分布からサンプリングするために用いられるアルゴリズム群である。
ベイズ決定木に関する既存の研究はMCMCを使用している。
残念ながら、特に大量のデータを考慮すると、これは遅くなります。
MCMCのrecept-rejectコンポーネントを並列化するのは難しい。
MCMCの並列性を利用する2つの手法を提案する。第1に、MCMCを別の数値ベイズ的アプローチであるシークエンシャルモンテカルロ(SMC)サンプリング器に置き換える。
どちらの手法もハイパフォーマンスコンピューティング(hpc)リソースでマルチコア処理を使用する。
各テストケースに最も有益な方法を決定するために,様々な研究環境で2つの方法をテストした。
実験の結果、データパーティショニングは私たちが考慮している設定において限られたユーティリティを持ち、SMCサンプルラを使用することで(シーケンシャルな実装と比較して)実行時間を最大343倍改善できることがわかった。
関連論文リスト
- Continuous Monte Carlo Graph Search [79.0972258753576]
連続モンテカルログラフサーチ(Continuous Monte Carlo Graph Search, CMCGS)は、モンテカルログラフサーチ(MCTS)のオンライン計画への拡張である。
CMCGSは、計画中、複数の州で同じ行動方針を共有することで高いパフォーマンスが得られるという洞察を生かしている。
CMCGSは、いくつかの複雑な連続DeepMind Control Suiteベンチマークと2Dナビゲーションタスクで比較方法より優れている。
論文 参考訳(メタデータ) (2022-10-04T07:34:06Z) - Single MCMC Chain Parallelisation on Decision Trees [0.9137554315375919]
本稿では,平均的なラップトップやパソコン上でMCMC決定ツリーチェーンを並列化する手法を提案する。
実験の結果,シリアルと並列実装が統計的に同一である場合,実行時間を18倍に向上できることがわかった。
論文 参考訳(メタデータ) (2022-07-26T07:07:51Z) - Asymmetric Scalable Cross-modal Hashing [51.309905690367835]
クロスモーダルハッシュは、大規模なマルチメディア検索問題を解決する方法として成功している。
これらの問題に対処する新しい非対称スケーラブルクロスモーダルハッシュ(ASCMH)を提案する。
我々のASCMHは、最先端のクロスモーダルハッシュ法よりも精度と効率の点で優れています。
論文 参考訳(メタデータ) (2022-07-26T04:38:47Z) - Knowledge Removal in Sampling-based Bayesian Inference [86.14397783398711]
単一のデータ削除要求が来ると、企業は大量のリソースで学んだモデル全体を削除する必要があるかもしれない。
既存の研究は、明示的にパラメータ化されたモデルのためにデータから学んだ知識を取り除く方法を提案する。
本稿では,MCMCのための機械学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-24T10:03:01Z) - Parallel MCMC Without Embarrassing Failures [19.429985676081618]
MCMCはデータパーティションで定義された(サブ)後続体上で並列に実行される。
効率的ではあるが、このフレームワークは後部サンプリングの品質に非常に敏感である。
我々はこの問題を緩和するための新しい組み合わせ戦略を提案する。
論文 参考訳(メタデータ) (2022-02-22T20:17:46Z) - Compressed Monte Carlo with application in particle filtering [11.84836209560411]
ランダムサンプルの集合に含まれる統計情報を圧縮するための圧縮MC(C-MC)スキームの理論と実践を紹介する。
C-MCは、この研究で導入された3つの新しいスキームで示されるように、粒子フィルタリングおよび適応ISアルゴリズムにおいて有用である。
論文 参考訳(メタデータ) (2021-07-18T14:32:04Z) - DG-LMC: A Turn-key and Scalable Synchronous Distributed MCMC Algorithm [21.128416842467132]
ユーザフレンドリな分散MCMCアルゴリズムを用いて,高次元設定でのスケーリングを実現する。
本稿では,合成実験および実データ実験における提案手法の有効性について述べる。
論文 参考訳(メタデータ) (2021-06-11T10:37:14Z) - Variational Combinatorial Sequential Monte Carlo Methods for Bayesian
Phylogenetic Inference [4.339931151475307]
Vari Combinatorial Monte Carlo (VCSMC) は複雑な構造について学習するための変分探索を確立する強力なフレームワークである。
本稿では,VCSMC と CSMC が,従来のタスクよりも高い確率空間を探索できることを示す。
論文 参考訳(メタデータ) (2021-05-31T19:44:24Z) - CoCoMoT: Conformance Checking of Multi-Perspective Processes via SMT
(Extended Version) [62.96267257163426]
我々はCoCoMoT(Computing Conformance Modulo Theories)フレームワークを紹介する。
まず、純粋な制御フロー設定で研究したSATベースのエンコーディングを、データ認識ケースに持ち上げる方法を示す。
次に,プロパティ保存型クラスタリングの概念に基づく新しい前処理手法を提案する。
論文 参考訳(メタデータ) (2021-03-18T20:22:50Z) - Kernel learning approaches for summarising and combining posterior
similarity matrices [68.8204255655161]
我々は,ベイズクラスタリングモデルに対するMCMCアルゴリズムの出力を要約するための新しいアプローチを提案するために,後部類似性行列(PSM)の概念を構築した。
我々の研究の重要な貢献は、PSMが正の半定値であり、したがって確率的に動機付けられたカーネル行列を定義するのに使用できることである。
論文 参考訳(メタデータ) (2020-09-27T14:16:14Z) - Involutive MCMC: a Unifying Framework [64.46316409766764]
iMCMCでは,幅広いMCMCアルゴリズムについて述べる。
我々は、新しいMCMCアルゴリズムを開発するための設計原則として使用できる多くのトリックを定式化する。
後者は、既知の可逆MCMCアルゴリズムをより効率的な可逆アルゴリズムに変換する2つの例で示す。
論文 参考訳(メタデータ) (2020-06-30T10:21:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。