論文の概要: Parallel Approaches to Accelerate Bayesian Decision Trees
- arxiv url: http://arxiv.org/abs/2301.09090v1
- Date: Sun, 22 Jan 2023 09:56:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-24 14:54:35.778808
- Title: Parallel Approaches to Accelerate Bayesian Decision Trees
- Title(参考訳): ベイズ決定木を加速する並列アプローチ
- Authors: Efthyvoulos Drousiotis, Paul G. Spirakis, and Simon Maskell
- Abstract要約: 本稿では,MCMCにおける並列性を利用した2つの手法を提案する。
第一に、MCMCを別の数値ベイズ的アプローチで置き換える。
第2に、データのパーティショニングについて検討する。
- 参考スコア(独自算出の注目度): 1.9728521995447947
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Markov Chain Monte Carlo (MCMC) is a well-established family of algorithms
primarily used in Bayesian statistics to sample from a target distribution when
direct sampling is challenging. Existing work on Bayesian decision trees uses
MCMC. Unfortunately, this can be slow, especially when considering large
volumes of data. It is hard to parallelise the accept-reject component of the
MCMC. None-the-less, we propose two methods for exploiting parallelism in the
MCMC: in the first, we replace the MCMC with another numerical Bayesian
approach, the Sequential Monte Carlo (SMC) sampler, which has the appealing
property that it is an inherently parallel algorithm; in the second, we
consider data partitioning. Both methods use multi-core processing with a
HighPerformance Computing (HPC) resource. We test the two methods in various
study settings to determine which method is the most beneficial for each test
case. Experiments show that data partitioning has limited utility in the
settings we consider and that the use of the SMC sampler can improve run-time
(compared to the sequential implementation) by up to a factor of 343.
- Abstract(参考訳): マルコフ連鎖モンテカルロ(英: markov chain monte carlo、mcmc)は、ベイズ統計学において、直接サンプリングが難しい場合にターゲット分布からサンプリングするために用いられるアルゴリズム群である。
ベイズ決定木に関する既存の研究はMCMCを使用している。
残念ながら、特に大量のデータを考慮すると、これは遅くなります。
MCMCのrecept-rejectコンポーネントを並列化するのは難しい。
MCMCの並列性を利用する2つの手法を提案する。第1に、MCMCを別の数値ベイズ的アプローチであるシークエンシャルモンテカルロ(SMC)サンプリング器に置き換える。
どちらの手法もハイパフォーマンスコンピューティング(hpc)リソースでマルチコア処理を使用する。
各テストケースに最も有益な方法を決定するために,様々な研究環境で2つの方法をテストした。
実験の結果、データパーティショニングは私たちが考慮している設定において限られたユーティリティを持ち、SMCサンプルラを使用することで(シーケンシャルな実装と比較して)実行時間を最大343倍改善できることがわかった。
関連論文リスト
- SpreadNUTS -- Moderate Dynamic Extension of Paths for No-U-Turn Sampling
& Partitioning Visited Regions [0.0]
本稿では,no-U-turn sampler (NUTS) として知られる特定のハミルトンモンテカルロ (HMC) アルゴリズムの変更を紹介する。
NUTS は NUTS よりも早くサンプル空間を探索することを目的としており、真分布への収束が NUTS より高速なサンプリング器を提供する。
論文 参考訳(メタデータ) (2023-07-09T05:00:25Z) - Bayesian Decision Trees Inspired from Evolutionary Algorithms [64.80360020499555]
我々は、マルコフ連鎖モンテカルロ(MCMC)を本質的に並列なアルゴリズムであるシーケンシャルモンテカルロ(SMC)に置き換えることを提案する。
実験により、SMCと進化的アルゴリズム(EA)を組み合わせることで、MCMCの100倍のイテレーションでより正確な結果が得られることが示された。
論文 参考訳(メタデータ) (2023-05-30T06:17:35Z) - Learning Hidden Markov Models Using Conditional Samples [72.20944611510198]
本稿では,隠れマルコフモデル(HMM)の学習における計算複雑性について述べる。
本稿では,HMMの条件分布からサンプルを問合せする対話型アクセスモデルを提案する。
具体的には、正確な条件付き確率に対するクエリアクセスが可能な設定において、HMMを学習するための効率的なアルゴリズムを得る。
論文 参考訳(メタデータ) (2023-02-28T16:53:41Z) - Single MCMC Chain Parallelisation on Decision Trees [0.9137554315375919]
本稿では,平均的なラップトップやパソコン上でMCMC決定ツリーチェーンを並列化する手法を提案する。
実験の結果,シリアルと並列実装が統計的に同一である場合,実行時間を18倍に向上できることがわかった。
論文 参考訳(メタデータ) (2022-07-26T07:07:51Z) - Knowledge Removal in Sampling-based Bayesian Inference [86.14397783398711]
単一のデータ削除要求が来ると、企業は大量のリソースで学んだモデル全体を削除する必要があるかもしれない。
既存の研究は、明示的にパラメータ化されたモデルのためにデータから学んだ知識を取り除く方法を提案する。
本稿では,MCMCのための機械学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-24T10:03:01Z) - Compressed Monte Carlo with application in particle filtering [11.84836209560411]
ランダムサンプルの集合に含まれる統計情報を圧縮するための圧縮MC(C-MC)スキームの理論と実践を紹介する。
C-MCは、この研究で導入された3つの新しいスキームで示されるように、粒子フィルタリングおよび適応ISアルゴリズムにおいて有用である。
論文 参考訳(メタデータ) (2021-07-18T14:32:04Z) - DG-LMC: A Turn-key and Scalable Synchronous Distributed MCMC Algorithm [21.128416842467132]
ユーザフレンドリな分散MCMCアルゴリズムを用いて,高次元設定でのスケーリングを実現する。
本稿では,合成実験および実データ実験における提案手法の有効性について述べる。
論文 参考訳(メタデータ) (2021-06-11T10:37:14Z) - Variational Combinatorial Sequential Monte Carlo Methods for Bayesian
Phylogenetic Inference [4.339931151475307]
Vari Combinatorial Monte Carlo (VCSMC) は複雑な構造について学習するための変分探索を確立する強力なフレームワークである。
本稿では,VCSMC と CSMC が,従来のタスクよりも高い確率空間を探索できることを示す。
論文 参考訳(メタデータ) (2021-05-31T19:44:24Z) - CoCoMoT: Conformance Checking of Multi-Perspective Processes via SMT
(Extended Version) [62.96267257163426]
我々はCoCoMoT(Computing Conformance Modulo Theories)フレームワークを紹介する。
まず、純粋な制御フロー設定で研究したSATベースのエンコーディングを、データ認識ケースに持ち上げる方法を示す。
次に,プロパティ保存型クラスタリングの概念に基づく新しい前処理手法を提案する。
論文 参考訳(メタデータ) (2021-03-18T20:22:50Z) - Kernel learning approaches for summarising and combining posterior
similarity matrices [68.8204255655161]
我々は,ベイズクラスタリングモデルに対するMCMCアルゴリズムの出力を要約するための新しいアプローチを提案するために,後部類似性行列(PSM)の概念を構築した。
我々の研究の重要な貢献は、PSMが正の半定値であり、したがって確率的に動機付けられたカーネル行列を定義するのに使用できることである。
論文 参考訳(メタデータ) (2020-09-27T14:16:14Z) - Involutive MCMC: a Unifying Framework [64.46316409766764]
iMCMCでは,幅広いMCMCアルゴリズムについて述べる。
我々は、新しいMCMCアルゴリズムを開発するための設計原則として使用できる多くのトリックを定式化する。
後者は、既知の可逆MCMCアルゴリズムをより効率的な可逆アルゴリズムに変換する2つの例で示す。
論文 参考訳(メタデータ) (2020-06-30T10:21:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。