論文の概要: Parallelizing Tree Search with Twice Sequential Monte Carlo
- arxiv url: http://arxiv.org/abs/2511.14220v1
- Date: Tue, 18 Nov 2025 07:54:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:52.996796
- Title: Parallelizing Tree Search with Twice Sequential Monte Carlo
- Title(参考訳): 二列モンテカルロによる木探索の並列化
- Authors: Yaniv Oren, Joery A. de Vries, Pascal R. van der Vaart, Matthijs T. J. Spaan, Wendelin Böhmer,
- Abstract要約: 我々はモンテカルロ木探索 (MCTS) アルゴリズムの代替として, TSMCTS (Twice Sequential Monte Carlo Tree Search) を提案する。
TSMCTSは並列化が容易で、GPUアクセラレーションに適している。
TSMCTSは,SMCの並列化を自然にする特性を維持しつつ,逐次計算と良好にスケール可能であることを示す。
- 参考スコア(独自算出の注目度): 7.863528049670872
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Model-based reinforcement learning (RL) methods that leverage search are responsible for many milestone breakthroughs in RL. Sequential Monte Carlo (SMC) recently emerged as an alternative to the Monte Carlo Tree Search (MCTS) algorithm which drove these breakthroughs. SMC is easier to parallelize and more suitable to GPU acceleration. However, it also suffers from large variance and path degeneracy which prevent it from scaling well with increased search depth, i.e., increased sequential compute. To address these problems, we introduce Twice Sequential Monte Carlo Tree Search (TSMCTS). Across discrete and continuous environments TSMCTS outperforms the SMC baseline as well as a popular modern version of MCTS. Through variance reduction and mitigation of path degeneracy, TSMCTS scales favorably with sequential compute while retaining the properties that make SMC natural to parallelize.
- Abstract(参考訳): 探索を利用するモデルベース強化学習(RL)手法は、RLにおける多くの画期的なブレークスルーの原因となっている。
シークエンシャルモンテカルロ(SMC)は最近、これらのブレークスルーを駆動するモンテカルロ木探索(MCTS)アルゴリズムの代替として登場した。
SMCは並列化が容易で、GPUアクセラレーションに適している。
しかし、探索深度の増加、すなわちシーケンシャルな計算量の増加によって、大きなばらつきと経路の縮退に悩まされる。
これらの問題に対処するため、TSMCTS (Twice Sequential Monte Carlo Tree Search) を提案する。
離散的かつ連続的な環境におけるTSMCTSは、MCTSのモダンバージョンと同様に、SMCベースラインよりも優れている。
経路縮退の分散低減と緩和により、TSMCTSはSMCの並列化を自然なものにする特性を維持しながら、逐次計算と良好にスケールする。
関連論文リスト
- Fast Monte Carlo Tree Diffusion: 100x Speedup via Parallel Sparse Planning [63.07406294571171]
最近提案されたモンテカルロ木拡散(MCTD)は,木に基づく探索と拡散を組み合わせて,有望な解を提供する。
Fast-MCTDは、遅延ツリー更新と冗長性認識による並列ロールアウトを可能にするParallel MCTDと、軌道粗大化によるロールアウト長の削減を行うSparse MCTDの2つの技術を統合する。
実験により、Fast-MCTDは標準MCTDよりも最大100倍の高速化を実現し、計画性能を維持または改善した。
論文 参考訳(メタデータ) (2025-06-11T08:17:40Z) - Trust-Region Twisted Policy Improvement [8.73717644648873]
モンテカルロ木探索(MCTS)は、近年の深層強化学習(RL)におけるブレークスルーを招いている。
我々は、制約された動作サンプリングと明示的な端末状態ハンドリングを通じて、プランナー内のデータ生成を改善することにより、RLに特化したモンテカルロプランナーをカスタマイズする。
これによってTrust-Region Twisted SMC (TRT-SMC) が実現し,個別ドメインと連続ドメインの両方において,ベースラインMCTSおよびSMCメソッドのランタイムおよびサンプル効率が改善された。
論文 参考訳(メタデータ) (2025-04-08T13:47:07Z) - MCTS-RAG: Enhancing Retrieval-Augmented Generation with Monte Carlo Tree Search [61.11836311160951]
本稿では,知識集約型タスクにおける小言語モデルの推論能力を高める新しいアプローチであるMCTS-RAGを紹介する。
通常、推論から独立して情報を取得する標準的なRAG法とは異なり、MCTS-RAGは構造化推論と適応的検索を組み合わせる。
この統合されたアプローチは意思決定を強化し、幻覚を減らし、事実の正確性と応答の整合性を向上させる。
論文 参考訳(メタデータ) (2025-03-26T17:46:08Z) - Monte Carlo Tree Diffusion for System 2 Planning [57.50512800900167]
モンテカルロ木探索(MCTS)の適応探索機能と拡散モデルの生成強度を統合する新しいフレームワークであるモンテカルロ木拡散(MCTD)を紹介する。
本手法は,木構造化プロセスとしてデノナイジングを再認識し,部分的にデノナイジングした計画を反復的に評価し,刈り取り,精錬する。
論文 参考訳(メタデータ) (2025-02-11T02:51:42Z) - Anytime Sequential Halving in Monte-Carlo Tree Search [1.3820916757781068]
本稿では,任意のタイミングで停止し,良好な結果を返すアルゴリズムの任意のバージョンを提案する。
合成MAB問題と10の異なるボードゲームにおける経験的結果から、アルゴリズムの性能がSequential Halving や UCB1と競合していることが示されている。
論文 参考訳(メタデータ) (2024-11-11T17:49:47Z) - Comparison of parallel SMC and MCMC for Bayesian deep learning [3.4661537979254655]
この研究は、一貫した(漸近的に偏りのない)ベイズディープラーニングアルゴリズムの並列実装を体系的に比較する。
SMC$_parallel$に対して収束の証明を行い、理論上単一のモノリシックSMCサンプリング器と同じ収束のレベルを達成することを示す。
論文 参考訳(メタデータ) (2024-02-09T04:13:38Z) - Bayesian Decision Trees Inspired from Evolutionary Algorithms [64.80360020499555]
我々は、マルコフ連鎖モンテカルロ(MCMC)を本質的に並列なアルゴリズムであるシーケンシャルモンテカルロ(SMC)に置き換えることを提案する。
実験により、SMCと進化的アルゴリズム(EA)を組み合わせることで、MCMCの100倍のイテレーションでより正確な結果が得られることが示された。
論文 参考訳(メタデータ) (2023-05-30T06:17:35Z) - Continuous Monte Carlo Graph Search [61.11769232283621]
連続モンテカルログラフサーチ(Continuous Monte Carlo Graph Search, CMCGS)は、モンテカルログラフサーチ(MCTS)のオンラインプランニングへの拡張である。
CMCGSは、計画中、複数の州で同じ行動方針を共有することで高いパフォーマンスが得られるという洞察を生かしている。
並列化によってスケールアップすることができ、学習力学モデルによる連続制御においてクロスエントロピー法(CEM)よりも優れている。
論文 参考訳(メタデータ) (2022-10-04T07:34:06Z) - Variational Combinatorial Sequential Monte Carlo Methods for Bayesian
Phylogenetic Inference [4.339931151475307]
Vari Combinatorial Monte Carlo (VCSMC) は複雑な構造について学習するための変分探索を確立する強力なフレームワークである。
本稿では,VCSMC と CSMC が,従来のタスクよりも高い確率空間を探索できることを示す。
論文 参考訳(メタデータ) (2021-05-31T19:44:24Z) - On Effective Parallelization of Monte Carlo Tree Search [51.15940034629022]
モンテカルロ木探索(MCTS)は、探索木を構築するためにかなりの数のロールアウトを必要とするため、計算コストがかかる。
効果的な並列MCTSアルゴリズムを設計する方法は、体系的に研究されておらず、まだよく分かっていない。
我々は,より効率的な並列MCTSアルゴリズムの設計に,提案する必要条件をどのように適用できるかを実証する。
論文 参考訳(メタデータ) (2020-06-15T21:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。