論文の概要: Monte Carlo Search Algorithms Discovering Monte Carlo Tree Search Exploration Terms
- arxiv url: http://arxiv.org/abs/2404.09304v1
- Date: Sun, 14 Apr 2024 17:06:20 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-16 14:38:22.282190
- Title: Monte Carlo Search Algorithms Discovering Monte Carlo Tree Search Exploration Terms
- Title(参考訳): モンテカルロ木探索用語を探索するモンテカルロ探索アルゴリズム
- Authors: Tristan Cazenave,
- Abstract要約: 最適化されたモンテカルロ木探索アルゴリズムはPUCTとSHUSSである。
32評価の小さな探索予算に対して、発見されたルート探索条件は両方のアルゴリズムを競合させる。
- 参考スコア(独自算出の注目度): 4.561007128508218
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Monte Carlo Tree Search and Monte Carlo Search have good results for many combinatorial problems. In this paper we propose to use Monte Carlo Search to design mathematical expressions that are used as exploration terms for Monte Carlo Tree Search algorithms. The optimized Monte Carlo Tree Search algorithms are PUCT and SHUSS. We automatically design the PUCT and the SHUSS root exploration terms. For small search budgets of 32 evaluations the discovered root exploration terms make both algorithms competitive with usual PUCT.
- Abstract(参考訳): モンテカルロ木探索とモンテカルロ探索は多くの組合せ問題に対して良い結果が得られる。
本稿ではモンテカルロ探索を用いてモンテカルロ木探索アルゴリズムの探索語として用いられる数式を設計する。
最適化されたモンテカルロ木探索アルゴリズムはPUCTとSHUSSである。
PUCTとSHUSSのルート探索用語を自動設計する。
32の評価の小さな探索予算に対して、発見されたルート探索用語は、両方のアルゴリズムを通常のPUCTと競合させる。
関連論文リスト
- Monte-Carlo Tree Search for Multi-Agent Pathfinding: Preliminary Results [60.4817465598352]
マルチエージェントパスフィンディングに適したモンテカルロ木探索(MCTS)のオリジナル版を紹介する。
具体的には,エージェントの目標達成行動を支援するために,個別の経路を用いる。
また,木探索手順の分岐係数を低減するために,専用の分解手法を用いる。
論文 参考訳(メタデータ) (2023-07-25T12:33:53Z) - Continuous Monte Carlo Graph Search [61.11769232283621]
連続モンテカルログラフサーチ(Continuous Monte Carlo Graph Search, CMCGS)は、モンテカルログラフサーチ(MCTS)のオンラインプランニングへの拡張である。
CMCGSは、計画中、複数の州で同じ行動方針を共有することで高いパフォーマンスが得られるという洞察を生かしている。
並列化によってスケールアップすることができ、学習力学モデルによる連続制御においてクロスエントロピー法(CEM)よりも優れている。
論文 参考訳(メタデータ) (2022-10-04T07:34:06Z) - Efficient Non-Parametric Optimizer Search for Diverse Tasks [93.64739408827604]
興味のあるタスクを直接検索できる,スケーラブルで汎用的なフレームワークを初めて提示する。
基礎となる数学表現の自然木構造に着想を得て、空間を超木に再配置する。
我々は,モンテカルロ法を木探索に適用し,レジェクションサンプリングと等価形状検出を備える。
論文 参考訳(メタデータ) (2022-09-27T17:51:31Z) - CrossBeam: Learning to Search in Bottom-Up Program Synthesis [51.37514793318815]
ボトムアップ合成のためのハンズオン検索ポリシーを学習するためのニューラルネットワークのトレーニングを提案する。
私たちのアプローチは、CrossBeamと呼ばれ、ニューラルモデルを使用して、以前に探索されたプログラムを新しいプログラムに組み合わせる方法を選択します。
我々はCrossBeamが効率的に検索することを学び、最先端技術と比較してプログラム空間のより小さな部分を探索する。
論文 参考訳(メタデータ) (2022-03-20T04:41:05Z) - Batch Monte Carlo Tree Search [9.114710429587479]
この性質に基づいて,バッチ推論を用いたモンテカルロ木探索アルゴリズムを提案する。
転置テーブルは推論の結果を含むが、検索ツリーはモンテカルロツリー検索の統計情報を含む。
また、検索を改善する複数のアルゴリズムを分析することも提案している:$mu$ fpu、仮想平均、反復、第2の移動は続く。
論文 参考訳(メタデータ) (2021-04-09T09:54:21Z) - Prioritized Architecture Sampling with Monto-Carlo Tree Search [54.72096546595955]
ワンショットニューラルアーキテクチャサーチ(NAS)法は,検索空間全体を1つのネットワークとして考えることにより,検索コストを大幅に削減する。
本稿では,モンテカルロ木(MCT)をモデルとした探索空間を用いたモンテカルロ木探索(MCTS)に基づくサンプリング戦略について紹介する。
公平な比較のために、CIFAR-10で評価されたマクロ検索空間、すなわちNAS-Bench-MacroのオープンソースNASベンチマークを構築する。
論文 参考訳(メタデータ) (2021-03-22T15:09:29Z) - Monte-Carlo Graph Search for AlphaZero [15.567057178736402]
探索木を有向非巡回グラフに一般化する,新しい改良されたalphazero探索アルゴリズムを提案する。
評価では、チェスとクレイジーハウスでCrazyAraエンジンを使用して、これらの変更がAlphaZeroに大きな改善をもたらすことを示す。
論文 参考訳(メタデータ) (2020-12-20T22:51:38Z) - Monte-Carlo Tree Search as Regularized Policy Optimization [47.541849128047865]
我々は,AlphaZeroの探索アルゴリズムが,特定の正規化ポリシ最適化問題の解の近似であることを示す。
我々は、このポリシー最適化問題の正確な解法を用いて、AlphaZeroの変種を提案し、複数の領域において元のアルゴリズムを確実に上回ることを示す。
論文 参考訳(メタデータ) (2020-07-24T13:01:34Z) - Single-Agent Optimization Through Policy Iteration Using Monte-Carlo
Tree Search [8.22379888383833]
モンテカルロ・ツリー・サーチ(MCTS)と深部強化学習の組み合わせは,2プレイヤー完全情報ゲームにおける最先端の手法である。
本稿では,MCTS の変種を利用した探索アルゴリズムについて述べる。1) 潜在的に有界な報酬を持つゲームに対する新たなアクション値正規化機構,2) 効果的な探索並列化を可能にする仮想損失関数の定義,3) 世代ごとのセルフプレイによって訓練されたポリシーネットワークについて述べる。
論文 参考訳(メタデータ) (2020-05-22T18:02:36Z) - Competing in a Complex Hidden Role Game with Information Set Monte Carlo
Tree Search [0.0]
Information Set Monte Carlo Tree Search (ISMCTS) のアルゴリズムは、不完全な情報ゲームにおいてモンテカルロ法を用いて以前のアルゴリズムより優れている。
本論文は,従来の隠蔽ロール機構とカードデッキのランダム性を組み合わせたソーシャル推論ボードゲームであるシークレットヒトラーに適用する。
論文 参考訳(メタデータ) (2020-05-14T17:21:10Z) - Monte Carlo Game Solver [4.38602607138044]
オンラインでプレイアウトポリシーを学習し、Monte Carlo Tree Searchを利用する。
モンテカルロ木の学習ポリシーと情報は、ゲームソルバの移動を順序付けするために使用される。
論文 参考訳(メタデータ) (2020-01-15T00:20:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。