Fugu-MT 論文翻訳(概要): Monte Carlo Tree Search for a single target search game on a 2-D lattice

論文の概要: Monte Carlo Tree Search for a single target search game on a 2-D lattice

arxiv url: http://arxiv.org/abs/2011.14246v1
Date: Sun, 29 Nov 2020 01:07:45 GMT
ステータス: 翻訳完了
システム内更新日: 2021-06-07 14:14:11.350025
Title: Monte Carlo Tree Search for a single target search game on a 2-D lattice
Title（参考訳）: 2次元格子上の単一のターゲット探索ゲームに対するモンテカルロ木探索
Authors: Elana Kozak and Scott Hottovy
Abstract要約: このプロジェクトは、AIプレイヤーが2次元格子内で静止目標を探索するゲームを想像する。動物捕食行動のモデルであるレヴィ飛行探索(Levi Flight Search)と比較した。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Monte Carlo Tree Search (MCTS) is a branch of stochastic modeling that utilizes decision trees for optimization, mostly applied to artificial intelligence (AI) game players. This project imagines a game in which an AI player searches for a stationary target within a 2-D lattice. We analyze its behavior with different target distributions and compare its efficiency to the Levy Flight Search, a model for animal foraging behavior. In addition to simulated data analysis we prove two theorems about the convergence of MCTS when computation constraints neglected.
Abstract（参考訳）: Monte Carlo Tree Search (MCTS) は、決定木を最適化に利用し、主に人工知能(AI)ゲームプレイヤーに適用する確率モデリングの分野である。このプロジェクトは、AIプレイヤーが2次元格子内で静止目標を探索するゲームを想像する。対象分布の異なる個体群で行動解析を行い,その効率を動物採餌行動のモデルであるlevy flight searchと比較した。シミュレーションデータ解析に加えて,計算制約を無視した場合のMCTSの収束に関する2つの定理を証明した。

関連論文リスト

Dynamic Parallel Tree Search for Efficient LLM Reasoning [102.16694475391665]
Tree of Thoughts (ToT) は大規模言語モデル(LLM)推論を強化し、分散木としての問題解決を構造化する。推論における推論経路を動的に最適化することを目的とした,新しい並列化フレームワークであるDynamic Parallel Tree Search (DPTS)を提案する。 Qwen-2.5とLlama-3のMath500とGSM8Kデータセットによる実験では、DPTSは平均で2-4倍効率が向上した。
論文参考訳（メタデータ） (2025-02-22T14:13:37Z)
A Top-down Graph-based Tool for Modeling Classical Semantic Maps: A Crosslinguistic Case Study of Supplementary Adverbs [50.982315553104975]
セマンティックマップモデル(SMM)は、言語横断的なインスタンスや形式からネットワークのような概念空間を構築する。ほとんどのSMMは、ボトムアップ手順を使用して、人間の専門家によって手動で構築される。本稿では,概念空間とSMMをトップダウンで自動生成するグラフベースの新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-12-02T12:06:41Z)
Technical Report: Enhancing LLM Reasoning with Reward-guided Tree Search [95.06503095273395]
o1のような推論アプローチは困難で、研究者はこのオープンな研究領域を前進させようとさまざまな試みを行ってきた。本稿では,報酬誘導木探索アルゴリズムを用いて,LLMの推論能力を高めるための予備的な検討を行う。
論文参考訳（メタデータ） (2024-11-18T16:15:17Z)
Online Test Synthesis From Requirements: Enhancing Reinforcement Learning with Game Theory [1.363146160329157]
リアクティブ実装の自動化として指定された機能要件からブラックボックステストケースの自動オンライン合成を検討する。提案手法はモンテカルロ木探索(モンテカルロ木探索)を応用し,予測入力を効率的に選択するための強化学習の古典的手法である。
論文参考訳（メタデータ） (2024-07-26T07:59:59Z)
LiteSearch: Efficacious Tree Search for LLM [70.29796112457662]
本研究では,動的ノード選択とノードレベルの探索予算を備えた新しいガイド付き木探索アルゴリズムを提案する。 GSM8KおよびTabMWPデータセットを用いて行った実験により,本手法はベースライン法に比べて計算コストが大幅に低いことを示した。
論文参考訳（メタデータ） (2024-06-29T05:14:04Z)
AlphaZeroES: Direct score maximization outperforms planning loss minimization [61.17702187957206]
実行時の計画では、シングルエージェントとマルチエージェントの両方の設定でエージェントのパフォーマンスが劇的に向上することが示されている。実行時に計画するアプローチのファミリは、AlphaZeroとその変種で、Monte Carlo Tree Searchと、状態値とアクション確率を予測することによって検索をガイドするニューラルネットワークを使用する。複数の環境にまたがって、エピソードスコアを直接最大化し、計画損失を最小限に抑えることを示す。
論文参考訳（メタデータ） (2024-06-12T23:00:59Z)
Monte-Carlo Tree Search for Multi-Agent Pathfinding: Preliminary Results [60.4817465598352]
マルチエージェントパスフィンディングに適したモンテカルロ木探索(MCTS)のオリジナル版を紹介する。具体的には,エージェントの目標達成行動を支援するために,個別の経路を用いる。また,木探索手順の分岐係数を低減するために,専用の分解手法を用いる。
論文参考訳（メタデータ） (2023-07-25T12:33:53Z)
Learning To Dive In Branch And Bound [95.13209326119153]
グラフニューラルネットワークを用いて特定の潜水構造を学習するためのL2Diveを提案する。我々は、変数の割り当てを予測するために生成モデルを訓練し、線形プログラムの双対性を利用して潜水決定を行う。
論文参考訳（メタデータ） (2023-01-24T12:01:45Z)
A Fast Evolutionary adaptation for MCTS in Pommerman [0.0]
本稿では,進化的モンテカルロ木探索 (FEMCTS) エージェントを提案する。同社は、Evolutionary Algorthims (EA) と Monte Carlo Tree Search (MCTS) のアイデアを借りて、Pommerman のゲームをしている。
論文参考訳（メタデータ） (2021-11-26T23:26:33Z)
Monte Carlo Tree Search: A Review of Recent Modifications and Applications [0.17205106391379024]
モンテカルロツリー検索(MCTS)は、ゲームプレイボットを設計したり、連続的な決定問題を解決するための強力なアプローチです。この方法は、探索と搾取のバランスをとるインテリジェントな木探索に依存している。しかし、この方法はより複雑なゲームでは最先端の技術となっている。
論文参考訳（メタデータ） (2021-03-08T17:44:15Z)
Learning to Stop: Dynamic Simulation Monte-Carlo Tree Search [66.34387649910046]
モンテカルロ木探索(MCTS)は、囲碁やアタリゲームなど多くの領域で最先端の結果を得た。我々は,現在の検索状況の不確かさを予測し,その結果を用いて検索をやめるべきかどうかを判断することで,この目標を達成することを提案する。
論文参考訳（メタデータ） (2020-12-14T19:49:25Z)
Learning Optimal Tree Models Under Beam Search [27.92120639502327]
既存のツリーモデルは、トレーニングテストの相違に悩まされている。我々はビームサーチとキャリブレーションの下でベイズ最適性の概念を開発する。本稿では,ビームサーチによる最適木モデル学習のための新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (2020-06-27T17:20:04Z)
Single-Agent Optimization Through Policy Iteration Using Monte-Carlo Tree Search [8.22379888383833]
モンテカルロ・ツリー・サーチ(MCTS)と深部強化学習の組み合わせは,2プレイヤー完全情報ゲームにおける最先端の手法である。本稿では,MCTS の変種を利用した探索アルゴリズムについて述べる。1) 潜在的に有界な報酬を持つゲームに対する新たなアクション値正規化機構,2) 効果的な探索並列化を可能にする仮想損失関数の定義,3) 世代ごとのセルフプレイによって訓練されたポリシーネットワークについて述べる。
論文参考訳（メタデータ） (2020-05-22T18:02:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。