論文の概要: Parallelization of Monte Carlo Tree Search in Continuous Domains
- arxiv url: http://arxiv.org/abs/2003.13741v1
- Date: Mon, 30 Mar 2020 18:43:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-12-18 06:23:43.188287
- Title: Parallelization of Monte Carlo Tree Search in Continuous Domains
- Title(参考訳): 連続領域におけるモンテカルロ木探索の並列化
- Authors: Karl Kurzer, Christoph H\"ortnagl, J. Marius Z\"ollner
- Abstract要約: Monte Carlo Tree Search (MCTS)は、Goやチェス、Atariといったドメインの課題を解決できることが証明されている。
私たちの仕事は既存の並列化戦略に基づいており、それらを継続的ドメインに拡張しています。
- 参考スコア(独自算出の注目度): 2.658812114255374
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Monte Carlo Tree Search (MCTS) has proven to be capable of solving
challenging tasks in domains such as Go, chess and Atari. Previous research has
developed parallel versions of MCTS, exploiting today's multiprocessing
architectures. These studies focused on versions of MCTS for the discrete case.
Our work builds upon existing parallelization strategies and extends them to
continuous domains. In particular, leaf parallelization and root
parallelization are studied and two final selection strategies that are
required to handle continuous states in root parallelization are proposed. The
evaluation of the resulting parallelized continuous MCTS is conducted using a
challenging cooperative multi-agent system trajectory planning task in the
domain of automated vehicles.
- Abstract(参考訳): Monte Carlo Tree Search (MCTS)は、Goやチェス、Atariといったドメインの課題を解決できることが証明されている。
これまでの研究はMCTSの並列バージョンを開発し、今日のマルチプロセスアーキテクチャを活用している。
これらの研究は離散の場合のmctsのバージョンに焦点を当てた。
私たちの仕事は既存の並列化戦略に基づいて構築され、それらを連続的なドメインに拡張します。
特に, 葉の並列化と根の並列化について検討し, 根の並列化における連続状態の処理に必要な2つの最終選択戦略を提案する。
自動走行車の領域における協調型多エージェントシステム軌道計画課題を用いて, 並列化連続MCTSの評価を行った。
関連論文リスト
- PaCoRe: Learning to Scale Test-Time Compute with Parallel Coordinated Reasoning [62.55836470496192]
PaCoReは、現代の言語モデルの中心的な制限を克服するために設計されたトレーニングと推論のフレームワークである。
PaCoReは、複数のラウンドでメッセージパッシングアーキテクチャを介して調整された巨大な並列探索を通じてTTCを駆動することで、従来のシーケンシャルパラダイムから逸脱する。
大規模で結果に基づく強化学習を備えたエンドツーエンドで訓練されたモデルでは、PaCoReに必要な合成能力を習得し、コンテキスト制限を超えることなく、数百万の効果的なTTCにスケールする。
論文 参考訳(メタデータ) (2026-01-09T07:24:43Z) - Parallelized Code Generation from Simulink Models for Event-driven and Timer-driven ROS 2 Nodes [0.0]
従来の手動プログラムの並列化は、データの完全性を維持することやデッドロックのような問題を避けることなど、課題に直面している。
本稿では、これらの問題を解決するためのMBDフレームワークを提案し、ROS 2互換のSimulinkモデルをイベント駆動型とタイマ駆動型に分類し、並列化を目標とする。
論文 参考訳(メタデータ) (2025-12-29T16:59:59Z) - Parallelizing Tree Search with Twice Sequential Monte Carlo [7.863528049670872]
我々はモンテカルロ木探索 (MCTS) アルゴリズムの代替として, TSMCTS (Twice Sequential Monte Carlo Tree Search) を提案する。
TSMCTSは並列化が容易で、GPUアクセラレーションに適している。
TSMCTSは,SMCの並列化を自然にする特性を維持しつつ,逐次計算と良好にスケール可能であることを示す。
論文 参考訳(メタデータ) (2025-11-18T07:54:29Z) - ParaCook: On Time-Efficient Planning for Multi-Agent Systems [62.471032881396496]
大規模言語モデル(LLM)は、長期の現実世界のタスクを計画するための強力な推論能力を示す。
時間効率の協調計画のためのベンチマークであるParaCookを紹介する。
論文 参考訳(メタデータ) (2025-10-13T16:47:07Z) - Parallel-R1: Towards Parallel Thinking via Reinforcement Learning [65.68667585027232]
並列思考は、大規模言語モデルの推論能力を高めるための新しいアプローチである。
並列思考行動を可能にする最初の強化学習フレームワークである textbfParallel-R1 を提案する。
本フレームワークでは,並列思考のトレーニングにおいて,コールドスタート問題に明示的に対処する漸進的なカリキュラムを採用している。
論文 参考訳(メタデータ) (2025-09-09T17:59:35Z) - Reasoning by Superposition: A Theoretical Perspective on Chain of Continuous Thought [56.71873693264532]
連続CoTのD$ステップを持つ2層トランスが有向グラフ到達可能性問題を解くことができることを証明した。
我々の構成では、各連続思考ベクトルは複数の探索フロンティアを同時に符号化する重ね合わせ状態である。
論文 参考訳(メタデータ) (2025-05-18T18:36:53Z) - Hogwild! Inference: Parallel LLM Generation via Concurrent Attention [28.52740266774425]
大規模言語モデル(LLM)は、高度な推論、長文コンテンツ生成、ツールの使用を通じて、ますます複雑なタスクに取り組む。
推論: 同じLLMの複数のインスタンスが同じアテンションキャッシュと並行して実行される並列LLM推論エンジン。
Hogwild!推論はRotary Position Embeddings(RoPE)を利用して、並列ハードウェアの利用率を改善しながら再計算を回避する。
論文 参考訳(メタデータ) (2025-04-08T17:59:41Z) - Parallel Approaches to Accelerate Bayesian Decision Trees [1.9728521995447947]
本稿では,MCMCにおける並列性を利用した2つの手法を提案する。
第一に、MCMCを別の数値ベイズ的アプローチで置き換える。
第2に、データのパーティショニングについて検討する。
論文 参考訳(メタデータ) (2023-01-22T09:56:26Z) - SimCS: Simulation for Domain Incremental Online Continual Segmentation [60.18777113752866]
既存の継続学習アプローチは、主にクラス増分設定における画像分類に焦点を当てている。
シミュレーションデータを用いて連続学習を規則化するパラメータフリー手法であるSimCSを提案する。
論文 参考訳(メタデータ) (2022-11-29T14:17:33Z) - Continuous Monte Carlo Graph Search [61.11769232283621]
連続モンテカルログラフサーチ(Continuous Monte Carlo Graph Search, CMCGS)は、モンテカルログラフサーチ(MCTS)のオンラインプランニングへの拡張である。
CMCGSは、計画中、複数の州で同じ行動方針を共有することで高いパフォーマンスが得られるという洞察を生かしている。
並列化によってスケールアップすることができ、学習力学モデルによる連続制御においてクロスエントロピー法(CEM)よりも優れている。
論文 参考訳(メタデータ) (2022-10-04T07:34:06Z) - Parallel Training of GRU Networks with a Multi-Grid Solver for Long
Sequences [1.9798034349981162]
本稿では,GRU(Gated Recurrent Unit)ネットワークのための並列学習手法を提案する。
MGRITはシーケンスを複数の短いサブシーケンスに分割し、異なるプロセッサ上のサブシーケンスを並列に訓練する。
HMDB51データセットにおいて、各ビデオが画像シーケンスである実験結果から、新しい並列トレーニングスキームがシリアルアプローチよりも最大6.5$times$スピードアップを達成することを示した。
論文 参考訳(メタデータ) (2022-03-07T11:32:44Z) - Parallel Attention Network with Sequence Matching for Video Grounding [56.649826885121264]
ビデオのグラウンドティングは、意味的に言語クエリに対応する時間モーメントを検索することを目的としている。
この課題を解決するために、シーケンスマッチング(SeqPAN)を備えた並列アテンションネットワークを提案します。
論文 参考訳(メタデータ) (2021-05-18T12:43:20Z) - Parallel Training of Deep Networks with Local Updates [84.30918922367442]
ローカル並列性(Local Parallelism)は、グローバルバックプロパゲーションを切り捨てられたレイヤワイズバックプロパゲーションに置き換えることで、ディープネットワーク内の個々のレイヤのトレーニングを並列化するフレームワークである。
我々は、様々なアーキテクチャセットにわたるビジョンと言語領域の両方で結果を示し、局所的並列性は特に高コンピュートなシステムにおいて有効であることを見出した。
論文 参考訳(メタデータ) (2020-12-07T16:38:45Z) - Learning Robust State Abstractions for Hidden-Parameter Block MDPs [55.31018404591743]
我々は、ブロックMDPにインスパイアされた堅牢な状態抽象化を実現するために、HiP-MDP設定からの共通構造の概念を活用する。
マルチタスク強化学習 (MTRL) とメタ強化学習 (Meta-RL) の両方のための新しいフレームワークのインスタンス化を導出する。
論文 参考訳(メタデータ) (2020-07-14T17:25:27Z) - Auto-MAP: A DQN Framework for Exploring Distributed Execution Plans for
DNN Workloads [11.646744408920764]
Auto-MAPはワークロードの分散実行計画を探索するフレームワークである。
ディープラーニングモデルのIRレベルの強化学習を通じて、高速な並列化戦略を自動的に発見することができる。
評価の結果,Auto-MAPは複数のNLPおよび畳み込みモデルにおいて,より優れたスループットを実現しつつ,最適解を2時間以内に見つけることができることがわかった。
論文 参考訳(メタデータ) (2020-07-08T12:38:03Z) - On Effective Parallelization of Monte Carlo Tree Search [51.15940034629022]
モンテカルロ木探索(MCTS)は、探索木を構築するためにかなりの数のロールアウトを必要とするため、計算コストがかかる。
効果的な並列MCTSアルゴリズムを設計する方法は、体系的に研究されておらず、まだよく分かっていない。
我々は,より効率的な並列MCTSアルゴリズムの設計に,提案する必要条件をどのように適用できるかを実証する。
論文 参考訳(メタデータ) (2020-06-15T21:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。