Fugu-MT 論文翻訳(概要): Parallelization of Monte Carlo Tree Search in Continuous Domains

論文の概要: Parallelization of Monte Carlo Tree Search in Continuous Domains

arxiv url: http://arxiv.org/abs/2003.13741v1
Date: Mon, 30 Mar 2020 18:43:59 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-18 06:23:43.188287
Title: Parallelization of Monte Carlo Tree Search in Continuous Domains
Title（参考訳）: 連続領域におけるモンテカルロ木探索の並列化
Authors: Karl Kurzer, Christoph H\"ortnagl, J. Marius Z\"ollner
Abstract要約: Monte Carlo Tree Search (MCTS)は、Goやチェス、Atariといったドメインの課題を解決できることが証明されている。私たちの仕事は既存の並列化戦略に基づいており、それらを継続的ドメインに拡張しています。
参考スコア（独自算出の注目度）: 2.658812114255374
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Monte Carlo Tree Search (MCTS) has proven to be capable of solving challenging tasks in domains such as Go, chess and Atari. Previous research has developed parallel versions of MCTS, exploiting today's multiprocessing architectures. These studies focused on versions of MCTS for the discrete case. Our work builds upon existing parallelization strategies and extends them to continuous domains. In particular, leaf parallelization and root parallelization are studied and two final selection strategies that are required to handle continuous states in root parallelization are proposed. The evaluation of the resulting parallelized continuous MCTS is conducted using a challenging cooperative multi-agent system trajectory planning task in the domain of automated vehicles.
Abstract（参考訳）: Monte Carlo Tree Search (MCTS)は、Goやチェス、Atariといったドメインの課題を解決できることが証明されている。これまでの研究はMCTSの並列バージョンを開発し、今日のマルチプロセスアーキテクチャを活用している。これらの研究は離散の場合のmctsのバージョンに焦点を当てた。私たちの仕事は既存の並列化戦略に基づいて構築され、それらを連続的なドメインに拡張します。特に, 葉の並列化と根の並列化について検討し, 根の並列化における連続状態の処理に必要な2つの最終選択戦略を提案する。自動走行車の領域における協調型多エージェントシステム軌道計画課題を用いて, 並列化連続MCTSの評価を行った。

関連論文リスト

Hogwild! Inference: Parallel LLM Generation via Concurrent Attention [28.52740266774425]
大規模言語モデル(LLM)は、高度な推論、長文コンテンツ生成、ツールの使用を通じて、ますます複雑なタスクに取り組む。推論: 同じLLMの複数のインスタンスが同じアテンションキャッシュと並行して実行される並列LLM推論エンジン。 Hogwild!推論はRotary Position Embeddings(RoPE)を利用して、並列ハードウェアの利用率を改善しながら再計算を回避する。
論文参考訳（メタデータ） (2025-04-08T17:59:41Z)
Parallel Approaches to Accelerate Bayesian Decision Trees [1.9728521995447947]
本稿では,MCMCにおける並列性を利用した2つの手法を提案する。第一に、MCMCを別の数値ベイズ的アプローチで置き換える。第2に、データのパーティショニングについて検討する。
論文参考訳（メタデータ） (2023-01-22T09:56:26Z)
SimCS: Simulation for Domain Incremental Online Continual Segmentation [60.18777113752866]
既存の継続学習アプローチは、主にクラス増分設定における画像分類に焦点を当てている。シミュレーションデータを用いて連続学習を規則化するパラメータフリー手法であるSimCSを提案する。
論文参考訳（メタデータ） (2022-11-29T14:17:33Z)
Continuous Monte Carlo Graph Search [61.11769232283621]
連続モンテカルログラフサーチ(Continuous Monte Carlo Graph Search, CMCGS)は、モンテカルログラフサーチ(MCTS)のオンラインプランニングへの拡張である。 CMCGSは、計画中、複数の州で同じ行動方針を共有することで高いパフォーマンスが得られるという洞察を生かしている。並列化によってスケールアップすることができ、学習力学モデルによる連続制御においてクロスエントロピー法(CEM)よりも優れている。
論文参考訳（メタデータ） (2022-10-04T07:34:06Z)
Parallel Training of GRU Networks with a Multi-Grid Solver for Long Sequences [1.9798034349981162]
本稿では,GRU(Gated Recurrent Unit)ネットワークのための並列学習手法を提案する。 MGRITはシーケンスを複数の短いサブシーケンスに分割し、異なるプロセッサ上のサブシーケンスを並列に訓練する。 HMDB51データセットにおいて、各ビデオが画像シーケンスである実験結果から、新しい並列トレーニングスキームがシリアルアプローチよりも最大6.5$times$スピードアップを達成することを示した。
論文参考訳（メタデータ） (2022-03-07T11:32:44Z)
Parallel Attention Network with Sequence Matching for Video Grounding [56.649826885121264]
ビデオのグラウンドティングは、意味的に言語クエリに対応する時間モーメントを検索することを目的としている。この課題を解決するために、シーケンスマッチング(SeqPAN)を備えた並列アテンションネットワークを提案します。
論文参考訳（メタデータ） (2021-05-18T12:43:20Z)
Parallel Training of Deep Networks with Local Updates [84.30918922367442]
ローカル並列性(Local Parallelism)は、グローバルバックプロパゲーションを切り捨てられたレイヤワイズバックプロパゲーションに置き換えることで、ディープネットワーク内の個々のレイヤのトレーニングを並列化するフレームワークである。我々は、様々なアーキテクチャセットにわたるビジョンと言語領域の両方で結果を示し、局所的並列性は特に高コンピュートなシステムにおいて有効であることを見出した。
論文参考訳（メタデータ） (2020-12-07T16:38:45Z)
Learning Robust State Abstractions for Hidden-Parameter Block MDPs [55.31018404591743]
我々は、ブロックMDPにインスパイアされた堅牢な状態抽象化を実現するために、HiP-MDP設定からの共通構造の概念を活用する。マルチタスク強化学習 (MTRL) とメタ強化学習 (Meta-RL) の両方のための新しいフレームワークのインスタンス化を導出する。
論文参考訳（メタデータ） (2020-07-14T17:25:27Z)
Auto-MAP: A DQN Framework for Exploring Distributed Execution Plans for DNN Workloads [11.646744408920764]
Auto-MAPはワークロードの分散実行計画を探索するフレームワークである。ディープラーニングモデルのIRレベルの強化学習を通じて、高速な並列化戦略を自動的に発見することができる。評価の結果,Auto-MAPは複数のNLPおよび畳み込みモデルにおいて,より優れたスループットを実現しつつ,最適解を2時間以内に見つけることができることがわかった。
論文参考訳（メタデータ） (2020-07-08T12:38:03Z)
On Effective Parallelization of Monte Carlo Tree Search [51.15940034629022]
モンテカルロ木探索(MCTS)は、探索木を構築するためにかなりの数のロールアウトを必要とするため、計算コストがかかる。効果的な並列MCTSアルゴリズムを設計する方法は、体系的に研究されておらず、まだよく分かっていない。我々は,より効率的な並列MCTSアルゴリズムの設計に,提案する必要条件をどのように適用できるかを実証する。
論文参考訳（メタデータ） (2020-06-15T21:36:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。