論文の概要: Practical Massively Parallel Monte-Carlo Tree Search Applied to
Molecular Design
- arxiv url: http://arxiv.org/abs/2006.10504v3
- Date: Tue, 6 Apr 2021 06:33:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-19 14:08:34.268459
- Title: Practical Massively Parallel Monte-Carlo Tree Search Applied to
Molecular Design
- Title(参考訳): 分子設計に応用した大規模並列モンテカルロ木探索
- Authors: Xiufeng Yang and Tanuj Kr Aasawat and Kazuki Yoshizoe
- Abstract要約: 我々は,1000の作業規模で効率的に動作する並列モンテカルロ木探索法(MP-MCTS)を提案し,分子設計に適用する。
MP-MCTSは大規模に検索品質を維持し,256CPUコア上でわずか10分間MP-MCTSを実行することで,42時間動作した非並列MCTSと類似のスコアを持つ候補分子を得た。
- 参考スコア(独自算出の注目度): 7.992550355579791
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: It is common practice to use large computational resources to train neural
networks, as is known from many examples, such as reinforcement learning
applications. However, while massively parallel computing is often used for
training models, it is rarely used for searching solutions for combinatorial
optimization problems. In this paper, we propose a novel massively parallel
Monte-Carlo Tree Search (MP-MCTS) algorithm that works efficiently for 1,000
worker scale, and apply it to molecular design. This is the first work that
applies distributed MCTS to a real-world and non-game problem. Existing work on
large-scale parallel MCTS show efficient scalability in terms of the number of
rollouts up to 100 workers, but suffer from the degradation in the quality of
the solutions. MP-MCTS maintains the search quality at larger scale, and by
running MP-MCTS on 256 CPU cores for only 10 minutes, we obtained candidate
molecules having similar score to non-parallel MCTS running for 42 hours.
Moreover, our results based on parallel MCTS (combined with a simple RNN model)
significantly outperforms existing state-of-the-art work. Our method is generic
and is expected to speed up other applications of MCTS.
- Abstract(参考訳): 強化学習アプリケーションなど、多くの例で知られているように、大規模な計算資源をニューラルネットワークのトレーニングに使用するのが一般的である。
しかしながら、超並列コンピューティングはトレーニングモデルによく用いられるが、組合せ最適化問題の解を探すために使われることは稀である。
本論文では,1,000人規模の作業者に対して効率的に動作する超並列モンテカルロ木探索(mp-mcts)アルゴリズムを提案し,分子設計に適用する。
これは分散mctを実世界および非ゲーム問題に適用する最初の仕事である。
大規模並列mctにおける既存の作業は、100人までのロールアウト数で効率的なスケーラビリティを示すが、ソリューションの品質の低下に苦しむ。
MP-MCTSは大規模に検索品質を維持し,256CPUコア上でわずか10分間MP-MCTSを実行することで,42時間動作した非並列MCTSと類似のスコアを持つ候補分子を得た。
さらに, 並列MCTS(単純なRNNモデルと組み合わせた)に基づく実験では, 既存の最先端の作業よりも優れていた。
本手法は汎用的であり,MCTSの他の応用を高速化することが期待される。
関連論文リスト
- DiPaCo: Distributed Path Composition [31.686642863608558]
本稿では,機械学習モデルのためのモジュールアーキテクチャとトレーニングアプローチを提案する。
トレーニング中、DiPaCoは共有モジュールのセットを通じてパスで配布する。
推論時には、モデル圧縮を必要とせずに、各入力に対して1つのパスだけを実行する必要がある。
論文 参考訳(メタデータ) (2024-03-15T18:26:51Z) - Distributed Inference and Fine-tuning of Large Language Models Over The
Internet [91.00270820533272]
大規模言語モデル(LLM)は、多くのNLPタスクで有用であり、サイズが向上する。
これらのモデルはハイエンドのハードウェアを必要とするため、ほとんどの研究者にはアクセスできない。
本研究では,システムスループットの最大化のためにデバイスを自動的に割り当てるフォールトトレラント推論アルゴリズムとロードバランシングプロトコルを開発する。
論文 参考訳(メタデータ) (2023-12-13T18:52:49Z) - MARLIN: Soft Actor-Critic based Reinforcement Learning for Congestion
Control in Real Networks [63.24965775030673]
そこで本研究では,汎用的な渋滞制御(CC)アルゴリズムを設計するための新しい強化学習(RL)手法を提案する。
我々の解であるMARLINは、Soft Actor-Criticアルゴリズムを用いてエントロピーとリターンの両方を最大化する。
我々は,MARLINを実ネットワーク上で訓練し,実ミスマッチを克服した。
論文 参考訳(メタデータ) (2023-02-02T18:27:20Z) - Partitioning Distributed Compute Jobs with Reinforcement Learning and
Graph Neural Networks [58.720142291102135]
大規模な機械学習モデルは、幅広い分野に進歩をもたらしている。
これらのモデルの多くは、単一のマシンでトレーニングするには大きすぎるため、複数のデバイスに分散する必要がある。
スループットやブロッキングレートといったユーザクリティカルな指標に対して,並列化の最大化が準最適であることを示す。
論文 参考訳(メタデータ) (2023-01-31T17:41:07Z) - SWARM Parallelism: Training Large Models Can Be Surprisingly
Communication-Efficient [69.61083127540776]
ディープラーニングアプリケーションは、数十億のパラメータを持つ大きなモデルを使用することの恩恵を受ける。
これらのモデルのトレーニングは、特殊なHPCクラスタを必要とするため、非常に高価である。
安価な"プリエンプティブル"インスタンスを使用するか、あるいは複数のリージョンから既存のリソースをプールする。
論文 参考訳(メタデータ) (2023-01-27T18:55:19Z) - Single MCMC Chain Parallelisation on Decision Trees [0.9137554315375919]
本稿では,平均的なラップトップやパソコン上でMCMC決定ツリーチェーンを並列化する手法を提案する。
実験の結果,シリアルと並列実装が統計的に同一である場合,実行時間を18倍に向上できることがわかった。
論文 参考訳(メタデータ) (2022-07-26T07:07:51Z) - A Transferable Approach for Partitioning Machine Learning Models on
Multi-Chip-Modules [8.224904698490626]
マルチチップモジュール(MCM)は、機械学習アクセラレータの設計と製造コストを削減する。
本稿では, 深い強化学習フレームワークを用いて, 潜在的に無効な候補分割を出力し, 制約解法によって補正する戦略を提案する。
実ハードウェア上でのプロダクションスケールモデルBERTの評価により,RLポリシを用いて生成したパーティショニングのスループットが6.11%,5.85%向上したことが明らかとなった。
論文 参考訳(メタデータ) (2021-12-07T23:40:28Z) - On Effective Parallelization of Monte Carlo Tree Search [51.15940034629022]
モンテカルロ木探索(MCTS)は、探索木を構築するためにかなりの数のロールアウトを必要とするため、計算コストがかかる。
効果的な並列MCTSアルゴリズムを設計する方法は、体系的に研究されておらず、まだよく分かっていない。
我々は,より効率的な並列MCTSアルゴリズムの設計に,提案する必要条件をどのように適用できるかを実証する。
論文 参考訳(メタデータ) (2020-06-15T21:36:00Z) - MPLP++: Fast, Parallel Dual Block-Coordinate Ascent for Dense Graphical
Models [96.1052289276254]
この研究は、人気のあるDual Block-Coordinate Ascent原則に基づく新しいMAP-solverを導入している。
驚いたことに、性能の低い解法に小さな変更を加えることで、既存の解法を大きなマージンで大幅に上回る新しい解法MPLP++を導出します。
論文 参考訳(メタデータ) (2020-04-16T16:20:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。