論文の概要: Reinforcement learning of rare diffusive dynamics
- arxiv url: http://arxiv.org/abs/2105.04321v1
- Date: Mon, 10 May 2021 13:00:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-11 14:22:41.113240
- Title: Reinforcement learning of rare diffusive dynamics
- Title(参考訳): 希少拡散力学の強化学習
- Authors: Avishek Das, Dominic C. Rose, Juan P. Garrahan, David T. Limmer
- Abstract要約: 本稿では,強化学習を用いて希少分子動力学軌道を直接探究する方法を提案する。
我々は,有限時間における構成空間の領域間の遷移を条件とした軌道と,時間積分量の経時的変動を示す軌道を考える。
いずれの場合も、強化学習技術を用いて、条件付き軌道アンサンブルと駆動型軌道とのクルバック・リーバの発散を最小限に抑える付加力の最適化を行う。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a method to probe rare molecular dynamics trajectories directly
using reinforcement learning. We consider trajectories that are conditioned to
transition between regions of configuration space in finite time, like those
relevant in the study of reactive events, as well as trajectories exhibiting
rare fluctuations of time-integrated quantities in the long time limit, like
those relevant in the calculation of large deviation functions. In both cases,
reinforcement learning techniques are used to optimize an added force that
minimizes the Kullback-Leibler divergence between the conditioned trajectory
ensemble and a driven one. Under the optimized added force, the system evolves
the rare fluctuation as a typical one, affording a variational estimate of its
likelihood in the original trajectory ensemble. Low variance gradients
employing value functions are proposed to increase the convergence of the
optimal force. The method we develop employing these gradients leads to
efficient and accurate estimates of both the optimal force and the likelihood
of the rare event for a variety of model systems.
- Abstract(参考訳): 本稿では,レアな分子動力学軌道を直接探索する手法を提案する。
本研究では, 有限時間における構成空間の領域間の遷移を条件として, 反応性事象の研究や, 時間積分量の経時的変動を示す軌道, 大偏差関数の計算等について考察する。
いずれの場合も、強化学習技術を用いて、条件付き軌道アンサンブルと駆動型軌道とのクルバック・リーバの発散を最小限に抑える付加力の最適化を行う。
最適化された付加力の下で、システムは典型的に稀なゆらぎを進化させ、元の軌道アンサンブルの確率を変動的に推定する。
値関数を用いた低分散勾配は、最適力の収束性を高めるために提案される。
これらの勾配を用いた手法は, 種々のモデルシステムにおいて, 最適力と希少事象の可能性の両方を効率的かつ高精度に推定できる。
関連論文リスト
- Hallmarks of Optimization Trajectories in Neural Networks: Directional Exploration and Redundancy [75.15685966213832]
最適化トラジェクトリのリッチな方向構造をポイントワイズパラメータで解析する。
トレーニング中のスカラーバッチノルムパラメータは,ネットワーク全体のトレーニング性能と一致していることを示す。
論文 参考訳(メタデータ) (2024-03-12T07:32:47Z) - Adaptive Federated Learning Over the Air [108.62635460744109]
オーバー・ザ・エア・モデル・トレーニングの枠組みの中で,適応勾配法,特にAdaGradとAdamの連合バージョンを提案する。
解析の結果,AdaGrad に基づくトレーニングアルゴリズムは $mathcalO(ln(T) / T 1 - frac1alpha の速度で定常点に収束することがわかった。
論文 参考訳(メタデータ) (2024-03-11T09:10:37Z) - DySLIM: Dynamics Stable Learning by Invariant Measure for Chaotic Systems [22.62539147446799]
散逸的なカオスシステムからダイナミクスを学ぶことは、その固有の不安定性のため、非常に難しい。
不変測度と力学の学習を対象とする新しいフレームワークを提案する。
スケーラブルな正規化項で分布をターゲットとすることで、このアプローチをより複雑なシステムに拡張できることを期待する。
論文 参考訳(メタデータ) (2024-02-06T23:26:12Z) - Stochastic Latent Transformer: Efficient Modelling of Stochastically
Forced Zonal Jets [0.0]
本稿では,SLT(Stochastic Latent Transformer)という新しい確率論的学習手法を提案する。
SLTは、様々な統合期間にわたってシステムダイナミクスを正確に再現し、定量的診断を通じて検証する。
水平平均流をエミュレートする際の5次のマグニチュードスピードアップを実現する。
論文 参考訳(メタデータ) (2023-10-25T16:17:00Z) - Loss Dynamics of Temporal Difference Reinforcement Learning [36.772501199987076]
線形関数近似器を用いた値関数の時間差学習のためのケースラーニング曲線について検討した。
本研究では,学習力学と台地が特徴構造,学習率,割引係数,報酬関数にどのように依存するかを検討する。
論文 参考訳(メタデータ) (2023-07-10T18:17:50Z) - Training neural operators to preserve invariant measures of chaotic attractors [10.61157131995679]
対照的な学習フレームワークは、最適輸送手法と同様に、力学の統計的性質を保存可能であることを示す。
本手法は,カオストラクタの不変な測定値を保存するために実験的に示された。
論文 参考訳(メタデータ) (2023-06-01T22:56:30Z) - Guaranteed Conservation of Momentum for Learning Particle-based Fluid
Dynamics [96.9177297872723]
本稿では,学習物理シミュレーションにおける線形運動量を保証する新しい手法を提案する。
我々は、強い制約で運動量の保存を強制し、反対称的な連続的な畳み込み層を通して実現する。
提案手法により,学習シミュレータの物理的精度を大幅に向上させることができる。
論文 参考訳(メタデータ) (2022-10-12T09:12:59Z) - Manifold Interpolating Optimal-Transport Flows for Trajectory Inference [64.94020639760026]
最適輸送流(MIOFlow)を補間するマニフォールド補間法を提案する。
MIOFlowは、散発的なタイムポイントで撮影された静的スナップショットサンプルから、連続的な人口動態を学習する。
本手法は, 胚体分化および急性骨髄性白血病の治療から得られたscRNA-seqデータとともに, 分岐とマージによるシミュレーションデータについて検討した。
論文 参考訳(メタデータ) (2022-06-29T22:19:03Z) - Convex Analysis of the Mean Field Langevin Dynamics [49.66486092259375]
平均場ランゲヴィン力学の収束速度解析について述べる。
ダイナミックスに付随する$p_q$により、凸最適化において古典的な結果と平行な収束理論を開発できる。
論文 参考訳(メタデータ) (2022-01-25T17:13:56Z) - Training Generative Adversarial Networks by Solving Ordinary
Differential Equations [54.23691425062034]
GANトレーニングによって引き起こされる連続時間ダイナミクスについて検討する。
この観点から、GANのトレーニングにおける不安定性は積分誤差から生じると仮定する。
本研究では,有名なODEソルバ(Runge-Kutta など)がトレーニングを安定化できるかどうかを実験的に検証する。
論文 参考訳(メタデータ) (2020-10-28T15:23:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。