論文の概要: Physics-Guided Actor-Critic Reinforcement Learning for Swimming in Turbulence
- arxiv url: http://arxiv.org/abs/2406.10242v2
- Date: Fri, 26 Jul 2024 17:54:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-29 17:42:34.309402
- Title: Physics-Guided Actor-Critic Reinforcement Learning for Swimming in Turbulence
- Title(参考訳): 物理誘導型アクター・クリティカル強化学習による乱流スイミング
- Authors: Christopher Koh, Laurent Pagnier, Michael Chertkov,
- Abstract要約: 我々は、PIRL戦略と、所定の制御(PC)および標準物理に依存しない強化学習戦略を開発・比較する。
我々のPIRLスキームはActor-Physicistと呼ばれ、ニューラルネットワークパラメータ化Criticを解析的に導出した物理関数に置き換えるActor-Criticアルゴリズムの適応である。
- 参考スコア(独自算出の注目度): 0.402817967099747
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Turbulent diffusion causes particles placed in proximity to separate. We investigate the required swimming efforts to maintain a particle close to its passively advected counterpart. We explore optimally balancing these efforts with the intended goal by developing and comparing a novel Physics-Informed Reinforcement Learning (PIRL) strategy with prescribed control (PC) and standard physics-agnostic Reinforcement Learning strategies. Our PIRL scheme, coined the Actor-Physicist, is an adaptation of the Actor-Critic algorithm in which the Neural Network parameterized Critic is replaced with an analytically derived physical heuristic function (the physicist). This strategy is then compared with an analytically computed optimal PC policy derived from a stochastic optimal control formulation and standard physics-agnostic Actor-Critic type algorithms.
- Abstract(参考訳): 乱流拡散は粒子を分離に近接させる。
受動的に対流する粒子に近い粒子を維持するために必要な水泳の努力について検討した。
本研究では,新しい物理情報強化学習(PIRL)戦略と所定の制御(PC)戦略と標準物理情報強化学習戦略とを開発・比較することにより,これらの取り組みを意図した目標と最適にバランスさせることを検討する。
我々のPIRLスキームはActor-Physicistと呼ばれ、Actor-Criticアルゴリズムの適応であり、ニューラルネットワークのパラメータ化Criticを解析的に導出された物理的ヒューリスティック関数(物理学者)に置き換える。
この戦略は、確率的最適制御の定式化と標準物理非依存のアクター・クリティカル型アルゴリズムから導かれる解析計算された最適PCポリシーと比較される。
関連論文リスト
- Physics-guided weak-form discovery of reduced-order models for trapped ultracold hydrodynamics [0.0]
極性分子の高衝突・超低温・非退化ガスの緩和について検討した。
気体は流体ガスと流体ガスが結合し、一階の流体力学が崩壊する。
我々は,これらの観測値に対して,大幅に改良された低次モデルを提案する。
論文 参考訳(メタデータ) (2024-06-11T17:50:04Z) - A Physics-Informed Low-Shot Learning For sEMG-Based Estimation of Muscle
Force and Joint Kinematics [4.878073267556235]
表面筋電図(sEMG)による筋力と関節キネマティクス推定はリアルタイム生体力学的解析に不可欠である。
ディープニューラルネットワーク(DNN)の最近の進歩は、完全に自動化され再現可能な方法で生体力学解析を改善する可能性を示している。
本稿では,筋力と関節キネマティクスのsEMGに基づく新しい物理インフォームドローショット学習法を提案する。
論文 参考訳(メタデータ) (2023-07-08T23:01:12Z) - Statistical mechanics of continual learning: variational principle and
mean-field potential [1.559929646151698]
重み付き単層および多層ニューラルネットワークにおける連続学習に着目する。
ニューラルネットワークをフィールド空間でトレーニングする,変分ベイズ学習環境を提案する。
重みの不確実性は自然に組み込まれ、タスク間のシナプス資源を調節する。
提案するフレームワークは、弾力的な重みの強化、重みの不確実性学習、神経科学によるメタ可塑性にも結びついている。
論文 参考訳(メタデータ) (2022-12-06T09:32:45Z) - Guaranteed Conservation of Momentum for Learning Particle-based Fluid
Dynamics [96.9177297872723]
本稿では,学習物理シミュレーションにおける線形運動量を保証する新しい手法を提案する。
我々は、強い制約で運動量の保存を強制し、反対称的な連続的な畳み込み層を通して実現する。
提案手法により,学習シミュレータの物理的精度を大幅に向上させることができる。
論文 参考訳(メタデータ) (2022-10-12T09:12:59Z) - Improving robustness of jet tagging algorithms with adversarial training [56.79800815519762]
本研究では,フレーバータグ付けアルゴリズムの脆弱性について,敵攻撃による検証を行った。
シミュレーション攻撃の影響を緩和する対人訓練戦略を提案する。
論文 参考訳(メタデータ) (2022-03-25T19:57:19Z) - NeuroFluid: Fluid Dynamics Grounding with Particle-Driven Neural
Radiance Fields [65.07940731309856]
深層学習は流体のような複雑な粒子系の物理力学をモデル化する大きな可能性を示している。
本稿では,流体力学グラウンドリング(fluid dynamics grounding)として知られる,部分的に観測可能なシナリオについて考察する。
我々はNeuroFluidという2段階の異なるネットワークを提案する。
初期形状、粘度、密度が異なる流体の基礎物理学を合理的に推定することが示されている。
論文 参考訳(メタデータ) (2022-03-03T15:13:29Z) - Deep Active Learning by Leveraging Training Dynamics [57.95155565319465]
本稿では,学習力学を最大化するためにサンプルを選択する理論駆動型深層能動学習法(Dynamical)を提案する。
動的学習は、他のベースラインを一貫して上回るだけでなく、大規模なディープラーニングモデルでもうまくスケール可能であることを示す。
論文 参考訳(メタデータ) (2021-10-16T16:51:05Z) - Physics-Integrated Variational Autoencoders for Robust and Interpretable
Generative Modeling [86.9726984929758]
我々は、不完全物理モデルの深部生成モデルへの統合に焦点を当てる。
本稿では,潜在空間の一部が物理によって基底づけられたVAEアーキテクチャを提案する。
合成および実世界のデータセットの集合に対して生成的性能改善を示す。
論文 参考訳(メタデータ) (2021-02-25T20:28:52Z) - A physics-informed operator regression framework for extracting
data-driven continuum models [0.0]
高忠実度分子シミュレーションデータから連続体モデルを発見するためのフレームワークを提案する。
提案手法は、モーダル空間における制御物理のニューラルネットワークパラメタライゼーションを適用する。
局所・非局所拡散過程や単相・多相流など,様々な物理分野におけるフレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2020-09-25T01:13:51Z) - An Ode to an ODE [78.97367880223254]
我々は、O(d) 群上の行列フローに応じて主フローの時間依存パラメータが進化する ODEtoODE と呼ばれるニューラルODE アルゴリズムの新しいパラダイムを提案する。
この2つの流れのネストされたシステムは、訓練の安定性と有効性を提供し、勾配の消滅・爆発問題を確実に解決する。
論文 参考訳(メタデータ) (2020-06-19T22:05:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。