論文の概要: Stabilising viscous extensional flows using Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2110.14677v1
- Date: Wed, 27 Oct 2021 18:01:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-29 16:56:05.420931
- Title: Stabilising viscous extensional flows using Reinforcement Learning
- Title(参考訳): 強化学習による粘性拡大流れの安定化
- Authors: Marco Vona and Eric Lauga
- Abstract要約: 強化学習を用いて4ロールミルフローの安定化アルゴリズムを考案する。
確率密度関数から速度調整を引き出す確率論的アプローチをとる。
私たちのアルゴリズムは、ドロップを正確に制御し、必要に応じて停止点に近づけることができます。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The four-roll mill, wherein four identical cylinders undergo rotation of
identical magnitude but alternate signs, was originally proposed by GI Taylor
to create local extensional flows and study their ability to deform small
liquid drops. Since an extensional flow has an unstable eigendirection, a drop
located at the flow stagnation point will have a tendency to escape. This
unstable dynamics can however be stabilised using, e.g., a modulation of the
rotation rates of the cylinders. Here we use Reinforcement Learning, a branch
of Machine Learning devoted to the optimal selection of actions based on
cumulative rewards, in order to devise a stabilisation algorithm for the
four-roll mill flow. The flow is modelled as the linear superposition of four
two-dimensional rotlets and the drop is treated as a rigid spherical particle
smaller than all other length scales in the problem. Unlike previous attempts
to devise control, we take a probabilistic approach whereby speed adjustments
are drawn from a probability density function whose shape is improved over time
via a form of gradient ascent know as Actor-Critic method. With enough
training, our algorithm is able to precisely control the drop and keep it close
to the stagnation point for as long as needed. We explore the impact of the
physical and learning parameters on the effectiveness of the control and
demonstrate the robustness of the algorithm against thermal noise. We finally
show that Reinforcement Learning can provide a control algorithm effective for
all initial positions and that can be adapted to limit the magnitude of the
flow extension near the position of the drop.
- Abstract(参考訳): 4つの同一のシリンダーが同じ大きさで交互に回転する四ロールミルは、元来ギ・テイラーによって局所的な延長流れを作り、小さな液滴を変形させる能力を研究するために提案された。
伸縮流は不安定な固有方向を持つので、流れの停滞点に位置する滴は脱出する傾向にある。
この不安定な力学は、例えばシリンダーの回転率の変調を用いて安定化することができる。
ここでは、4ロールミルフローの安定化アルゴリズムを考案するために、累積報酬に基づくアクションの最適選択に特化した機械学習の分野である強化学習を用いる。
流れは4つの2次元ローターの線形重ね合わせとしてモデル化され、液滴は他の全ての長さスケールよりも小さい固い球状粒子として扱われる。
制御を考案しようとする従来の試みとは違って,Actor-Critic法と呼ばれる勾配上昇の形で時間とともに形状が改善された確率密度関数から,速度調整を導出する確率論的アプローチをとる。
十分なトレーニングを積んで、我々のアルゴリズムはドロップを正確に制御し、必要に応じて停滞点に近づき続けることができる。
本研究では,物理・学習パラメータが制御の有効性に与える影響について検討し,熱雑音に対するアルゴリズムの堅牢性を示す。
最後に,強化学習はすべての初期位置に対して効果的な制御アルゴリズムを提供し,落下位置近傍の流量拡大の大きさを制限できることを示す。
関連論文リスト
- Upstream flow geometries can be uniquely learnt from single-point turbulence signatures [0.21847754147782888]
時系列データから導出した不変量のベクトルに基づいてランダムな森林多クラス分類器モデルを訓練する。
興味深いことに、アルゴリズムはオリフィス形状を100%精度と100%精度で識別することができた。
論文 参考訳(メタデータ) (2024-12-14T00:55:34Z) - Rotated Runtime Smooth: Training-Free Activation Smoother for accurate INT4 inference [54.2589824716527]
大規模言語モデルは、その大規模なため、相当な計算とメモリ移動コストを発生させる。
既存のアプローチでは、外れ値と通常の値を2つの行列に分けたり、アクティベーションからウェイトに移行したりしています。
Smooth と Rotation 操作からなる量子化のためのプラグ・アンド・プレイ・アクティベーション・スムーザである Rotated Smooth (RRS) を提案する。
提案手法は,LLaMAおよびQwenファミリーにおける最先端の手法より優れており,IF4推論におけるWikiText-2の難易度は57.33から6.66に向上している。
論文 参考訳(メタデータ) (2024-09-30T14:59:22Z) - Convergence rates of stochastic gradient method with independent sequences of step-size and momentum weight [1.4141453107129398]
我々はPolyakの加速度を用いたプログラミングを用いて収束速度を解析する。
収束速度は、ステップサイズおよび運動量重みにおいて指数的に記述できることを示す。
論文 参考訳(メタデータ) (2024-07-31T04:25:39Z) - Adaptive Federated Learning Over the Air [108.62635460744109]
オーバー・ザ・エア・モデル・トレーニングの枠組みの中で,適応勾配法,特にAdaGradとAdamの連合バージョンを提案する。
解析の結果,AdaGrad に基づくトレーニングアルゴリズムは $mathcalO(ln(T) / T 1 - frac1alpha の速度で定常点に収束することがわかった。
論文 参考訳(メタデータ) (2024-03-11T09:10:37Z) - How to Control Hydrodynamic Force on Fluidic Pinball via Deep
Reinforcement Learning [3.1635451288803638]
流体ピンボールの流体力を制御するためのDRLに基づくリアルタイムフィードバック戦略を提案する。
報酬関数を適切に設計し、歴史的観測を符号化することにより、DRLに基づく制御が合理的かつ有効な制御決定を行うことを示した。
これらの結果の1つは、力追跡プロセスの意思決定と物理的メカニズムに基づいて光を放つことができる機械学習モデルによって分析された。
論文 参考訳(メタデータ) (2023-04-23T03:39:50Z) - D4FT: A Deep Learning Approach to Kohn-Sham Density Functional Theory [79.50644650795012]
コーンシャム密度汎関数論(KS-DFT)を解くための深層学習手法を提案する。
このような手法はSCF法と同じ表現性を持つが,計算複雑性は低下する。
さらに,本手法により,より複雑なニューラルベース波動関数の探索が可能となった。
論文 参考訳(メタデータ) (2023-03-01T10:38:10Z) - Deep Learning Approximation of Diffeomorphisms via Linear-Control
Systems [91.3755431537592]
我々は、制御に線形に依存する$dot x = sum_i=1lF_i(x)u_i$という形の制御系を考える。
対応するフローを用いて、コンパクトな点のアンサンブル上の微分同相写像の作用を近似する。
論文 参考訳(メタデータ) (2021-10-24T08:57:46Z) - Error-Correcting Neural Networks for Semi-Lagrangian Advection in the
Level-Set Method [0.0]
本稿では,画像超解像技術とスカラートランスポートを融合した機械学習フレームワークを提案する。
我々は,インターフェースの粗いメッシュ進化における数値粘度を最小化するために,オンザフライデータ駆動補正を計算できるかどうかを検討する。
論文 参考訳(メタデータ) (2021-10-22T06:36:15Z) - Fast Gravitational Approach for Rigid Point Set Registration with
Ordinary Differential Equations [79.71184760864507]
本稿では,FGA(Fast Gravitational Approach)と呼ばれる厳密な点集合アライメントのための物理に基づく新しい手法を紹介する。
FGAでは、ソースとターゲットの点集合は、シミュレーションされた重力場内を移動しながら、世界規模で多重リンクされた方法で相互作用する質量を持つ剛体粒子群として解釈される。
従来のアライメント手法では,新しいメソッドクラスには特徴がないことを示す。
論文 参考訳(メタデータ) (2020-09-28T15:05:39Z) - Gradient Flows for Regularized Stochastic Control Problems [7.801972633035922]
本研究では,相対エントロピーによって罰せられる目的を持つ確率測度となる行動空間の制御問題について検討する。
測定値制御プロセスのための勾配流を構築するための適切な距離空間を同定する。
論文 参考訳(メタデータ) (2020-06-10T17:07:36Z) - Robust Reinforcement Learning with Wasserstein Constraint [49.86490922809473]
最適なロバストなポリシーの存在を示し、摂動に対する感度分析を行い、新しいロバストな学習アルゴリズムを設計する。
提案アルゴリズムの有効性はCart-Pole環境で検証する。
論文 参考訳(メタデータ) (2020-06-01T13:48:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。