論文の概要: Actor-Critic Methods using Physics-Informed Neural Networks: Control of
a 1D PDE Model for Fluid-Cooled Battery Packs
- arxiv url: http://arxiv.org/abs/2305.10952v1
- Date: Thu, 18 May 2023 13:21:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-19 15:05:27.714924
- Title: Actor-Critic Methods using Physics-Informed Neural Networks: Control of
a 1D PDE Model for Fluid-Cooled Battery Packs
- Title(参考訳): 物理インフォームドニューラルネットワークを用いたアクタ・クリティカル法:流体冷却型電池パックの1次元PDEモデルの制御
- Authors: Amartya Mukherjee, Jun Liu
- Abstract要約: 本稿では,冷却液を用いた電池パックの温度制御のためのアクタ・クリティカルなアルゴリズムを提案する。
実験の結果、HJB方程式を用いて価値ネットワークを更新し、PPOと同一のポリシーネットワークを更新するハイブリッド政治手法が、このPDEシステムの制御において最良の結果をもたらすことが示された。
- 参考スコア(独自算出の注目度): 5.137144629366217
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper proposes an actor-critic algorithm for controlling the temperature
of a battery pack using a cooling fluid. This is modeled by a coupled 1D
partial differential equation (PDE) with a controlled advection term that
determines the speed of the cooling fluid. The Hamilton-Jacobi-Bellman (HJB)
equation is a PDE that evaluates the optimality of the value function and
determines an optimal controller. We propose an algorithm that treats the value
network as a Physics-Informed Neural Network (PINN) to solve for the
continuous-time HJB equation rather than a discrete-time Bellman optimality
equation, and we derive an optimal controller for the environment that we
exploit to achieve optimal control. Our experiments show that a hybrid-policy
method that updates the value network using the HJB equation and updates the
policy network identically to PPO achieves the best results in the control of
this PDE system.
- Abstract(参考訳): 本稿では,冷却液を用いた電池パックの温度制御のためのアクタ・クリティカルアルゴリズムを提案する。
これは、冷却流体の速度を決定する制御された対流項を持つ1次元偏微分方程式(PDE)によってモデル化される。
Hamilton-Jacobi-Bellman (HJB) 方程式は、値関数の最適性を評価し、最適コントローラを決定するPDEである。
本稿では,離散時間ベルマン最適度方程式ではなく,連続時間hjb方程式を解くために,値ネットワークを物理に変形したニューラルネットワーク(pinn)として扱うアルゴリズムを提案する。
実験により,HJB方程式を用いて値ネットワークを更新し,PPOと同一のポリシーネットワークを更新するハイブリッド政治手法が,PDEシステムの制御において最良となることを示す。
関連論文リスト
- Adaptive control of reaction-diffusion PDEs via neural operator-approximated gain kernels [3.3044728148521623]
PDEバックステッピングにおけるゲインカーネルのニューラル演算子近似は、リアルタイムでコントローラを実装するための実行可能な方法として現れている。
本稿では,ハイパーボリックPDEの適応制御からベンチマークパラボリックPDEの適応制御まで,ニューラル演算子手法を拡張した。
パラメータ適応のリアプノフ設計のためのプラント状態のグローバルな安定性と制御を証明した。
論文 参考訳(メタデータ) (2024-07-01T19:24:36Z) - End-to-End Mesh Optimization of a Hybrid Deep Learning Black-Box PDE Solver [24.437884270729903]
最近の研究では、ディープラーニングを利用して、粗いメッシュ上のPDEソルバによって得られる解を補正するPDE補正フレームワークが提案されている。
このようなPDE補正モデルのエンドツーエンドトレーニングでは、PDEソルバは反復的な数値過程を通じて自動微分をサポートする必要がある。
本研究では,ブラックボックスPDEソルバと流体流予測のためのディープラーニングモデルを用いたハイブリッドモデルのエンドツーエンドトレーニングの実現可能性について検討する。
論文 参考訳(メタデータ) (2024-04-17T21:49:45Z) - Adaptive Neural-Operator Backstepping Control of a Benchmark Hyperbolic
PDE [3.3044728148521623]
適応型PDE制御におけるNOsの適用に関する最初の結果を示し, 再循環を伴うベンチマーク1次元双曲型PDEを提案する。
また,安定性を示す数値シミュレーションを行い,最大3桁のスピードアップを観測する。
論文 参考訳(メタデータ) (2024-01-15T17:52:15Z) - An Optimization-based Deep Equilibrium Model for Hyperspectral Image
Deconvolution with Convergence Guarantees [71.57324258813675]
本稿では,ハイパースペクトル画像のデコンボリューション問題に対処する新しい手法を提案する。
新しい最適化問題を定式化し、学習可能な正規化器をニューラルネットワークの形で活用する。
導出した反復解法は、Deep Equilibriumフレームワーク内の不動点計算問題として表現される。
論文 参考訳(メタデータ) (2023-06-10T08:25:16Z) - Monte Carlo Neural PDE Solver for Learning PDEs via Probabilistic Representation [59.45669299295436]
教師なしニューラルソルバのトレーニングのためのモンテカルロPDEソルバを提案する。
我々は、マクロ現象をランダム粒子のアンサンブルとみなすPDEの確率的表現を用いる。
対流拡散, アレン・カーン, ナヴィエ・ストークス方程式に関する実験により, 精度と効率が著しく向上した。
論文 参考訳(メタデータ) (2023-02-10T08:05:19Z) - Neural Basis Functions for Accelerating Solutions to High Mach Euler
Equations [63.8376359764052]
ニューラルネットワークを用いた偏微分方程式(PDE)の解法を提案する。
ニューラルネットワークの集合を縮小順序 Proper Orthogonal Decomposition (POD) に回帰する。
これらのネットワークは、所定のPDEのパラメータを取り込み、PDEに還元順序近似を計算する分岐ネットワークと組み合わせて使用される。
論文 参考訳(メタデータ) (2022-08-02T18:27:13Z) - Machine Learning For Elliptic PDEs: Fast Rate Generalization Bound,
Neural Scaling Law and Minimax Optimality [11.508011337440646]
楕円偏微分方程式(PDE)をランダムサンプルから解くための深層学習手法の統計的限界について検討する。
この問題を単純化するために、ディリクレ境界条件がゼロのハイパーキューブ上のシュル・オーディンガー方程式(英語版)という楕円型PDEのプロトタイプに焦点をあてる。
両手法の上限値と下限値を確立し,この問題に対して同時に開発された上限値を改善する。
論文 参考訳(メタデータ) (2021-10-13T17:26:31Z) - Continuous-Time Fitted Value Iteration for Robust Policies [93.25997466553929]
ハミルトン・ヤコビ・ベルマン方程式の解法は、制御、ロボティクス、経済学を含む多くの領域において重要である。
連続適合値反復(cFVI)とロバスト適合値反復(rFVI)を提案する。
これらのアルゴリズムは、多くの連続制御問題の非線形制御-アフィンダイナミクスと分離可能な状態とアクション報酬を利用する。
論文 参考訳(メタデータ) (2021-10-05T11:33:37Z) - Robust Value Iteration for Continuous Control Tasks [99.00362538261972]
シミュレーションから物理システムへ制御ポリシを転送する場合、そのポリシは、動作の変動に対して堅牢でなければならない。
本稿では、動的プログラミングを用いて、コンパクトな状態領域上での最適値関数を計算するRobust Fitted Value Iterationを提案する。
より深い強化学習アルゴリズムや非ロバストなアルゴリズムと比較して、ロバストな値の方が頑健であることを示す。
論文 参考訳(メタデータ) (2021-05-25T19:48:35Z) - Direct Optimal Control Approach to Laser-Driven Quantum Particle
Dynamics [77.34726150561087]
間接制御理論に対する頑健で柔軟な代替手段として, 直接最適制御を提案する。
この方法は、バイスタブルポテンシャルにおけるレーザー駆動のウェーブパレットダイナミクスの場合に説明される。
論文 参考訳(メタデータ) (2020-10-08T07:59:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。