論文の概要: Latent feedback control of distributed systems in multiple scenarios through deep learning-based reduced order models
- arxiv url: http://arxiv.org/abs/2412.09942v1
- Date: Fri, 13 Dec 2024 08:04:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-16 15:01:27.499323
- Title: Latent feedback control of distributed systems in multiple scenarios through deep learning-based reduced order models
- Title(参考訳): 深層学習に基づく還元順序モデルによる複数シナリオにおける分散システムの潜在フィードバック制御
- Authors: Matteo Tomasetto, Francesco Braghin, Andrea Manzoni,
- Abstract要約: 高次元分散システムの継続的な監視とリアルタイム制御は、望まれる物理的な振る舞いを保証するためにアプリケーションに不可欠である。
完全順序モデルに依存する従来のフィードバック制御設計は、制御計算の遅延のため、これらの要求を満たすことができない。
非線形非侵襲的深層学習に基づく還元順序モデル(DL-ROM)により強化されたリアルタイム閉ループ制御戦略を提案する。
- 参考スコア(独自算出の注目度): 3.5161229331588095
- License:
- Abstract: Continuous monitoring and real-time control of high-dimensional distributed systems are often crucial in applications to ensure a desired physical behavior, without degrading stability and system performances. Traditional feedback control design that relies on full-order models, such as high-dimensional state-space representations or partial differential equations, fails to meet these requirements due to the delay in the control computation, which requires multiple expensive simulations of the physical system. The computational bottleneck is even more severe when considering parametrized systems, as new strategies have to be determined for every new scenario. To address these challenges, we propose a real-time closed-loop control strategy enhanced by nonlinear non-intrusive Deep Learning-based Reduced Order Models (DL-ROMs). Specifically, in the offline phase, (i) full-order state-control pairs are generated for different scenarios through the adjoint method, (ii) the essential features relevant for control design are extracted from the snapshots through a combination of Proper Orthogonal Decomposition (POD) and deep autoencoders, and (iii) the low-dimensional policy bridging latent control and state spaces is approximated with a feedforward neural network. After data generation and neural networks training, the optimal control actions are retrieved in real-time for any observed state and scenario. In addition, the dynamics may be approximated through a cheap surrogate model in order to close the loop at the latent level, thus continuously controlling the system in real-time even when full-order state measurements are missing. The effectiveness of the proposed method, in terms of computational speed, accuracy, and robustness against noisy data, is finally assessed on two different high-dimensional optimal transport problems, one of which also involving an underlying fluid flow.
- Abstract(参考訳): 高次元分散システムの継続的監視とリアルタイム制御は、安定性とシステム性能を低下させることなく、望まれる物理的振る舞いを保証するアプリケーションにおいて不可欠であることが多い。
高次元状態空間表現や偏微分方程式のような高次モデルに依存する従来のフィードバック制御設計は、物理系の複数の高価なシミュレーションを必要とする制御計算の遅延のため、これらの要求を満たすことができない。
計算ボトルネックは、新しいシナリオごとに新しい戦略を決定する必要があるため、パラメータ化されたシステムを考える際にさらに深刻である。
これらの課題に対処するために,非線形非侵襲的深層学習に基づく還元順序モデル(DL-ROM)により強化されたリアルタイム閉ループ制御戦略を提案する。
特にオフラインの段階では
(i) 随伴法により, 異なるシナリオに対して全順序状態制御ペアが生成される。
二 プロパー直交分解(POD)とディープオートエンコーダを組み合わせたスナップショットから、制御設計に係わる重要な特徴を抽出する。
三 潜伏制御及び状態空間をブリッジする低次元ポリシーをフィードフォワードニューラルネットワークにより近似する。
データ生成とニューラルネットワークトレーニングの後に、観測された状態とシナリオに対して、最適な制御アクションをリアルタイムで検索する。
さらに、ループを潜伏レベルで閉じるため、より安価なサロゲートモデルによりダイナミクスを近似することができ、フルオーダー状態の測定が欠如している場合でも、システムをリアルタイムに制御することができる。
提案手法の有効性は, 計算速度, 精度, ノイズデータに対する頑健性の観点から, 2 つの異なる高次元最適輸送問題に対して評価された。
関連論文リスト
- Real-time optimal control of high-dimensional parametrized systems by deep learning-based reduced order models [3.5161229331588095]
複数のシナリオにおけるパラメタライズされたPDEの観点で記述されたシステムの迅速な制御のための,非侵襲的なディープラーニングベースリダクションオーダーモデリング(DL-ROM)手法を提案する。
i)データ生成、(ii)次元削減、および(iii)オフラインフェーズでのニューラルネットワークトレーニングの後、任意のシナリオにおいて、最適制御戦略をオンラインフェーズで迅速に検索することができる。
論文 参考訳(メタデータ) (2024-09-09T15:20:24Z) - Two-Stage ML-Guided Decision Rules for Sequential Decision Making under Uncertainty [55.06411438416805]
SDMU (Sequential Decision Making Under Uncertainty) は、エネルギー、金融、サプライチェーンといった多くの領域において、ユビキタスである。
いくつかのSDMUは、自然にマルチステージ問題(MSP)としてモデル化されているが、結果として得られる最適化は、計算の観点からは明らかに困難である。
本稿では,2段階の一般決定規則(TS-GDR)を導入し,線形関数を超えて政策空間を一般化する手法を提案する。
TS-GDRの有効性は、TS-LDR(Two-Stage Deep Decision Rules)と呼ばれるディープリカレントニューラルネットワークを用いたインスタンス化によって実証される。
論文 参考訳(メタデータ) (2024-05-23T18:19:47Z) - Transfer learning-based physics-informed convolutional neural network
for simulating flow in porous media with time-varying controls [0.0]
多孔質媒質中の二相流をシミュレートする物理インフォームド畳み込みニューラルネットワークを提案する。
有限体積スキームは流れの方程式を識別するために用いられる。
N ノイマン境界条件は半離散方程式にシームレスに組み込まれる。
論文 参考訳(メタデータ) (2023-10-10T05:29:33Z) - Formal Controller Synthesis for Markov Jump Linear Systems with
Uncertain Dynamics [64.72260320446158]
マルコフジャンプ線形系に対する制御器の合成法を提案する。
本手法は,MJLSの離散(モードジャンピング)と連続(確率線形)の両方の挙動を捉える有限状態抽象化に基づいている。
本手法を複数の現実的なベンチマーク問題,特に温度制御と航空機の配送問題に適用する。
論文 参考訳(メタデータ) (2022-12-01T17:36:30Z) - Controlling quantum many-body systems using reduced-order modelling [0.0]
本稿では,多体量子システムにおける制御問題のクラスを解くための効率的な手法を提案する。
もともとのサブシステムの「デジタルツイン」と見なされる、そのような縮小順序モデルの力学のシミュレーションは、はるかに効率的である。
この結果は、多体システムの研究、非自明な準粒子特性の探索、および量子コンピューティングデバイスの開発管理ツールに直接応用される。
論文 参考訳(メタデータ) (2022-11-01T13:58:44Z) - Neural ODEs as Feedback Policies for Nonlinear Optimal Control [1.8514606155611764]
ニューラルネットワークをパラメータ化した微分方程式として連続時間力学をモデル化するために、ニューラル常微分方程式(ニューラルODE)を用いる。
本稿では,一般非線形最適制御問題の解法としてニューラル・オードとして提案するニューラル・コントロール・ポリシーを提案する。
論文 参考訳(メタデータ) (2022-10-20T13:19:26Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - Finite-time System Identification and Adaptive Control in Autoregressive
Exogenous Systems [79.67879934935661]
未知のARXシステムのシステム識別と適応制御の問題について検討する。
我々は,オープンループとクローズループの両方のデータ収集の下で,ARXシステムに対する有限時間学習保証を提供する。
論文 参考訳(メタデータ) (2021-08-26T18:00:00Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Single-step deep reinforcement learning for open-loop control of laminar
and turbulent flows [0.0]
本研究は,流体力学系の最適化と制御を支援するための深部強化学習(DRL)技術の能力を評価する。
原型ポリシー最適化(PPO)アルゴリズムの新たな"退化"バージョンを組み合わせることで、学習エピソード当たり1回だけシステムを最適化するニューラルネットワークをトレーニングする。
論文 参考訳(メタデータ) (2020-06-04T16:11:26Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。