論文の概要: Hierarchical RL-MPC Control for Dynamic Wake Steering in Wind Farms
- arxiv url: http://arxiv.org/abs/2604.22797v1
- Date: Mon, 13 Apr 2026 12:57:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:14.189861
- Title: Hierarchical RL-MPC Control for Dynamic Wake Steering in Wind Farms
- Title(参考訳): 風力発電における動的ウェイクステアリングのための階層的RL-MPC制御
- Authors: Marcus Binder Nilsen, Teodor Olof Benedict Åstrand, Tuhfe Göçmen, Pierre-Elouan Réthoré,
- Abstract要約: 本稿では,RLエージェントがタービンを直接制御するのではなく,MPCコントローラの補償状態推定を学習する,強化学習とモデル予測制御を組み合わせた階層的枠組みを提案する。
直接RL制御と比較して、ハイブリッドアーキテクチャはトレーニング中に優れた安全性特性を維持しつつ、より安定した制御動作で同等のパフォーマンスを実現している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Wind farm wake steering optimization is challenging due to complex flow physics and changing conditions. This paper presents a hierarchical framework that combines reinforcement learning with model predictive control, where an RL agent learns compensatory state estimates for an MPC controller, rather than directly controlling turbines. Evaluated on a three-turbine case, the approach achieves a 23\% power gain over the baseline control and surpasses the idealized MPC with perfect state knowledge. Compared to direct RL control, the hybrid architecture maintains superior safety characteristics during training while achieving comparable performance with more stable control actions.
- Abstract(参考訳): 複雑な流れの物理と変化条件のため、風力発電のウェイクステアリング最適化は困難である。
本稿では,RLエージェントがタービンを直接制御するのではなく,MPCコントローラの補償状態推定を学習する,強化学習とモデル予測制御を組み合わせた階層的枠組みを提案する。
提案手法は, ベースライン制御よりも23倍のパワーゲインを達成し, 完全状態知識を持つ理想化されたMPCを超越する。
直接RL制御と比較して、ハイブリッドアーキテクチャはトレーニング中に優れた安全性特性を維持しつつ、より安定した制御動作で同等のパフォーマンスを実現している。
関連論文リスト
- Beyond Conservative Automated Driving in Multi-Agent Scenarios via Coupled Model Predictive Control and Deep Reinforcement Learning [7.804905867413516]
モデル予測制御(MPC)は、最適化による構造化制約処理を提供する。
深層強化学習(Deep Reinforcement Learning, RL)は、経験から適応的な行動を学ぶが、安全保証に苦慮することが多い。
マルチエージェントシナリオにおけるナビゲーション性能を改善するための統合MPC-RLフレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-15T13:58:38Z) - Physics-informed Neural-operator Predictive Control for Drag Reduction in Turbulent Flows [109.99020160824553]
乱流のモデリングと制御のための効率的な深部強化学習フレームワークを提案する。
予測制御(PC)のためのモデルベースRLであり、乱流制御のためのポリシとオブザーバモデルの両方を共同で学習する。
その結果, PINO-PCは, バルク速度レイノルズ数15,000で39.0%の抗力低下を達成し, 従来の流体制御法を32%以上上回った。
論文 参考訳(メタデータ) (2025-10-03T00:18:26Z) - Improving a Proportional Integral Controller with Reinforcement Learning on a Throttle Valve Benchmark [2.8322124733515666]
本稿では,非対称制御器を用いた非線形スロットル弁の学習制御手法を提案する。
我々は近年の強化学習とガイドの進歩を活用し、弁との付加的な相互作用から学習することで閉ループ動作を改善する。
すべての試験ケースにおいて、結果のエージェントは従来のRLエージェントよりもサンプリング効率が良く、PIコントローラよりも優れています。
論文 参考訳(メタデータ) (2024-02-21T09:40:26Z) - A Reinforcement Learning Approach for Robust Supervisory Control of UAVs
Under Disturbances [1.8799681615947088]
無人航空機(UAV)の監視強化学習制御手法を提案する。
我々は,既存の組込み制御と交差する監視制御アーキテクチャを定式化し,悪風の形での環境障害に対する堅牢性を示す。
論文 参考訳(メタデータ) (2023-05-21T19:00:06Z) - Skip Training for Multi-Agent Reinforcement Learning Controller for
Industrial Wave Energy Converters [94.84709449845352]
近年のウェーブ・エナジー・コンバータ(WEC)は、発電を最大化するために複数の脚と発電機を備えている。
従来のコントローラは複雑な波のパターンを捕捉する制限を示しており、コントローラはエネルギー捕獲を効率的に最大化する必要がある。
本稿では,従来のスプリングダンパよりも優れたマルチエージェント強化学習コントローラ(MARL)を提案する。
論文 参考訳(メタデータ) (2022-09-13T00:20:31Z) - Comparative analysis of machine learning methods for active flow control [60.53767050487434]
遺伝的プログラミング(GP)と強化学習(RL)はフロー制御において人気を集めている。
この研究は2つの比較分析を行い、地球規模の最適化手法に対して最も代表的なアルゴリズムのいくつかをベンチマークする。
論文 参考訳(メタデータ) (2022-02-23T18:11:19Z) - Policy Search for Model Predictive Control with Application to Agile
Drone Flight [56.24908013905407]
MPCのためのポリシ・フォー・モデル・予測制御フレームワークを提案する。
具体的には、パラメータ化コントローラとしてMPCを定式化し、パラメータ化の難しい決定変数を高レベルポリシーとして表現する。
シミュレーションと実環境の両方において,我々の制御器が堅牢かつリアルタイムに制御性能を発揮することを示す実験を行った。
論文 参考訳(メタデータ) (2021-12-07T17:39:24Z) - Scalable Voltage Control using Structure-Driven Hierarchical Deep
Reinforcement Learning [0.0]
本稿では,新しい階層型深層強化学習(drl)による電力系統の電圧制御設計を提案する。
本研究では,電力系統の領域分割構造を利用して,大規模グリッドモデルに適用可能な階層型drl設計を提案する。
地域別分散型RLエージェントを訓練し、各エリアの低レベルポリシーを算出し、低レベルポリシーの更新を使用して低レベルエージェントが行う制御アクションを効率的に調整する高レベルDRLエージェントを同時トレーニングします。
論文 参考訳(メタデータ) (2021-01-29T21:30:59Z) - Learning a Contact-Adaptive Controller for Robust, Efficient Legged
Locomotion [95.1825179206694]
四足歩行ロボットのためのロバストコントローラを合成するフレームワークを提案する。
高レベルコントローラは、環境の変化に応じてプリミティブのセットを選択することを学習する。
確立された制御方法を使用してプリミティブを堅牢に実行する低レベルコントローラ。
論文 参考訳(メタデータ) (2020-09-21T16:49:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。