論文の概要: Load constrained wind farm flow control through multi-objective multi-agent reinforcement learning
- arxiv url: http://arxiv.org/abs/2604.22795v1
- Date: Mon, 13 Apr 2026 12:39:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:14.188827
- Title: Load constrained wind farm flow control through multi-objective multi-agent reinforcement learning
- Title(参考訳): 多目的マルチエージェント強化学習による負荷拘束型風力発電フロー制御
- Authors: Teodor Åstrand, Marcus Binder Nilsen, Iasonas Tsaklis, Tuhfe Göçmen, Pierre-Elouan Réthoré, Nikolay Dimitrov,
- Abstract要約: 本研究では、負荷拘束型風力発電制御(WFFC)のためのマルチエージェント強化学習(MARL)フレームワークを提案する。
このフレームワークは、DYNAMIKSフローソルバとDynamic Wake Meandering (DWM)モデルを用いてWindGym環境内に実装され、非定常ウェイク物理を捉える。
その結果,MARL エージェントは,高DEL 制御戦略から積極的に撤退しながら,電力利得を優先する協調政策を学習できた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study presents a multi-agent reinforcement learning (MARL) framework for load-constrained wind farm flow control (WFFC). While wake steering can enhance total wind farm power, it often introduces increased structural loads on downstream turbines. To address this, we integrate an Independent Soft Actor-Critic (I-SAC) architecture with a data-driven, local inflow sector-averaged surrogate model to provide real-time estimates of Damage Equivalent Loads (DELs). By incorporating these estimates into a shaped reward function, turbine-specific agents are trained to maximize power production while adhering to specific load-increase thresholds ($Δ_{max}$) of 10%, 20%, and 30% relative to a baseline controller. The framework is implemented within the WindGym environment using the DYNAMIKS flow solver with Dynamic Wake Meandering (DWM) model to capture non-stationary wake physics. Results indicate that the MARL agents successfully learn collaborative policies that prioritise power gain while actively retreating from high-DEL control strategies.
- Abstract(参考訳): 本研究では,負荷拘束型風力発電制御(WFFC)のためのマルチエージェント強化学習(MARL)フレームワークを提案する。
ウェイクステアリングは総風力発電力を高めることができるが、下流のタービンに構造負荷を増大させることがしばしばある。
そこで本研究では,インディペンデント・ソフト・アクタ・クリティカル(I-SAC)アーキテクチャとデータ駆動型局所流入セクター平均サロゲートモデルを統合し,損傷等価負荷(DEL)のリアルタイム推定を行う。
これらの推定値を形状の報酬関数に組み込むことで、タービン固有のエージェントは、ベースラインコントローラに対して10%、20%、30%の負荷増加閾値(Δ_{max}$)を保ちながら、発電を最大化するように訓練される。
このフレームワークは、DYNAMIKSフローソルバとDynamic Wake Meandering (DWM)モデルを用いてWindGym環境内に実装され、非定常ウェイク物理を捉える。
その結果,MARL エージェントは,高DEL 制御戦略から積極的に撤退しながら,電力利得を優先する協調政策を学習できた。
関連論文リスト
- Hierarchical RL-MPC Control for Dynamic Wake Steering in Wind Farms [0.0]
本稿では,RLエージェントがタービンを直接制御するのではなく,MPCコントローラの補償状態推定を学習する,強化学習とモデル予測制御を組み合わせた階層的枠組みを提案する。
直接RL制御と比較して、ハイブリッドアーキテクチャはトレーニング中に優れた安全性特性を維持しつつ、より安定した制御動作で同等のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-04-13T12:57:38Z) - DFPO: Scaling Value Modeling via Distributional Flow towards Robust and Generalizable LLM Post-Training [94.568675548967]
実環境における訓練強化学習(RL)システムは、ノイズの多い監視とドメイン外の一般化が不十分なため、依然として困難である。
近年の分布RL法は、複数の量子点を持つ値をモデル化することでロバスト性を向上させるが、スカラーとして各量子点を独立に学習する。
DFPOは、時間ステップをまたいだ連続フローとして値をモデル化する、ロバストな分散RLフレームワークである。
論文 参考訳(メタデータ) (2026-02-05T17:07:42Z) - RISER: Orchestrating Latent Reasoning Skills for Adaptive Activation Steering [62.63376387138257]
本稿では,アクティベーション空間における大規模言語モデル(LLM)推論を適応的に制御するプラグイン・アンド・プレイ介入フレームワークを提案する。
RISERは再利用可能な推論ベクトルのライブラリを構築し、軽量ルータを使用して各入力に対して動的に構成する。
ルーターは、タスクレベルの報酬の下で強化学習を通じて最適化され、緊急かつ構成的な方法で潜在する認知的プリミティブを活性化する。
論文 参考訳(メタデータ) (2026-01-14T08:04:33Z) - Physics-informed Neural-operator Predictive Control for Drag Reduction in Turbulent Flows [109.99020160824553]
乱流のモデリングと制御のための効率的な深部強化学習フレームワークを提案する。
予測制御(PC)のためのモデルベースRLであり、乱流制御のためのポリシとオブザーバモデルの両方を共同で学習する。
その結果, PINO-PCは, バルク速度レイノルズ数15,000で39.0%の抗力低下を達成し, 従来の流体制御法を32%以上上回った。
論文 参考訳(メタデータ) (2025-10-03T00:18:26Z) - Reinforcement Learning Increases Wind Farm Power Production by Enabling Closed-Loop Collaborative Control [0.0]
従来の風力発電制御は、個々の出力を最大化するために、それぞれのタービンを独立して運用する。
風力発電のエネルギー生産を 大幅に増加させます
高忠実度大渦シミュレーションと直接統合された第1強化学習制御装置
その結果、風力発電最適化への変換アプローチとして、動的フローレスポンシブ制御が確立された。
論文 参考訳(メタデータ) (2025-06-25T15:53:12Z) - How to craft a deep reinforcement learning policy for wind farm flow control [3.9614347845645383]
タービン間のウェイク効果は、風力発電所全体のエネルギー生産を著しく減少させる。
既存の機械学習アプローチは、準静的な風条件や小さな風力発電に限られている。
本研究は、ウェイクステアリングポリシーを開発するための、新しい深層強化学習手法を提案する。
論文 参考訳(メタデータ) (2025-06-06T16:07:05Z) - Function Approximation for Reinforcement Learning Controller for Energy from Spread Waves [69.9104427437916]
マルチジェネレータ・ウェーブ・エナジー・コンバータ(WEC)は、スプレッド・ウェーブと呼ばれる異なる方向から来る複数の同時波を処理しなければならない。
これらの複雑な装置は、エネルギー捕獲効率、維持を制限する構造的ストレスの低減、高波に対する積極的な保護という複数の目的を持つコントローラを必要とする。
本稿では,システム力学のシーケンシャルな性質をモデル化する上で,ポリシーと批判ネットワークの異なる機能近似について検討する。
論文 参考訳(メタデータ) (2024-04-17T02:04:10Z) - Modeling Wind Turbine Performance and Wake Interactions with Machine
Learning [0.0]
SCADAとオンショアウィンドファームで収集された気象データに基づいて異なる機械学習モデル(ML)を訓練する。
データ品質制御と事前処理のためのML手法を調査対象のデータセットに適用する。
風力タービンのパワーキャプチャーをモデル化するために,ハイブリッドモデルが高精度であることがわかった。
論文 参考訳(メタデータ) (2022-12-02T23:07:05Z) - Skip Training for Multi-Agent Reinforcement Learning Controller for
Industrial Wave Energy Converters [94.84709449845352]
近年のウェーブ・エナジー・コンバータ(WEC)は、発電を最大化するために複数の脚と発電機を備えている。
従来のコントローラは複雑な波のパターンを捕捉する制限を示しており、コントローラはエネルギー捕獲を効率的に最大化する必要がある。
本稿では,従来のスプリングダンパよりも優れたマルチエージェント強化学習コントローラ(MARL)を提案する。
論文 参考訳(メタデータ) (2022-09-13T00:20:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。