論文の概要: Efficient Reservoir Management through Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2012.03822v1
- Date: Mon, 7 Dec 2020 16:13:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-16 21:06:59.074199
- Title: Efficient Reservoir Management through Deep Reinforcement Learning
- Title(参考訳): 深層強化学習による高効率貯留層管理
- Authors: Xinrun Wang, Tarun Nair, Haoyang Li, Yuh Sheng Reuben Wong, Nachiket
Kelkar, Srinivas Vaidyanathan, Rajat Nayak, Bo An, Jagdish Krishnaswamy,
Milind Tambe
- Abstract要約: 我々は,効率的なダム運転ガイドラインの計算に強化学習(RL)手法を利用する。
具体的には,実データを用いたオフラインシミュレータと,上流のインフローのための数学モデルを構築した。
実験の結果,DLM を用いたシミュレータは上流での流入動態を効率的にモデル化し,RL アルゴリズムで訓練されたダム運転ポリシーは人為的な政策よりも優れていた。
- 参考スコア(独自算出の注目度): 36.89242259597806
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dams impact downstream river dynamics through flow regulation and disruption
of upstream-downstream linkages. However, current dam operation is far from
satisfactory due to the inability to respond the complicated and uncertain
dynamics of the upstream-downstream system and various usages of the reservoir.
Even further, the unsatisfactory dam operation can cause floods in downstream
areas. Therefore, we leverage reinforcement learning (RL) methods to compute
efficient dam operation guidelines in this work. Specifically, we build offline
simulators with real data and different mathematical models for the upstream
inflow, i.e., generalized least square (GLS) and dynamic linear model (DLM),
then use the simulator to train the state-of-the-art RL algorithms, including
DDPG, TD3 and SAC. Experiments show that the simulator with DLM can efficiently
model the inflow dynamics in the upstream and the dam operation policies
trained by RL algorithms significantly outperform the human-generated policy.
- Abstract(参考訳): ダムは上流・下流連関の規制と破壊を通じて下流河川の動態に影響を及ぼす。
しかし,上流・下流系の複雑で不確定なダイナミクスや貯水池の各種利用に応答できないため,現在のダム運転は満足できない。
さらに、不満足なダムが下流部の洪水を引き起こすことがある。
そこで本研究では,RL法を利用してダムの効率的な運転ガイドラインを算出した。
具体的には,実データと上流流れの異なる数理モデル,すなわち一般化最小平方形(gls)と動的線形モデル(dlm)を用いたオフラインシミュレータを構築し,ddpg,td3,sacを含む最先端rlアルゴリズムをシミュレータを用いてトレーニングする。
実験の結果,DLM を用いたシミュレータは上流での流入動態を効率的にモデル化し,RL アルゴリズムで訓練されたダム運転ポリシーは人為的な政策よりも優れていた。
関連論文リスト
- Comparison of Generative Learning Methods for Turbulence Modeling [1.2499537119440245]
直接数値シミュレーション (DNS) や大渦シミュレーション (LES) のような高解像度の手法は一般に計算に手頃な価格ではない。
機械学習、特に生成確率モデルにおける最近の進歩は、乱流モデリングのための有望な代替手段を提供する。
本稿では, 変分オートエンコーダ(VAE), ディープ・コンバーサナル・ジェネレータ・ネットワーク(DCGAN), 拡散確率モデル(DDPM)の3つの生成モデルの適用について検討する。
論文 参考訳(メタデータ) (2024-11-25T14:20:53Z) - Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - CtRL-Sim: Reactive and Controllable Driving Agents with Offline Reinforcement Learning [38.63187494867502]
CtRL-Simは、リターン条件付きオフライン強化学習(RL)を利用して、リアクティブで制御可能なトラフィックエージェントを効率的に生成する手法である。
CtRL-Simは,エージェントの挙動を詳細に制御しながら,現実的な安全クリティカルシナリオを生成可能であることを示す。
論文 参考訳(メタデータ) (2024-03-29T02:10:19Z) - Hybrid Reinforcement Learning for Optimizing Pump Sustainability in
Real-World Water Distribution Networks [55.591662978280894]
本稿では,実世界の配水ネットワーク(WDN)のリアルタイム制御を強化するために,ポンプスケジューリング最適化問題に対処する。
我々の主な目的は、エネルギー消費と運用コストを削減しつつ、物理的な運用上の制約を遵守することである。
進化に基づくアルゴリズムや遺伝的アルゴリズムのような伝統的な最適化手法は、収束保証の欠如によってしばしば不足する。
論文 参考訳(メタデータ) (2023-10-13T21:26:16Z) - Robust Path Following on Rivers Using Bootstrapped Reinforcement
Learning [0.0]
本稿では,内陸海域における自律型表面容器(ASV)の航行制御のための深層強化学習(DRL)エージェントを開発した。
最先端のブートストラップ付きQ-ラーニングアルゴリズムと多用途のトレーニング環境ジェネレータを組み合わせることで、堅牢で正確な舵制御を実現する。
論文 参考訳(メタデータ) (2023-03-24T07:21:27Z) - Let Offline RL Flow: Training Conservative Agents in the Latent Space of
Normalizing Flows [58.762959061522736]
オフライン強化学習は、追加の環境相互作用なしに、事前に記録された、固定されたデータセット上でポリシーをトレーニングすることを目的としている。
我々は、最近、潜在行動空間における学習ポリシーを基礎として、生成モデルの構築に正規化フローの特別な形式を用いる。
提案手法が最近提案したアルゴリズムより優れていることを示すため,様々な移動タスクとナビゲーションタスクについて評価を行った。
論文 参考訳(メタデータ) (2022-11-20T21:57:10Z) - Development and Validation of an AI-Driven Model for the La Rance Tidal
Barrage: A Generalisable Case Study [2.485182034310303]
斬新なパラメトリゼーションと深層強化学習技術を用いて,ラランス潮流のAI駆動モデル表現を開発した。
実験により, 構築した干潟防波堤に対する第1次干潟域構造(TRS)モデルの有効性を検証した。
論文 参考訳(メタデータ) (2022-02-10T22:02:52Z) - A Workflow for Offline Model-Free Robotic Reinforcement Learning [117.07743713715291]
オフライン強化学習(RL)は、オンラインインタラクションを伴わずに、事前の経験のみを活用することによって、学習制御ポリシを可能にする。
本研究では,教師付き学習問題に対して,比較的よく理解されたオフラインRLと類似した実践的ワークフローを開発する。
オンラインチューニングを伴わない効果的なポリシー作成におけるこのワークフローの有効性を実証する。
論文 参考訳(メタデータ) (2021-09-22T16:03:29Z) - A Gradient-based Deep Neural Network Model for Simulating Multiphase
Flow in Porous Media [1.5791732557395552]
多孔質媒体の多相流に関する物理に制約された勾配に基づくディープニューラルネットワーク(GDNN)について述べる。
GDNNが非線型応答の非線型パターンを効果的に予測できることを実証する。
論文 参考訳(メタデータ) (2021-04-30T02:14:00Z) - Dynamic Mode Decomposition in Adaptive Mesh Refinement and Coarsening
Simulations [58.720142291102135]
動的モード分解(DMD)はコヒーレントなスキームを抽出する強力なデータ駆動方式である。
本稿では,異なるメッシュトポロジと次元の観測からDMDを抽出する戦略を提案する。
論文 参考訳(メタデータ) (2021-04-28T22:14:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。