論文の概要: Contextual Reinforcement Learning for Offshore Wind Farm Bidding
- arxiv url: http://arxiv.org/abs/2312.10884v1
- Date: Mon, 18 Dec 2023 02:15:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-19 14:12:20.996426
- Title: Contextual Reinforcement Learning for Offshore Wind Farm Bidding
- Title(参考訳): オフショアウィンドファーム入札における文脈強化学習
- Authors: David Cole, Himanshu Sharma, Wei Wang
- Abstract要約: 強化学習は、異なる文脈下での2段階プログラムの第1段階変数の最適解に近づいた学習に使用できる可能性がある。
DDPGアルゴリズムを用いたトレーニングの初期結果と,性能向上のための今後のステップについて述べる。
- 参考スコア(独自算出の注目度): 11.336022475972493
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We propose a framework for applying reinforcement learning to contextual
two-stage stochastic optimization and apply this framework to the problem of
energy market bidding of an off-shore wind farm. Reinforcement learning could
potentially be used to learn close to optimal solutions for first stage
variables of a two-stage stochastic program under different contexts. Under the
proposed framework, these solutions would be learned without having to solve
the full two-stage stochastic program. We present initial results of training
using the DDPG algorithm and present intended future steps to improve
performance.
- Abstract(参考訳): 本研究では,二段階確率最適化に強化学習を適用する枠組みを提案し,この枠組みをオフショア風力発電機のエネルギー市場入札問題に適用する。
強化学習は、異なる文脈下での2段階確率プログラムの第1段階変数の最適解に近づくために用いられる可能性がある。
提案したフレームワークでは、これらの解は2段階確率プログラムを完全に解くことなく学習される。
DDPGアルゴリズムを用いたトレーニングの初期結果と,性能向上のための今後のステップについて述べる。
関連論文リスト
- Adversarial Constrained Policy Optimization: Improving Constrained Reinforcement Learning by Adapting Budgets [6.5472155063246085]
制約付き強化学習は、報酬と制約の両方が考慮される安全クリティカルな分野において、有望な進歩を遂げてきた。
本稿では,報酬の同時最適化とトレーニング中のコスト予算の適応を可能にする適応的制約付き政策最適化(ACPO)を提案する。
論文 参考訳(メタデータ) (2024-10-28T07:04:32Z) - A Primal-Dual-Assisted Penalty Approach to Bilevel Optimization with Coupled Constraints [66.61399765513383]
We developed a BLOCC algorithm to tackle BiLevel Optimization problems with Coupled Constraints。
2つのよく知られた実世界のアプリケーションでその効果を実証する。
論文 参考訳(メタデータ) (2024-06-14T15:59:36Z) - Stochastic Unrolled Federated Learning [85.6993263983062]
本稿では,UnRolled Federated Learning (SURF)を導入する。
提案手法は,この拡張における2つの課題,すなわち,非学習者へのデータセット全体の供給の必要性と,フェデレート学習の分散的性質に対処する。
論文 参考訳(メタデータ) (2023-05-24T17:26:22Z) - On the Convergence of Distributed Stochastic Bilevel Optimization
Algorithms over a Network [55.56019538079826]
バイレベル最適化は、幅広い機械学習モデルに適用されている。
既存のアルゴリズムの多くは、分散データを扱うことができないように、シングルマシンの設定を制限している。
そこで我々は,勾配追跡通信機構と2つの異なる勾配に基づく分散二段階最適化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-06-30T05:29:52Z) - Online Learning with Knapsacks: the Best of Both Worlds [54.28273783164608]
オンライン学習の課題として,意思決定者が,リソース制約の有限セットに違反することなく,期待する報酬を最大化したい,という課題を提起する。
当社のフレームワークは,意思決定者がそのエビデンスを柔軟かつコスト論的に扱えるようにします。
論文 参考訳(メタデータ) (2022-02-28T12:10:48Z) - Attend2Pack: Bin Packing through Deep Reinforcement Learning with
Attention [12.447691231587498]
自己アテンションに基づくエンコーディングと深層強化学習アルゴリズムに基づいて、我々は新しいエンド・ツー・エンド学習モデルを提案する。
我々は様々な実験環境において最先端の性能を達成する。
論文 参考訳(メタデータ) (2021-07-09T10:00:30Z) - Application-Driven Learning: A Closed-Loop Prediction and Optimization Approach Applied to Dynamic Reserves and Demand Forecasting [41.94295877935867]
我々は、予測と意思決定のプロセスが統合され、協調最適化される新しいクローズドループフレームワークであるアプリケーション駆動学習を提案する。
提案手法は拡張性があり,標準のオープンループ手法よりも一貫して性能が向上することを示す。
論文 参考訳(メタデータ) (2021-02-26T02:43:28Z) - Abstract Value Iteration for Hierarchical Reinforcement Learning [23.08652058034536]
本研究では,連続状態と行動空間による制御のための階層型強化学習フレームワークを提案する。
重要な課題は、ADPがマルコフではなく、ADPで計画するための2つのアルゴリズムを提案することである。
我々の手法は、いくつかの挑戦的なベンチマークにおいて、最先端の階層的強化学習アルゴリズムより優れています。
論文 参考訳(メタデータ) (2020-10-29T14:41:42Z) - Exploration in two-stage recommender systems [79.50534282841618]
2段階のレコメンデータシステムは、スケーラビリティと保守性のために業界で広く採用されている。
このセットアップの鍵となる課題は、各ステージの最適性能が最適なグローバルパフォーマンスを暗示していないことである。
そこで本研究では,ランクとノミネーター間の探索戦略を同期させる手法を提案する。
論文 参考訳(メタデータ) (2020-09-01T16:52:51Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。