論文の概要: Winning the CityLearn Challenge: Adaptive Optimization with Evolutionary
Search under Trajectory-based Guidance
- arxiv url: http://arxiv.org/abs/2212.01939v1
- Date: Sun, 4 Dec 2022 22:18:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-06 15:29:03.954372
- Title: Winning the CityLearn Challenge: Adaptive Optimization with Evolutionary
Search under Trajectory-based Guidance
- Title(参考訳): CityLearn Challengeに勝つ: 軌道に基づく誘導による進化探索による適応最適化
- Authors: Vanshaj Khattar and Ming Jin
- Abstract要約: 本稿では,最適化の解関数をポリシーとして利用して,逐次的意思決定のための行動を計算する手法を提案する。
我々のエージェントは2021年のCityLearn Challengeでトップにランクインし、ほぼすべての指標において優れたパフォーマンスを実現しました。
- 参考スコア(独自算出の注目度): 2.4476800587391234
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern power systems will have to face difficult challenges in the years to
come: frequent blackouts in urban areas caused by high power demand peaks, grid
instability exacerbated by intermittent renewable generation, and global
climate change amplified by rising carbon emissions. While current practices
are growingly inadequate, the path to widespread adoption of artificial
intelligence (AI) methods is hindered by missing aspects of trustworthiness.
The CityLearn Challenge is an exemplary opportunity for researchers from
multiple disciplines to investigate the potential of AI to tackle these
pressing issues in the energy domain, collectively modeled as a reinforcement
learning (RL) task. Multiple real-world challenges faced by contemporary RL
techniques are embodied in the problem formulation. In this paper, we present a
novel method using the solution function of optimization as policies to compute
actions for sequential decision-making, while notably adapting the parameters
of the optimization model from online observations. Algorithmically, this is
achieved by an evolutionary algorithm under a novel trajectory-based guidance
scheme. Formally, the global convergence property is established. Our agent
ranked first in the latest 2021 CityLearn Challenge, being able to achieve
superior performance in almost all metrics while maintaining some key aspects
of interpretability.
- Abstract(参考訳): 電力需要のピークによる都市部での頻繁な停電、断続的な再生可能エネルギー発生によるグリッド不安定化、二酸化炭素排出量の増加による世界的な気候変動などだ。
現在のプラクティスはますます不十分になっているが、人工知能(AI)メソッドの普及への道は、信頼性の欠如によって妨げられている。
CityLearn Challengeは、複数の分野の研究者が、エネルギー領域におけるこれらのプレッシャー問題に取り組むAIの可能性を調べるための模範的な機会であり、総合的に強化学習(RL)タスクとしてモデル化されている。
現代のRL技術が直面する現実的な課題は、問題の定式化に具体化されている。
本稿では,オンライン観察から最適化モデルのパラメータを適応しつつ,逐次意思決定のためのアクションを計算するためのポリシーとして最適化の解関数を用いる新しい手法を提案する。
アルゴリズム上、これは新しい軌道に基づく誘導法の下で進化的アルゴリズムによって達成される。
正式には、グローバル収束特性が確立される。
当社のエージェントは,2021年のcitylearn challengeで第1位にランクインし,解釈可能性の重要な面を維持しながら,ほぼすべての指標で優れたパフォーマンスを達成できた。
関連論文リスト
- Learning fast changing slow in spiking neural networks [3.626013617212667]
強化学習(Reinforcement Learning, RL)は、実生活問題に適用する際の課題である。
RLはしばしば効果的な学習のためにかなりの量のデータを要求する。
政策最適化の生物学的に妥当な実装を導入する。
論文 参考訳(メタデータ) (2024-01-25T12:03:10Z) - HAZARD Challenge: Embodied Decision Making in Dynamically Changing
Environments [93.94020724735199]
HAZARDは、火災、洪水、風などの3つの予期せぬ災害シナリオで構成されている。
このベンチマークにより、さまざまなパイプラインで自律エージェントの意思決定能力を評価することができる。
論文 参考訳(メタデータ) (2024-01-23T18:59:43Z) - Hybrid Reinforcement Learning for Optimizing Pump Sustainability in
Real-World Water Distribution Networks [55.591662978280894]
本稿では,実世界の配水ネットワーク(WDN)のリアルタイム制御を強化するために,ポンプスケジューリング最適化問題に対処する。
我々の主な目的は、エネルギー消費と運用コストを削減しつつ、物理的な運用上の制約を遵守することである。
進化に基づくアルゴリズムや遺伝的アルゴリズムのような伝統的な最適化手法は、収束保証の欠如によってしばしば不足する。
論文 参考訳(メタデータ) (2023-10-13T21:26:16Z) - Self-Sustaining Multiple Access with Continual Deep Reinforcement
Learning for Dynamic Metaverse Applications [17.436875530809946]
Metaverseは,さまざまな世界で構成される仮想環境の構築を目的とした,新たなパラダイムだ。
このような動的で複雑なシナリオに対処するためには、自己維持戦略を採用する方法が考えられる。
本稿では,知的エージェントのスループットを最大化するために,マルチチャネル環境におけるマルチアクセスの問題について検討する。
論文 参考訳(メタデータ) (2023-09-18T22:02:47Z) - End-to-end Lidar-Driven Reinforcement Learning for Autonomous Racing [0.0]
強化学習(Reinforcement Learning, RL)は、自動化とロボット工学の領域において、変革的なアプローチとして登場した。
本研究は、フィードフォワード生ライダーと速度データのみを用いて、レース環境をナビゲートするRLエージェントを開発し、訓練する。
エージェントのパフォーマンスは、実世界のレースシナリオで実験的に評価される。
論文 参考訳(メタデータ) (2023-09-01T07:03:05Z) - Predictive Experience Replay for Continual Visual Control and
Forecasting [62.06183102362871]
視覚力学モデリングのための新しい連続学習手法を提案し,その視覚制御と予測における有効性について検討する。
まず,タスク固有のダイナミクスをガウスの混合で学習する混合世界モデルを提案し,その上で,破滅的な忘れを克服するための新たなトレーニング戦略を提案する。
我々のモデルは,DeepMind Control と Meta-World のベンチマークにおいて,既存の連続的学習アルゴリズムと視覚的RLアルゴリズムの単純な組み合わせよりも優れている。
論文 参考訳(メタデータ) (2023-03-12T05:08:03Z) - MARLIN: Soft Actor-Critic based Reinforcement Learning for Congestion
Control in Real Networks [63.24965775030673]
そこで本研究では,汎用的な渋滞制御(CC)アルゴリズムを設計するための新しい強化学習(RL)手法を提案する。
我々の解であるMARLINは、Soft Actor-Criticアルゴリズムを用いてエントロピーとリターンの両方を最大化する。
我々は,MARLINを実ネットワーク上で訓練し,実ミスマッチを克服した。
論文 参考訳(メタデータ) (2023-02-02T18:27:20Z) - Beyond CAGE: Investigating Generalization of Learned Autonomous Network
Defense Policies [0.8785883427835897]
本研究は,CAGEチャレンジの第2版で実施された強化学習アプローチを評価する。
アンサンブルRL技術は,我々の他のモデルより優れ,競争において第2位である。
目に見えない環境では、我々のアプローチはすべて悪化し、環境の変化のタイプによって様々な劣化が生じます。
論文 参考訳(メタデータ) (2022-11-28T17:01:24Z) - Reinforcement Learning-Empowered Mobile Edge Computing for 6G Edge
Intelligence [76.96698721128406]
モバイルエッジコンピューティング(MEC)は、第5世代(5G)ネットワークなどにおける計算と遅延に敏感なタスクのための新しいパラダイムであると考えた。
本稿では、フリー対応RLに関する総合的な研究レビューと、開発のための洞察を提供する。
論文 参考訳(メタデータ) (2022-01-27T10:02:54Z) - First Responders Got Wings: UAVs to the Rescue of Localization
Operations in Beyond 5G Systems [7.244860161025552]
無人航空機(UAV)ベースのソリューションは、ローカライゼーションの課題に挑戦する最も有望な候補である。
本稿では,最先端技術のローカライゼーション性能を高めるための主な課題と今後の機会に光を当てることにより,最近利用可能な技術を活用する。
論文 参考訳(メタデータ) (2021-09-07T16:19:01Z) - Deep Reinforcement Learning amidst Lifelong Non-Stationarity [67.24635298387624]
政治以外のRLアルゴリズムは、寿命の長い非定常性に対処できることを示す。
提案手法は潜在変数モデルを用いて,現在および過去の経験から環境表現を学習する。
また, 生涯の非定常性を示すシミュレーション環境もいくつか導入し, 環境変化を考慮しないアプローチを著しく上回っていることを実証的に確認した。
論文 参考訳(メタデータ) (2020-06-18T17:34:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。