論文の概要: Multi-agent Deep Reinforcement Learning for Dynamic Pricing by
Fast-charging Electric Vehicle Hubs in ccompetition
- arxiv url: http://arxiv.org/abs/2401.15108v1
- Date: Thu, 25 Jan 2024 16:51:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-30 19:47:10.353837
- Title: Multi-agent Deep Reinforcement Learning for Dynamic Pricing by
Fast-charging Electric Vehicle Hubs in ccompetition
- Title(参考訳): 高速充電電気自動車ハブによる動的価格設定のためのマルチエージェント深部強化学習
- Authors: Diwas Paudel, Tapas K. Das
- Abstract要約: 電気自動車の高速充電ハブは、間もなく交通電化のための新しいインフラの一部になる。
日頭電力市場におけるハブの2段階動的価格設定手法を開発した。
2つの充電ハブ間の価格設定ゲームのための数値ケーススタディを開発した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Fast-charging hubs for electric vehicles will soon become part of the newly
built infrastructure for transportation electrification across the world. These
hubs are expected to host many DC fast-charging stations and will admit EVs
only for charging. Like the gasoline refueling stations, fast-charging hubs in
a neighborhood will dynamically vary their prices to compete for the same pool
of EV owners. These hubs will interact with the electric power network by
making purchase commitments for a significant part of their power needs in the
day-ahead (DA) electricity market and meeting the difference from the real-time
(RT) market. Hubs may have supplemental battery storage systems (BSS), which
they will use for arbitrage. In this paper, we develop a two-step data-driven
dynamic pricing methodology for hubs in price competition. We first obtain the
DA commitment by solving a stochastic DA commitment model. Thereafter we obtain
the hub pricing strategies by modeling the game as a competitive Markov
decision process (CMDP) and solving it using a multi-agent deep reinforcement
learning (MADRL) approach. We develop a numerical case study for a pricing game
between two charging hubs. We solve the case study with our methodology by
using combinations of two different DRL algorithms, DQN and SAC, and two
different neural networks (NN) architectures, a feed-forward (FF) neural
network, and a multi-head attention (MHA) neural network. We construct a
measure of collusion (index) using the hub profits. A value of zero for this
index indicates no collusion (perfect competition) and a value of one indicates
full collusion (monopolistic behavior). Our results show that the collusion
index varies approximately between 0.14 and 0.45 depending on the combinations
of the algorithms and the architectures chosen by the hubs.
- Abstract(参考訳): 電気自動車の高速充電ハブは、世界中の輸送電化のために新しく建設されたインフラの一部になる。
これらのハブは、多くのDC高速充電ステーションをホストし、充電のみのEVを許可する予定である。
ガソリン再給油ステーションのように、近所の高速充電ハブは価格を動的に変化させ、同じev所有者のプールと競う。
これらのハブは、日頭(DA)電力市場における電力需要のかなりの部分の購入を約束し、リアルタイム(RT)市場との違いを満たすことで、電力ネットワークと相互作用する。
ハブには補充バッテリーストレージシステム(BSS)があり、それを仲裁に使用する。
本稿では,価格競争におけるハブの2段階データ駆動動的価格決定手法を開発した。
まず,確率的DAコミットメントモデルを解くことで,DAコミットメントを得る。
その後,競争的マルコフ決定過程 (CMDP) としてゲームをモデル化し,マルチエージェント深部強化学習 (MADRL) アプローチを用いてこれを解くことにより,ハブ価格戦略を得る。
2つの充電ハブ間の価格設定ゲームのための数値ケーススタディを開発した。
dqnとsacという2つの異なるdrlアルゴリズムと、2つの異なるニューラルネットワーク(nn)アーキテクチャ、フィードフォワード(ff)ニューラルネットワーク、マルチヘッドアテンション(mha)ニューラルネットワークの組み合わせを用いて、この手法を用いてケーススタディを解決した。
ハブ利益を用いた共謀(インデックス)尺度を構築した。
この指数に対する0の値は結束(完全競合)を示しず、1の値は完全な結束(独占的行動)を示す。
この結果から,アルゴリズムとハブが選択したアーキテクチャの組み合わせによって,約0.14~0.45の相関指数が変化することがわかった。
関連論文リスト
- Active search and coverage using point-cloud reinforcement learning [50.741409008225766]
本稿では,目的探索とカバレッジのためのエンドツーエンドの深層強化学習ソリューションを提案する。
RLの深い階層的特徴学習は有効であり、FPS(Fastthest Point sample)を用いることで点数を削減できることを示す。
また、ポイントクラウドに対するマルチヘッドの注意がエージェントの学習を高速化する上で有効であるが、同じ結果に収束することを示す。
論文 参考訳(メタデータ) (2023-12-18T18:16:30Z) - Multi-Agent Learning of Efficient Fulfilment and Routing Strategies in
E-Commerce [11.421159751635667]
電子商取引における製品配送コストを最小化するための統合的アルゴリズムフレームワークを提案する。
電子商取引における大きな課題の1つは、複数の顧客からの時間的に多様な注文が大量にあることだ。
本稿では,グラフニューラルネットワークと強化学習を組み合わせたノード選択と車両エージェントの学習手法を提案する。
論文 参考訳(メタデータ) (2023-11-20T10:32:28Z) - Kronecker-Factored Approximate Curvature for Modern Neural Network
Architectures [85.76673783330334]
線形重み付け層の2つの異なる設定がクロネッカー型近似曲率(K-FAC)の2つの風味を動機付けている
重み付けをそれぞれ設定したディープ・リニア・ネットワークに対して正確であることを示す。
グラフニューラルネットワークと視覚変換器の両方をトレーニングするために、これらの2つのK-FACの違いをほとんど観測しない。
論文 参考訳(メタデータ) (2023-11-01T16:37:00Z) - $\textit{e-Uber}$: A Crowdsourcing Platform for Electric Vehicle-based
Ride- and Energy-sharing [2.2463154358632473]
EVの普及を利用して、e-Uberと呼ばれるクラウドソーシングプラットフォームを実現する。
e-Uberは空間的クラウドソーシング、強化学習、リバースオークション理論を利用している。
e-Uberは最適に近いパフォーマンスを示し、最先端のアプローチよりも優れたソリューションを見出す。
論文 参考訳(メタデータ) (2023-03-31T04:28:31Z) - Federated Deep Learning Meets Autonomous Vehicle Perception: Design and
Verification [168.67190934250868]
フェデレーテッド・ラーニング・パワード・コネクテッド・オートモービル(FLCAV)が提案されている。
FLCAVは通信とアノテーションのコストを削減しながらプライバシを保存する。
マルチステージトレーニングのためのネットワークリソースと道路センサのポーズを決定することは困難である。
論文 参考訳(メタデータ) (2022-06-03T23:55:45Z) - Learning to Operate an Electric Vehicle Charging Station Considering
Vehicle-grid Integration [4.855689194518905]
本稿では、充電ステーションの利益を最大化するために、新しい集中的アロケーションと分散実行(CADE)強化学習(RL)フレームワークを提案する。
集中配置プロセスでは、EVを待機スポットまたは充電スポットに割り当て、分散実行プロセスでは、各充電器は、共有再生メモリからアクション値関数を学習しながら、独自の充電/放電判定を行う。
数値計算により,提案したCADEフレームワークは計算効率が高く,拡張性も高く,ベースラインモデル予測制御(MPC)よりも優れていた。
論文 参考訳(メタデータ) (2021-11-01T23:10:28Z) - Adaptive Stochastic ADMM for Decentralized Reinforcement Learning in
Edge Industrial IoT [106.83952081124195]
強化学習 (Reinforcement Learning, RL) は, 意思決定および最適制御プロセスのための有望な解法として広く研究されている。
本稿では,Adaptive ADMM (asI-ADMM)アルゴリズムを提案する。
実験の結果,提案アルゴリズムは通信コストやスケーラビリティの観点から技術状況よりも優れており,複雑なIoT環境に適応できることがわかった。
論文 参考訳(メタデータ) (2021-06-30T16:49:07Z) - Low-Latency Federated Learning over Wireless Channels with Differential
Privacy [142.5983499872664]
フェデレートラーニング(FL)では、モデルトレーニングはクライアントに分散し、ローカルモデルは中央サーバによって集約される。
本稿では,各クライアントの差分プライバシ(DP)要件だけでなく,全体としてのトレーニング性能に制約された無線チャネル上でのFLトレーニング遅延を最小限に抑えることを目的とする。
論文 参考訳(メタデータ) (2021-06-20T13:51:18Z) - Demand-Side Scheduling Based on Multi-Agent Deep Actor-Critic Learning
for Smart Grids [56.35173057183362]
家庭用家電をネットでスケジュールできるスマートメーターが各家庭に備わっている需要側エネルギー管理の問題点を考察する。
目標は、リアルタイムの料金体系の下で全体のコストを最小化することです。
マルコフゲームとしてスマートグリッド環境の定式化を提案する。
論文 参考訳(メタデータ) (2020-05-05T07:32:40Z) - Electricity Theft Detection with self-attention [3.951220544042784]
本研究では,中国ステートグリッド社が提供する非バランスな現実的データセット上での電気盗難検出に対処する新しいモデルを提案する。
私たちの重要な貢献は、拡張畳み込みを持ち、カーネルサイズの畳み込みによって統一されたマルチヘッド自己保持機構の導入である。
我々のモデルは、以前のベースライン作業に対する17%以上の改善である0.926ドルのAUCを達成する。
論文 参考訳(メタデータ) (2020-02-14T19:11:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。