論文の概要: Training Electric Vehicle Charging Controllers with Imitation Learning
- arxiv url: http://arxiv.org/abs/2107.10111v1
- Date: Wed, 21 Jul 2021 14:39:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-22 14:23:53.599704
- Title: Training Electric Vehicle Charging Controllers with Imitation Learning
- Title(参考訳): 模倣学習による電気自動車充電制御装置の訓練
- Authors: Martin Pil\'at
- Abstract要約: 我々は、EV充電の調整のための制御器の訓練方法を開発した。
このトピックに関する既存の作業とは対照的に、ユーザのプライバシを維持するためにコントローラが必要です。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The problem of coordinating the charging of electric vehicles gains more
importance as the number of such vehicles grows. In this paper, we develop a
method for the training of controllers for the coordination of EV charging. In
contrast to most existing works on this topic, we require the controllers to
preserve the privacy of the users, therefore we do not allow any communication
from the controller to any third party.
In order to train the controllers, we use the idea of imitation learning --
we first find an optimum solution for a relaxed version of the problem using
quadratic optimization and then train the controllers to imitate this solution.
We also investigate the effects of regularization of the optimum solution on
the performance of the controllers. The method is evaluated on realistic data
and shows improved performance and training speed compared to similar
controllers trained using evolutionary algorithms.
- Abstract(参考訳): 電気自動車の充電調整の問題は、そのような車両の数が増加するにつれてより重要になる。
本稿では,ev充電のコーディネーションのための制御器のトレーニング手法を提案する。
このトピックに関するほとんどの既存の作業とは対照的に、私たちはコントローラにユーザのプライバシーを守るよう要求するので、コントローラからサードパーティへの通信は許可しません。
コントローラの学習には,まず2次最適化を用いて緩和された問題の最適解を見つけ,次に,この解を模倣するようにコントローラを訓練する。
また,最適解の正規化が制御器の性能に及ぼす影響についても検討する。
この手法は現実的なデータに基づいて評価され、進化的アルゴリズムを用いて訓練された類似のコントローラと比較して、パフォーマンスとトレーニング速度が向上する。
関連論文リスト
- Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - Partial End-to-end Reinforcement Learning for Robustness Against Modelling Error in Autonomous Racing [0.0]
本稿では、自動運転車における強化学習(RL)ソリューションの性能向上の問題に対処する。
計画タスクと制御タスクを分離する部分的なエンドツーエンドアルゴリズムを提案する。
従来の制御器のロバスト性を活用することにより,本アルゴリズムは標準のエンドツーエンドアルゴリズムよりもモデルミスマッチに対するロバスト性を向上する。
論文 参考訳(メタデータ) (2023-12-11T14:27:10Z) - Reaching the Limit in Autonomous Racing: Optimal Control versus
Reinforcement Learning [66.10854214036605]
ロボット工学における中心的な問題は、アジャイルなモバイルロボットの制御システムをどうやって設計するかである。
本稿では、強化学習(RL)で訓練されたニューラルネットワークコントローラが最適制御(OC)法より優れていることを示す。
その結果、アジャイルドローンを最大性能に押し上げることができ、最大加速速度は重力加速度の12倍以上、ピーク速度は時速108kmに達しました。
論文 参考訳(メタデータ) (2023-10-17T02:40:27Z) - Combining model-predictive control and predictive reinforcement learning
for stable quadrupedal robot locomotion [0.0]
モデル予測型と予測型強化型学習コントローラの組み合わせによりこれを実現できるかを検討する。
本研究では,両制御手法を組み合わせて,四足歩行ロボットの安定ゲート生成問題に対処する。
論文 参考訳(メタデータ) (2023-07-15T09:22:37Z) - Skip Training for Multi-Agent Reinforcement Learning Controller for
Industrial Wave Energy Converters [94.84709449845352]
近年のウェーブ・エナジー・コンバータ(WEC)は、発電を最大化するために複数の脚と発電機を備えている。
従来のコントローラは複雑な波のパターンを捕捉する制限を示しており、コントローラはエネルギー捕獲を効率的に最大化する必要がある。
本稿では,従来のスプリングダンパよりも優れたマルチエージェント強化学習コントローラ(MARL)を提案する。
論文 参考訳(メタデータ) (2022-09-13T00:20:31Z) - Competitive Control [52.28457815067461]
我々は,オンラインコントローラの設計に重点を置き,オフラインの最適コントローラと競合するオンラインコントローラの設計に重点を置いている。
この設定における自然なパフォーマンス指標は、オンラインコントローラが引き起こしたコストとオフラインの最適コントローラが引き起こしたコストとの比である競争比である。
論文 参考訳(メタデータ) (2021-07-28T22:26:27Z) - Regularizing Action Policies for Smooth Control with Reinforcement
Learning [47.312768123967025]
Conditioning for Action Policy Smoothness(CAPS)は、アクションポリシーの効果的な直感的な正規化である。
capsは、ニューラルネットワークコントローラの学習状態-動作マッピングの滑らかさを一貫して改善する。
実システムでテストしたところ、クアドロタードローンのコントローラーの滑らかさが改善され、消費電力は80%近く削減された。
論文 参考訳(メタデータ) (2020-12-11T21:35:24Z) - Learning a Contact-Adaptive Controller for Robust, Efficient Legged
Locomotion [95.1825179206694]
四足歩行ロボットのためのロバストコントローラを合成するフレームワークを提案する。
高レベルコントローラは、環境の変化に応じてプリミティブのセットを選択することを学習する。
確立された制御方法を使用してプリミティブを堅牢に実行する低レベルコントローラ。
論文 参考訳(メタデータ) (2020-09-21T16:49:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。