論文の概要: Balancing SoC in Battery Cells using Safe Action Perturbations
- arxiv url: http://arxiv.org/abs/2503.11696v1
- Date: Tue, 11 Mar 2025 09:59:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-18 16:00:17.404197
- Title: Balancing SoC in Battery Cells using Safe Action Perturbations
- Title(参考訳): 安全な動作摂動を用いた電池セル内SOCのバランシング
- Authors: E Harshith Kumar Yadav, Rahul Narava, Anshika, Shashi Shekher Jha,
- Abstract要約: 電荷レベルの不均衡は電池の健康状態に影響する。
従来の方法では、安全と充電時間のトレードオフとして安全保証に重点を置いている。
本稿では,安全層を深部強化学習(RL)エージェント上のアドオンとして使用することにより,安全な電池充電動作の学習方法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Managing equal charge levels in active cell balancing while charging a Li-ion battery is challenging. An imbalance in charge levels affects the state of health of the battery, along with the concerns of thermal runaway and fire hazards. Traditional methods focus on safety assurance as a trade-off between safety and charging time. Others deal with battery-specific conditions to ensure safety, therefore losing on the generalization of the control strategies over various configurations of batteries. In this work, we propose a method to learn safe battery charging actions by using a safety-layer as an add-on over a Deep Reinforcement Learning (RL) agent. The safety layer perturbs the agent's action to prevent the battery from encountering unsafe or dangerous states. Further, our Deep RL framework focuses on learning a generalized policy that can be effectively employed with varying configurations of batteries. Our experimental results demonstrate that the safety-layer based action perturbation incurs fewer safety violations by avoiding unsafe states along with learning a robust policy for several battery configurations.
- Abstract(参考訳): Liイオン電池を充電しながら、アクティブなセルバランシングで同等の充電レベルを管理することは難しい。
電荷レベルの不均衡は、熱流出や火災の危険への懸念とともに、バッテリーの健康状態に影響する。
従来の方法では、安全と充電時間のトレードオフとして安全保証に重点を置いている。
安全性を確保するためにバッテリー固有の条件を扱うものもあり、バッテリーの様々な構成に対する制御戦略の一般化を損なう。
本研究では,安全層を深部強化学習(RL)エージェント上のアドオンとして使用することにより,安全な電池充電動作を学習する手法を提案する。
安全層は、安全でない状態や危険な状態にバッテリが遭遇することを防ぐためのエージェントの動作を妨害する。
さらに、当社のDeep RLフレームワークは、電池の様々な構成を効果的に活用できる一般化されたポリシーの学習に重点を置いている。
実験の結果, 安全層に基づく動作摂動は, 安全でない状態を回避するとともに, 電池構成の堅牢なポリシーを学習することにより, 安全性を損なうことが示唆された。
関連論文リスト
- Deep-MPC: A DAGGER-Driven Imitation Learning Strategy for Optimal Constrained Battery Charging [5.192596329990163]
本論文は,従来の電池充電の予測制御戦略にまつわる課題に対処する革新的な手法を提案する。
電気化学モデルを組み込んだ実用的な電池シミュレータから得られた結果は、電池充電性能の大幅な改善を浮き彫りにした。
論文 参考訳(メタデータ) (2024-06-23T02:36:02Z) - Forecasting Electric Vehicle Battery Output Voltage: A Predictive Modeling Approach [0.0]
バッテリー管理システムは、電気自動車とハイブリッド車の安全性と信頼性を確保する上で重要な役割を担っている。
状態評価、監視、電荷制御、セルバランシングなど、BMSに統合されたさまざまな機能に責任がある。
論文 参考訳(メタデータ) (2024-04-08T06:47:03Z) - Your Battery Is a Blast! Safeguarding Against Counterfeit Batteries with
Authentication [20.498545647363628]
偽造細胞は爆発や火災を引き起こす可能性があり、市場におけるその流行は、ユーザーが偽造細胞を検出するのを困難にしている。
現在のバッテリ認証手法は、高度な偽造技術の影響を受けやすい。
機械学習モデルを用いて,各セルの内部特性を利用する2つの新しい手法,DCAuthとEISthenticationを提案する。
論文 参考訳(メタデータ) (2023-09-07T10:02:59Z) - Safety Correction from Baseline: Towards the Risk-aware Policy in
Robotics via Dual-agent Reinforcement Learning [64.11013095004786]
本稿では,ベースラインと安全エージェントからなる二重エージェント型安全強化学習戦略を提案する。
このような分離されたフレームワークは、RLベースの制御に対して高い柔軟性、データ効率、リスク認識を可能にする。
提案手法は,難易度の高いロボットの移動・操作作業において,最先端の安全RLアルゴリズムより優れる。
論文 参考訳(メタデータ) (2022-12-14T03:11:25Z) - SAFER: Data-Efficient and Safe Reinforcement Learning via Skill
Acquisition [59.94644674087599]
安全制約下での複雑な制御タスクにおけるポリシー学習を高速化するアルゴリズムであるSAFEty skill pRiors (SAFER)を提案する。
オフラインデータセットでの原則的なトレーニングを通じて、SAFERは安全なプリミティブスキルの抽出を学ぶ。
推論段階では、SAFERで訓練されたポリシーは、安全なスキルを成功のポリシーに組み込むことを学ぶ。
論文 参考訳(メタデータ) (2022-02-10T05:43:41Z) - Safe Reinforcement Learning for Grid Voltage Control [0.0]
緊急時の電力系統の電圧安定性を回復するための標準手法として, 電圧負荷低減が検討されている。
本稿では,制約付き最適化手法とバリア関数に基づく2つの新しい安全なRL手法について論じる。
論文 参考訳(メタデータ) (2021-12-02T18:34:50Z) - Improving Robustness of Reinforcement Learning for Power System Control
with Adversarial Training [71.7750435554693]
電力系統制御のために提案された最先端のRLエージェントが敵攻撃に対して脆弱であることを示す。
具体的には、敵のマルコフ決定プロセスを用いて攻撃方針を学習し、攻撃の有効性を実証する。
本稿では,RLエージェントの攻撃に対する堅牢性を高め,実行不可能な運用上の決定を回避するために,敵の訓練を利用することを提案する。
論文 参考訳(メタデータ) (2021-10-18T00:50:34Z) - Optimizing a domestic battery and solar photovoltaic system with deep
reinforcement learning [69.68068088508505]
バッテリーと太陽光発電システムのコストの低下は、ソーラーバッテリーの家庭用システムの増加に繋がった。
本研究では,システム内の電池の充電および放電挙動を最適化するために,深い決定論的ポリシーアルゴリズムを用いる。
論文 参考訳(メタデータ) (2021-09-10T10:59:14Z) - Conservative Safety Critics for Exploration [120.73241848565449]
強化学習(RL)における安全な探索の課題について検討する。
我々は、批評家を通じて環境状態の保守的な安全性推定を学習する。
提案手法は,破滅的故障率を著しく低く抑えながら,競争力のあるタスク性能を実現することができることを示す。
論文 参考訳(メタデータ) (2020-10-27T17:54:25Z) - Runtime-Safety-Guided Policy Repair [13.038017178545728]
安全クリティカルな環境下での学習型制御政策におけるポリシー修復の問題点について検討する。
本稿では,安全コントローラが作成したランタイムデータに基づいて,トレーニング済みポリシーを修復することで,制御スイッチングを低減あるいは排除することを提案する。
論文 参考訳(メタデータ) (2020-08-17T23:31:48Z) - Cautious Adaptation For Reinforcement Learning in Safety-Critical
Settings [129.80279257258098]
都市運転のような現実の安全クリティカルな目標設定における強化学習(RL)は危険である。
非安全クリティカルな「ソース」環境でエージェントが最初に訓練する「安全クリティカル適応」タスクセットを提案する。
多様な環境における事前経験がリスクを見積もるためにエージェントに装備するという直感に基づくソリューションアプローチであるCARLを提案する。
論文 参考訳(メタデータ) (2020-08-15T01:40:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。