論文の概要: Degradation-Aware Frequency Regulation of a Heterogeneous Battery Fleet via Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2601.22865v1
- Date: Fri, 30 Jan 2026 11:44:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-02 18:28:15.412791
- Title: Degradation-Aware Frequency Regulation of a Heterogeneous Battery Fleet via Reinforcement Learning
- Title(参考訳): 強化学習による不均一電池艦隊の劣化を考慮した周波数制御
- Authors: Tanay Raghunandan Srinivasa, Vivek Deulkar, Jia Bhargava, Mohammad Hajiesmaili, Prashant Shenoy,
- Abstract要約: 繰り返し充電と放電はサイクル劣化を誘発し、バッテリー寿命を減少させる。
本稿では,バタリーランプレートとキャパシティ制約による信号の集合的追跡を行う異種電池群のリアルタイムスケジューリングについて検討する。
- 参考スコア(独自算出の注目度): 6.833717568444402
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Battery energy storage systems are increasingly deployed as fast-responding resources for grid balancing services such as frequency regulation and for mitigating renewable generation uncertainty. However, repeated charging and discharging induces cycling degradation and reduces battery lifetime. This paper studies the real-time scheduling of a heterogeneous battery fleet that collectively tracks a stochastic balancing signal subject to per-battery ramp-rate and capacity constraints, while minimizing long-term cycling degradation. Cycling degradation is fundamentally path-dependent: it is determined by charge-discharge cycles formed by the state-of-charge (SoC) trajectory and is commonly quantified via rainflow cycle counting. This non-Markovian structure makes it difficult to express degradation as an additive per-time-step cost, complicating classical dynamic programming approaches. We address this challenge by formulating the fleet scheduling problem as a Markov decision process (MDP) with constrained action space and designing a dense proxy reward that provides informative feedback at each time step while remaining aligned with long-term cycle-depth reduction. To scale learning to large state-action spaces induced by fine-grained SoC discretization and asymmetric per-battery constraints, we develop a function-approximation reinforcement learning method using an Extreme Learning Machine (ELM) as a random nonlinear feature map combined with linear temporal-difference learning. We evaluate the proposed approach on a toy Markovian signal model and on a Markovian model trained from real-world regulation signal traces obtained from the University of Delaware, and demonstrate consistent reductions in cycle-depth occurrence and degradation metrics compared to baseline scheduling policies.
- Abstract(参考訳): 電池エネルギー貯蔵システムは、周波数規制などのグリッドバランスサービスや再生可能エネルギーの不確実性を緩和するための高速対応資源として、ますます普及している。
しかし、繰り返し充電および放電はサイクリング劣化を誘発し、電池寿命を減少させる。
本稿では, 長期サイクル劣化を最小限に抑えつつ, 電池群毎のランレートおよびキャパシティ制約を受ける確率的バランス信号を一括して追跡する異種電池群のリアルタイムスケジューリングについて検討する。
サイクル劣化は基本的に経路依存であり、正電荷 (SoC) 軌道によって形成される電荷放電サイクルによって決定され、一般的に雨水循環計数によって定量化される。
この非マルコフ構造は、古典的動的プログラミングアプローチを複雑にし、時間当たりの加算コストとして分解を表現するのが難しくなる。
この課題に対処するため, フラッグスケジューリング問題を制約された行動空間を持つマルコフ決定プロセス (MDP) として定式化し, 長期サイクル深度低減に整合しながら, 各ステップで情報的フィードバックを提供する高密度プロキシ報酬を設計する。
微粒なSoC離散化と非対称なバッテリ制約によって引き起こされる大きな状態-作用空間への学習をスケールするために,線形時間差分学習と組み合わせたランダムな非線形特徴写像として,ELM(Extreme Learning Machine)を用いた関数近似強化学習法を開発した。
デラウェア大学から取得した実世界の信号トレースから学習したマルコフ信号モデルとマルコフ信号モデルに対する提案手法の評価を行い,ベースラインスケジューリングポリシと比較して,サイクル深度の発生と劣化の指標が一貫した減少を示す。
関連論文リスト
- Scalable Distributed Memory Implementation of the Quasi-Adiabatic Propagator Path Integral [0.0]
本研究では,影響係数の粗粒化をマスク支援した分散メモリのスケーラブルな実装を提案する。
この方法は、複数の計算ノードのメモリリソースを利用して、新しいプリマージアルゴリズムによってメモリボトルネックを緩和する。
新しい実装の効率は、大規模な散逸型量子力学シミュレーションで実証されている。
論文 参考訳(メタデータ) (2025-06-03T17:56:18Z) - Residual Chain Prediction for Autonomous Driving Path Planning [5.139918355140954]
残留連鎖損失は損失計算過程を動的に調整し、予測経路点の時間依存性と精度を高める。
我々の研究は、自動運転車の計画コンポーネントに革命をもたらすために、Residual Chain Lossの可能性を浮き彫りにした。
論文 参考訳(メタデータ) (2024-04-08T11:43:40Z) - PreRoutGNN for Timing Prediction with Order Preserving Partition: Global
Circuit Pre-training, Local Delay Learning and Attentional Cell Modeling [84.34811206119619]
本稿では,事前のタイミング予測に対する2段階のアプローチを提案する。
まず、回路網リストからグローバルグラフ埋め込みを学習するグラフオートエンコーダを事前学習するためのグローバル回路トレーニングを提案する。
第2に、GCN上のメッセージパッシングのための新しいノード更新方式を、学習したグラフ埋め込みと回路グラフのトポロジ的ソートシーケンスに従って使用する。
21個の実世界の回路の実験では、スラック予測のための新しいSOTA R2が0.93で達成され、以前のSOTA法では0.59をはるかに上回っている。
論文 参考訳(メタデータ) (2024-02-27T02:23:07Z) - Adaptive Planning Search Algorithm for Analog Circuit Verification [53.97809573610992]
シミュレーションの少ない機械学習(ML)アプローチを提案する。
提案手法により,OCCを全回路の仕様に近づけることができることを示す。
論文 参考訳(メタデータ) (2023-06-23T12:57:46Z) - A Transferable Multi-stage Model with Cycling Discrepancy Learning for
Lithium-ion Battery State of Health Estimation [18.980782609740082]
電池の完全ライフサイクルの多重劣化パターンは、伝達学習(TL)の追求を困難にしている
移動可能な多段SOH推定モデルを提案し,4段階からなる電池間TLを実現する。
提案手法は,3つのバッテリを用いたラン・ツー・フェイル・ベンチマークにおいて,様々な転送タスクにおける競合アルゴリズムよりも優れる。
論文 参考訳(メタデータ) (2022-09-01T02:59:46Z) - Transfer Learning-based State of Health Estimation for Lithium-ion
Battery with Cycle Synchronization [16.637948430296227]
バッテリーの健康状態(SOH)を正確に推定することは、バッテリー駆動アプリケーションの予期せぬ失敗を防ぐのに役立ちます。
新たなバッテリのモデルトレーニングにおけるデータ要件の低減という優位性により,トランスファーラーニング(TL)が有望な機械学習アプローチとして出現する。
本稿では、時間的ダイナミクスを利用してTLに基づくSOH推定を解釈し、伝達学習を支援する手法を提案する。
論文 参考訳(メタデータ) (2022-08-23T21:40:40Z) - Towards performant and reliable undersampled MR reconstruction via
diffusion model sampling [67.73698021297022]
DiffuseReconは拡散モデルに基づく新しいMR再構成法である。
観測された信号に基づいて生成過程を導出する。
特定の加速因子に関する追加の訓練は必要としない。
論文 参考訳(メタデータ) (2022-03-08T02:25:38Z) - Lithium-ion Battery State of Health Estimation based on Cycle
Synchronization using Dynamic Time Warping [13.19976118887128]
健康状態推定(SOH)は、電池容量の減少による予期せぬ故障を避けるために、電池駆動アプリケーションにおいて重要な役割を担っている。
本稿では、動的時間ワープを用いて、既存の座標系を変更するための革新的なサイクル同期手法を提案する。
提案手法は,時系列の時間情報を活用することで,時間指標と元の測定値を新しい指標に組み込んで,電池劣化状況を反映する。
論文 参考訳(メタデータ) (2021-09-28T02:53:54Z) - Stochastically forced ensemble dynamic mode decomposition for
forecasting and analysis of near-periodic systems [65.44033635330604]
本稿では,観測力学を強制線形系としてモデル化した新しい負荷予測手法を提案する。
固有線型力学の利用は、解釈可能性やパーシモニーの観点から、多くの望ましい性質を提供することを示す。
電力グリッドからの負荷データを用いたテストケースの結果が提示される。
論文 参考訳(メタデータ) (2020-10-08T20:25:52Z) - Targeted free energy estimation via learned mappings [66.20146549150475]
自由エネルギー摂動 (FEP) は60年以上前にズワンツィヒによって自由エネルギー差を推定する方法として提案された。
FEPは、分布間の十分な重複の必要性という厳しい制限に悩まされている。
目標自由エネルギー摂動(Targeted Free Energy Perturbation)と呼ばれるこの問題を緩和するための1つの戦略は、オーバーラップを増やすために構成空間の高次元マッピングを使用する。
論文 参考訳(メタデータ) (2020-02-12T11:10:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。