論文の概要: Constrained Optimal Fuel Consumption of HEV:Considering the Observational Perturbation
- arxiv url: http://arxiv.org/abs/2410.20913v1
- Date: Mon, 28 Oct 2024 10:45:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-29 12:20:18.837715
- Title: Constrained Optimal Fuel Consumption of HEV:Considering the Observational Perturbation
- Title(参考訳): HEVの最適燃費の制約:観測摂動を考慮した検討
- Authors: Shuchang Yan, Haoran Sun,
- Abstract要約: 我々は,SOCと速度の観測摂動下でのSOCバランスを維持しつつ,燃料消費を最小化することを目的としている。
この研究はまず,5種類の摂動の下でCOFC問題を解決するために,まず7つのトレーニングアプローチを用いた。
- 参考スコア(独自算出の注目度): 12.936592572736908
- License:
- Abstract: We assume accurate observation of battery state of charge (SOC) and precise speed curves when addressing the constrained optimal fuel consumption (COFC) problem via constrained reinforcement learning (CRL). However, in practice, SOC measurements are often distorted by noise or confidentiality protocols, and actual reference speeds may deviate from expectations. We aim to minimize fuel consumption while maintaining SOC balance under observational perturbations in SOC and speed. This work first worldwide uses seven training approaches to solve the COFC problem under five types of perturbations, including one based on a uniform distribution, one designed to maximize rewards, one aimed at maximizing costs, and one along with its improved version that seeks to decrease reward on Toyota Hybrid Systems (THS) under New European Driving Cycle (NEDC) condition. The result verifies that the six can successfully solve the COFC problem under observational perturbations, and we further compare the robustness and safety of these training approaches and analyze their impact on optimal fuel consumption.
- Abstract(参考訳): 我々は、制約付き強化学習(CRL)を通して、制約付き最適燃料消費(COFC)問題に対処する際に、電荷(SOC)の電池状態と正確な速度曲線の正確な観測を仮定する。
しかし、実際には、SOC測定はノイズや機密性プロトコルによって歪むことが多く、実際の参照速度は期待から逸脱する可能性がある。
我々は,SOCと速度の観測摂動下でのSOCバランスを維持しつつ,燃料消費を最小化することを目的としている。
この研究は、まず、一様分布に基づくもの、報酬の最大化を目的としたもの、コストの最大化を目的としたもの、および新欧州運転サイクル(NEDC)条件下でのトヨタハイブリッドシステム(THS)の報酬削減を目的とした改良版を含む、5種類の摂動下でのCOFC問題の解決に7つのトレーニングアプローチを使用する。
その結果, 観測摂動下でのCOFC問題の解決に成功し, さらにこれらのトレーニング手法の堅牢性と安全性を比較し, 最適な燃料消費への影響を解析した。
関連論文リスト
- Constrained Optimal Fuel Consumption of HEV: A Constrained Reinforcement Learning Approach [0.0]
この研究は、制約付き強化学習(CRL)の観点から、制約付き最適燃料消費(COFC)の数学的表現を提供する。
CRLの2つの主要なアプローチ、制約付き変動ポリシー最適化(CVPO)とラグランジアンベースのアプローチが、車両の最小燃費を得るために初めて使用される。
論文 参考訳(メタデータ) (2024-03-12T10:42:32Z) - Catastrophic Overfitting: A Potential Blessing in Disguise [51.996943482875366]
FAT(Fast Adversarial Training)は、敵の堅牢性向上に効果があるとして、研究コミュニティ内で注目を集めている。
既存のFATアプローチではCOの緩和が進んでいるが, クリーンサンプルの分類精度が低下するにつれて, 対向ロバスト性の上昇が生じる。
クリーンな例と逆向きな例に特徴アクティベーションの相違を利用して,COの根本原因を分析した。
我々は, モデル性能を高めることを目的として, 「攻撃難読化」を実現するためにCOを活用する。
論文 参考訳(メタデータ) (2024-02-28T10:01:44Z) - COPR: Continual Human Preference Learning via Optimal Policy
Regularization [56.1193256819677]
RLHF(Reinforcement Learning from Human Feedback)は、大規模言語モデル(LLM)と人間の嗜好の整合性を改善するために一般的に用いられる。
本稿では,最適政策理論からインスピレーションを得たCOPR法を提案する。
論文 参考訳(メタデータ) (2024-02-22T02:20:08Z) - EnduRL: Enhancing Safety, Stability, and Efficiency of Mixed Traffic Under Real-World Perturbations Via Reinforcement Learning [1.7273380623090846]
実世界の走行軌道を解析し、幅広い加速度プロファイルを抽出する。
次に、これらのプロファイルを、混雑を軽減するためにRVをトレーニングするためのシミュレーションに組み込む。
RVの安全性は最大66%向上し、効率は最大54%向上し、安定性は最大97%向上した。
論文 参考訳(メタデータ) (2023-11-21T00:45:13Z) - Deep Reinforcement Learning-based Intelligent Traffic Signal Controls
with Optimized CO2 emissions [6.851243292023835]
交通ネットワークは、人間の健康や環境に悪影響を及ぼし、交通渋滞に寄与する準最適制御政策の課題に直面している。
文献における適応的な信号制御装置はいくつかあるが、それらの比較性能について限定的な研究がなされている。
EcoLightは,CO2排出量を削減するだけでなく,旅行時間などの指標で競合する結果が得られる強化学習アルゴリズムの報酬形成手法である。
論文 参考訳(メタデータ) (2023-10-19T19:54:47Z) - Hybrid Reinforcement Learning for Optimizing Pump Sustainability in
Real-World Water Distribution Networks [55.591662978280894]
本稿では,実世界の配水ネットワーク(WDN)のリアルタイム制御を強化するために,ポンプスケジューリング最適化問題に対処する。
我々の主な目的は、エネルギー消費と運用コストを削減しつつ、物理的な運用上の制約を遵守することである。
進化に基づくアルゴリズムや遺伝的アルゴリズムのような伝統的な最適化手法は、収束保証の欠如によってしばしば不足する。
論文 参考訳(メタデータ) (2023-10-13T21:26:16Z) - Learning to Sail Dynamic Networks: The MARLIN Reinforcement Learning
Framework for Congestion Control in Tactical Environments [53.08686495706487]
本稿では, 正確な並列化可能なエミュレーション環境を利用して, 戦術ネットワークの環境を再現するRLフレームワークを提案する。
衛星通信(SATCOM)とUHFワイドバンド(UHF)の無線リンク間のボトルネックリンク遷移を再現した条件下で、MARLINエージェントを訓練することにより、我々のRL学習フレームワークを評価する。
論文 参考訳(メタデータ) (2023-06-27T16:15:15Z) - CCE: Sample Efficient Sparse Reward Policy Learning for Robotic Navigation via Confidence-Controlled Exploration [72.24964965882783]
CCE (Confidence-Controlled Exploration) は、ロボットナビゲーションのようなスパース報酬設定のための強化学習アルゴリズムのトレーニングサンプル効率を高めるために設計された。
CCEは、勾配推定と政策エントロピーの間の新しい関係に基づいている。
我々は、CCEが一定軌跡長とエントロピー正規化を用いる従来の手法より優れるシミュレーションおよび実世界の実験を通して実証する。
論文 参考訳(メタデータ) (2023-06-09T18:45:15Z) - Adaptive Frequency Green Light Optimal Speed Advisory based on Hybrid
Actor-Critic Reinforcement Learning [2.257737378757467]
GLOSAシステムは、緑の間隔で交差点を通過するのを助けるために車両に速度を推奨する。
これまでの研究は、GLOSAアルゴリズムの最適化に重点を置いており、スピードアドバイザリーの頻度を無視している。
本稿では,Hybrid Proximal Policy Optimization (H-PPO) に基づく適応周波数GLOSAモデルを提案する。
論文 参考訳(メタデータ) (2023-06-07T01:16:45Z) - Revealing the real-world CO2 emission reduction of ridesplitting and its
determinants based on machine learning [12.864925081071684]
本研究では,共有乗用車(ライドスプリット)のCO2排出量と代用単乗用車(レギュラーライドソーシング)を算出し,各乗用車走行のCO2排出量削減を推定する。
その結果、すべてのライドプリットトリップが、現実世界のライドソーシングから排出される排出を減少させるわけではないことがわかった。
論文 参考訳(メタデータ) (2022-04-02T06:25:48Z) - Optimizing Mixed Autonomy Traffic Flow With Decentralized Autonomous
Vehicles and Multi-Agent RL [63.52264764099532]
本研究では、完全分散制御方式を用いて、混合自律環境でのボトルネックのスループットを向上させる自動運転車の能力について検討する。
この問題にマルチエージェント強化アルゴリズムを適用し、5%の浸透速度で20%から40%の浸透速度で33%までのボトルネックスループットの大幅な改善が達成できることを実証した。
論文 参考訳(メタデータ) (2020-10-30T22:06:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。