論文の概要: Constrained Optimal Fuel Consumption of HEV:Considering the Observational Perturbation
- arxiv url: http://arxiv.org/abs/2410.20913v1
- Date: Mon, 28 Oct 2024 10:45:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-29 12:20:18.837715
- Title: Constrained Optimal Fuel Consumption of HEV:Considering the Observational Perturbation
- Title(参考訳): HEVの最適燃費の制約:観測摂動を考慮した検討
- Authors: Shuchang Yan, Haoran Sun,
- Abstract要約: 我々は,SOCと速度の観測摂動下でのSOCバランスを維持しつつ,燃料消費を最小化することを目的としている。
この研究はまず,5種類の摂動の下でCOFC問題を解決するために,まず7つのトレーニングアプローチを用いた。
- 参考スコア(独自算出の注目度): 12.936592572736908
- License:
- Abstract: We assume accurate observation of battery state of charge (SOC) and precise speed curves when addressing the constrained optimal fuel consumption (COFC) problem via constrained reinforcement learning (CRL). However, in practice, SOC measurements are often distorted by noise or confidentiality protocols, and actual reference speeds may deviate from expectations. We aim to minimize fuel consumption while maintaining SOC balance under observational perturbations in SOC and speed. This work first worldwide uses seven training approaches to solve the COFC problem under five types of perturbations, including one based on a uniform distribution, one designed to maximize rewards, one aimed at maximizing costs, and one along with its improved version that seeks to decrease reward on Toyota Hybrid Systems (THS) under New European Driving Cycle (NEDC) condition. The result verifies that the six can successfully solve the COFC problem under observational perturbations, and we further compare the robustness and safety of these training approaches and analyze their impact on optimal fuel consumption.
- Abstract(参考訳): 我々は、制約付き強化学習(CRL)を通して、制約付き最適燃料消費(COFC)問題に対処する際に、電荷(SOC)の電池状態と正確な速度曲線の正確な観測を仮定する。
しかし、実際には、SOC測定はノイズや機密性プロトコルによって歪むことが多く、実際の参照速度は期待から逸脱する可能性がある。
我々は,SOCと速度の観測摂動下でのSOCバランスを維持しつつ,燃料消費を最小化することを目的としている。
この研究は、まず、一様分布に基づくもの、報酬の最大化を目的としたもの、コストの最大化を目的としたもの、および新欧州運転サイクル(NEDC)条件下でのトヨタハイブリッドシステム(THS)の報酬削減を目的とした改良版を含む、5種類の摂動下でのCOFC問題の解決に7つのトレーニングアプローチを使用する。
その結果, 観測摂動下でのCOFC問題の解決に成功し, さらにこれらのトレーニング手法の堅牢性と安全性を比較し, 最適な燃料消費への影響を解析した。
関連論文リスト
- Improving Power Plant CO2 Emission Estimation with Deep Learning and Satellite/Simulated Data [0.0]
発電所からのCO2排出は、重要なスーパーエミッターとして、地球温暖化に大きく貢献する。
本研究では、Sentinel-5PからのNO2データの統合、連続したXCO2マップの生成、OCO-2/3からの実際の衛星観測をデータスカース領域における71以上の発電所に組み込むことにより、利用可能なデータセットを拡張することによる課題に対処する。
論文 参考訳(メタデータ) (2025-02-04T08:05:15Z) - Task Delay and Energy Consumption Minimization for Low-altitude MEC via Evolutionary Multi-objective Deep Reinforcement Learning [52.64813150003228]
無人航空機や他の航空機による低高度経済(LAE)は、輸送、農業、環境監視といった分野に革命をもたらした。
今後の6世代(6G)時代において、UAV支援移動エッジコンピューティング(MEC)は特に山岳や災害に遭った地域のような困難な環境において重要である。
タスクオフロード問題は、主にタスク遅延の最小化とUAVのエネルギー消費のトレードオフに対処するUAV支援MECの重要な問題の一つである。
論文 参考訳(メタデータ) (2025-01-11T02:32:42Z) - Constrained Optimal Fuel Consumption of HEV: A Constrained Reinforcement Learning Approach [0.0]
この研究は、制約付き強化学習(CRL)の観点から、制約付き最適燃料消費(COFC)の数学的表現を提供する。
CRLの2つの主要なアプローチ、制約付き変動ポリシー最適化(CVPO)とラグランジアンベースのアプローチが、車両の最小燃費を得るために初めて使用される。
論文 参考訳(メタデータ) (2024-03-12T10:42:32Z) - Catastrophic Overfitting: A Potential Blessing in Disguise [51.996943482875366]
FAT(Fast Adversarial Training)は、敵の堅牢性向上に効果があるとして、研究コミュニティ内で注目を集めている。
既存のFATアプローチではCOの緩和が進んでいるが, クリーンサンプルの分類精度が低下するにつれて, 対向ロバスト性の上昇が生じる。
クリーンな例と逆向きな例に特徴アクティベーションの相違を利用して,COの根本原因を分析した。
我々は, モデル性能を高めることを目的として, 「攻撃難読化」を実現するためにCOを活用する。
論文 参考訳(メタデータ) (2024-02-28T10:01:44Z) - COPR: Continual Human Preference Learning via Optimal Policy Regularization [54.4973136224034]
RLHF(Reinforcement Learning from Human Feedback)は、大規模言語モデル(LLM)と人間の嗜好の整合性を改善するために一般的に用いられる。
本稿では,最適政策理論からインスピレーションを得たCOPR法を提案する。
論文 参考訳(メタデータ) (2024-02-22T02:20:08Z) - EnduRL: Enhancing Safety, Stability, and Efficiency of Mixed Traffic Under Real-World Perturbations Via Reinforcement Learning [1.7273380623090846]
実世界の走行軌道を解析し、幅広い加速度プロファイルを抽出する。
次に、これらのプロファイルを、混雑を軽減するためにRVをトレーニングするためのシミュレーションに組み込む。
RVの安全性は最大66%向上し、効率は最大54%向上し、安定性は最大97%向上した。
論文 参考訳(メタデータ) (2023-11-21T00:45:13Z) - Deep Reinforcement Learning-based Intelligent Traffic Signal Controls
with Optimized CO2 emissions [6.851243292023835]
交通ネットワークは、人間の健康や環境に悪影響を及ぼし、交通渋滞に寄与する準最適制御政策の課題に直面している。
文献における適応的な信号制御装置はいくつかあるが、それらの比較性能について限定的な研究がなされている。
EcoLightは,CO2排出量を削減するだけでなく,旅行時間などの指標で競合する結果が得られる強化学習アルゴリズムの報酬形成手法である。
論文 参考訳(メタデータ) (2023-10-19T19:54:47Z) - Hybrid Reinforcement Learning for Optimizing Pump Sustainability in
Real-World Water Distribution Networks [55.591662978280894]
本稿では,実世界の配水ネットワーク(WDN)のリアルタイム制御を強化するために,ポンプスケジューリング最適化問題に対処する。
我々の主な目的は、エネルギー消費と運用コストを削減しつつ、物理的な運用上の制約を遵守することである。
進化に基づくアルゴリズムや遺伝的アルゴリズムのような伝統的な最適化手法は、収束保証の欠如によってしばしば不足する。
論文 参考訳(メタデータ) (2023-10-13T21:26:16Z) - Learning to Sail Dynamic Networks: The MARLIN Reinforcement Learning
Framework for Congestion Control in Tactical Environments [53.08686495706487]
本稿では, 正確な並列化可能なエミュレーション環境を利用して, 戦術ネットワークの環境を再現するRLフレームワークを提案する。
衛星通信(SATCOM)とUHFワイドバンド(UHF)の無線リンク間のボトルネックリンク遷移を再現した条件下で、MARLINエージェントを訓練することにより、我々のRL学習フレームワークを評価する。
論文 参考訳(メタデータ) (2023-06-27T16:15:15Z) - CCE: Sample Efficient Sparse Reward Policy Learning for Robotic Navigation via Confidence-Controlled Exploration [72.24964965882783]
CCE (Confidence-Controlled Exploration) は、ロボットナビゲーションのようなスパース報酬設定のための強化学習アルゴリズムのトレーニングサンプル効率を高めるために設計された。
CCEは、勾配推定と政策エントロピーの間の新しい関係に基づいている。
我々は、CCEが一定軌跡長とエントロピー正規化を用いる従来の手法より優れるシミュレーションおよび実世界の実験を通して実証する。
論文 参考訳(メタデータ) (2023-06-09T18:45:15Z) - Revealing the real-world CO2 emission reduction of ridesplitting and its
determinants based on machine learning [12.864925081071684]
本研究では,共有乗用車(ライドスプリット)のCO2排出量と代用単乗用車(レギュラーライドソーシング)を算出し,各乗用車走行のCO2排出量削減を推定する。
その結果、すべてのライドプリットトリップが、現実世界のライドソーシングから排出される排出を減少させるわけではないことがわかった。
論文 参考訳(メタデータ) (2022-04-02T06:25:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。