論文の概要: Learning to Route Electric Trucks Under Operational Uncertainty
- arxiv url: http://arxiv.org/abs/2604.26566v1
- Date: Wed, 29 Apr 2026 11:52:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.379382
- Title: Learning to Route Electric Trucks Under Operational Uncertainty
- Title(参考訳): 運転不確実性下での電気トラックの経路学習
- Authors: Stavros Orfanoudakis, Ziyan Li, Ruixiao Yang, Nikolay Aristov, Pedro P. Vergara, Chuchu Fan, Elenna Dugundji,
- Abstract要約: 電気トラックの運転には、限られたバッテリー範囲、長時間の充電時間、旅行とエネルギー消費、および共有充電インフラの競争で実現可能な経路決定が必要である。
本稿では,充電制約と運転不確実性を考慮した電気トラックルーティングのための学習型フレームワークを提案する。
- 参考スコア(独自算出の注目度): 15.257859768945707
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Electric truck operations require routing decisions that remain feasible under limited battery range, long charging times, travel and energy consumption, and competition for shared charging infrastructure. These features make electric truck routing a coupled logistics and energy problem, limiting the practicality of heuristics-based methods and rendering them computationally infeasible at scale. This paper proposes a learning-based framework for the stochastic electric truck routing under charging constraints and operational uncertainty. The problem, solved by Reinforcement Learning, is formulated as an event-driven semi-Markov decision process with shared charging resources, stochastic travel and energy requirements, and realistic nonlinear fast-charging behavior. To support learning in this setting, a graph-based representation of system state and feasible decisions is introduced, together with a rule-based action mask that restricts policies to operationally admissible actions; thus, improving training efficiency. Building on this formulation, an event-driven simulation environment is developed that supports both Reinforcement Learning and benchmarking against heuristic and mathematical programming baselines. Computational experiments across a range of fleet sizes show that the proposed learning-based algorithm consistently outperforms baselines and attains performance close to optimization benchmarks in many settings, while preserving high success rates under charging congestion and uncertainty.
- Abstract(参考訳): 電気トラックの運転には、限られたバッテリー範囲、長時間の充電時間、旅行とエネルギー消費、および共有充電インフラの競争で実現可能な経路決定が必要である。
これらの特徴は、電気トラックの経路を結合した物流とエネルギーの問題にし、ヒューリスティックスに基づく手法の実用性を制限し、大規模に計算不能にする。
本稿では,充電制約と運転不確実性を考慮した確率的電気トラックルーティングのための学習ベースフレームワークを提案する。
強化学習(Reinforcement Learning)によって解決されたこの問題は、共有充電資源、確率的移動とエネルギー要求、現実的な非線形高速充電動作を備えたイベント駆動半マルコフ決定プロセスとして定式化されている。
この環境での学習を支援するため、ルールベースのアクションマスクとともに、システム状態と実行可能な決定のグラフベースの表現を導入し、ポリシーを運用上許容可能なアクションに制限し、トレーニング効率を向上させる。
この定式化に基づいて、強化学習とヒューリスティックおよび数学的プログラミングベースラインに対するベンチマークの両方をサポートするイベント駆動シミュレーション環境が開発された。
様々な艦隊規模の計算実験により、提案した学習ベースアルゴリズムはベースラインを一貫して上回り、多くの設定で最適化ベンチマークに近い性能を得る一方で、充電の混雑と不確実性の下で高い成功率を保っていることが示された。
関連論文リスト
- Multi-Objective Reinforcement Learning for Efficient Tactical Decision Making for Trucks in Highway Traffic [8.166690500441243]
近似ポリシー最適化に基づく多目的強化学習フレームワークを提案する。
ハイウェイ運転におけるトレードオフを明確に示す一連のポリシーを学習する。
異なる運転ポリシー間のシームレスな移行を可能にする。
論文 参考訳(メタデータ) (2026-01-26T18:50:21Z) - COVLM-RL: Critical Object-Oriented Reasoning for Autonomous Driving Using VLM-Guided Reinforcement Learning [55.83415345423854]
批判的オブジェクト指向(CO)推論と強化学習(RL)を統合した新しいエンドツーエンド駆動フレームワークCOVLM-RLを提案する。
CARLAシミュレータで行った実験により、COVLM-RLはトレーニング運転環境における成功率を30%向上することが示された。
論文 参考訳(メタデータ) (2025-12-10T06:18:16Z) - Optimizing Load Scheduling in Power Grids Using Reinforcement Learning and Markov Decision Processes [0.0]
本稿では,動的負荷スケジューリングの課題に対処する強化学習(RL)手法を提案する。
提案手法は実時間負荷スケジューリングのためのロバストでスケーラブルなソリューションを提供する。
論文 参考訳(メタデータ) (2024-10-23T09:16:22Z) - Resilient Constrained Learning [94.27081585149836]
本稿では,学習課題を同時に解決しながら,要求に適応する制約付き学習手法を提案する。
我々はこの手法を、その操作を変更することで破壊に適応する生態システムを記述する用語に因んで、レジリエントな制約付き学習と呼ぶ。
論文 参考訳(メタデータ) (2023-06-04T18:14:18Z) - DClEVerNet: Deep Combinatorial Learning for Efficient EV Charging
Scheduling in Large-scale Networked Facilities [5.78463306498655]
電気自動車(EV)は配電ネットワークを著しくストレスし、性能を劣化させ、安定性を損なう可能性がある。
現代の電力網は、EV充電スケジューリングをスケーラブルで効率的な方法で最適化できる、コーディネートまたはスマートな充電戦略を必要とする。
ネットワークの利用可能な電力容量とステーションの占有限度を考慮しつつ、EV利用者の総福祉利益を最大化する時間結合二元最適化問題を定式化する。
論文 参考訳(メタデータ) (2023-05-18T14:03:47Z) - Dynamic Scheduling for Over-the-Air Federated Edge Learning with Energy
Constraints [44.311278843238675]
アナログ勾配アグリゲーションを用いた空対空FEELシステムについて検討する。
トレーニング性能を最適化するために,エネルギーを考慮した動的デバイススケジューリングアルゴリズムを提案する。
高度に不均衡なローカルデータ分布の下では、提案アルゴリズムは精度を4.9%向上させることができる。
論文 参考訳(メタデータ) (2021-05-31T08:55:02Z) - Strictly Batch Imitation Learning by Energy-based Distribution Matching [104.33286163090179]
すなわち、強化信号へのアクセスがなく、遷移力学の知識がなく、環境とのさらなる相互作用もない。
1つの解決策は、既存のアルゴリズムをオフライン環境で動作させるために、見習いの学習に適合させることである。
しかし、このようなアプローチは、政治外の評価やオフラインモデルの推定に大きく依存しており、間接的で非効率である可能性がある。
優れたソリューションは、ポリシーを明示的にパラメータ化し、ロールアウトダイナミクスから暗黙的に学習し、完全にオフラインで運用できるべきだ、と私たちは主張する。
論文 参考訳(メタデータ) (2020-06-25T03:27:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。