論文の概要: Deep Reinforcement Learning for Electric Vehicle Routing Problem with
Time Windows
- arxiv url: http://arxiv.org/abs/2010.02068v4
- Date: Fri, 13 Aug 2021 20:07:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-10 19:43:24.797279
- Title: Deep Reinforcement Learning for Electric Vehicle Routing Problem with
Time Windows
- Title(参考訳): タイムウインドウを用いた電気自動車経路問題の深層強化学習
- Authors: Bo Lin, Bissan Ghaddar, Jatin Nathwani
- Abstract要約: EVRPTWを解くために,エンドツーエンドの深層強化学習フレームワークを提案する。
特に,ポインタネットワークとグラフ埋め込みを取り入れたアテンションモデルを構築し,EVRPTWの解法をパラメータ化する。
本研究では,既存の手法では解けない大規模のEVRPTWインスタンスを効率的に解けることを示す。
- 参考スコア(独自算出の注目度): 2.1399409016552347
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The past decade has seen a rapid penetration of electric vehicles (EV) in the
market, more and more logistics and transportation companies start to deploy
EVs for service provision. In order to model the operations of a commercial EV
fleet, we utilize the EV routing problem with time windows (EVRPTW). In this
research, we propose an end-to-end deep reinforcement learning framework to
solve the EVRPTW. In particular, we develop an attention model incorporating
the pointer network and a graph embedding technique to parameterize a
stochastic policy for solving the EVRPTW. The model is then trained using
policy gradient with rollout baseline. Our numerical studies show that the
proposed model is able to efficiently solve EVRPTW instances of large sizes
that are not solvable with any existing approaches.
- Abstract(参考訳): 過去10年、電気自動車(EV)が急速に普及し、より多くの物流・輸送企業がサービス提供のためにEVを配備し始めている。
商用EVの運用をモデル化するために、時間窓付きEVルーティング問題(EVRPTW)を利用する。
本研究では,EVRPTWを解くためのエンドツーエンドの深層強化学習フレームワークを提案する。
特に,EVRPTWを解くための確率的ポリシーをパラメータ化するために,ポインタネットワークとグラフ埋め込み技術を組み合わせた注意モデルを開発する。
モデルは、ロールアウトベースラインのポリシ勾配を使用してトレーニングされる。
提案手法は,既存の手法では解けない大規模evrptwインスタンスを効率的に解くことができることを示す。
関連論文リスト
- Efficient Training of Large Vision Models via Advanced Automated Progressive Learning [96.71646528053651]
我々は、LVM(Large Vision Models)の効率的なトレーニングのための高度な自動プログレッシブラーニング(AutoProg)フレームワークを提案する。
我々はAutoProg-Zeroを導入し、新しいゼロショットフリーズスケジュールサーチによりAutoProgフレームワークを拡張した。
実験の結果、AutoProgはImageNetでViTの事前トレーニングを最大1.85倍加速し、拡散モデルの微調整を最大2.86倍加速する。
論文 参考訳(メタデータ) (2024-09-06T16:24:24Z) - Edge-DIRECT: A Deep Reinforcement Learning-based Method for Solving Heterogeneous Electric Vehicle Routing Problem with Time Window Constraints [4.852613028421959]
本稿では,時間制約付き異種電気自動車経路問題(HEVRPTW)について検討する。
We propose a DRL-based approach, named Edge-enhanced Dual attentIon encoderR and feature-EnhanCed dual attention decoder (Edge-DIRECT)。
2つの実世界のデータセットに基づく実験結果から、Edge-DIRECTは、最先端のDRLベースの手法と、ソリューションの品質と実行時間の確立したアプローチよりも優れていることが明らかになった。
論文 参考訳(メタデータ) (2024-06-28T03:18:12Z) - MOTO: Offline Pre-training to Online Fine-tuning for Model-based Robot
Learning [52.101643259906915]
本研究では,高次元観測による強化学習におけるオフライン事前学習とオンラインファインチューニングの問題について検討する。
既存のモデルベースオフラインRL法は高次元領域におけるオフラインからオンラインへの微調整には適していない。
本稿では,事前データをモデルベース値拡張とポリシー正則化によって効率的に再利用できるオンラインモデルベース手法を提案する。
論文 参考訳(メタデータ) (2024-01-06T21:04:31Z) - A Deep Q-Learning based Smart Scheduling of EVs for Demand Response in
Smart Grids [0.0]
本研究では、Deep Q-Learningを利用して、マイクログリッド内におけるEVの充電および排出活動のスケジューリングを行うモデルフリーソリューションを提案する。
我々は,EVスケジューリング動作に対する特定の報酬に基づいて状態の値を評価するためにベルマン方程式を適用し,ニューラルネットワークを用いて利用可能な動作に対するQ値とエプシロングレーディアルゴリズムを用いて,目標エネルギープロファイルを満たすために,エクスプロイトと探索のバランスをとる。
論文 参考訳(メタデータ) (2024-01-05T06:04:46Z) - Federated Reinforcement Learning for Electric Vehicles Charging Control
on Distribution Networks [42.04263644600909]
マルチエージェント深部強化学習(MADRL)はEV充電制御において有効であることが証明されている。
既存のMADRLベースのアプローチでは、配電ネットワークにおけるEV充電/放電の自然な電力フローを考慮できない。
本稿では,マルチEV充電/放電と最適電力流で動作する放射分布ネットワーク(RDN)を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2023-08-17T05:34:46Z) - COOPERNAUT: End-to-End Driving with Cooperative Perception for Networked
Vehicles [54.61668577827041]
本稿では,車間認識を用いたエンドツーエンド学習モデルであるCOOPERNAUTを紹介する。
われわれのAutoCastSim実験は、我々の協調知覚駆動モデルが平均成功率を40%向上させることを示唆している。
論文 参考訳(メタデータ) (2022-05-04T17:55:12Z) - A Reinforcement Learning Approach for Electric Vehicle Routing Problem
with Vehicle-to-Grid Supply [2.6066825041242367]
EVルーティングに強化学習(RL)を用いたQuikRouteFinderを提案する。
RLの結果は混合整数線形プログラム(MILP)と遺伝的アルゴリズム(GA)のメタヒューリスティックスに基づく正確な定式化と比較される。
論文 参考訳(メタデータ) (2022-04-12T06:13:06Z) - An Energy Consumption Model for Electrical Vehicle Networks via Extended
Federated-learning [50.85048976506701]
本稿では,フェデレートラーニングモデルに基づく不安度を測る新しい手法を提案する。
バッテリー消費を推定し、車両ネットワークにエネルギー効率の高いルートプランニングを提供する。
論文 参考訳(メタデータ) (2021-11-13T15:03:44Z) - Real-world Ride-hailing Vehicle Repositioning using Deep Reinforcement
Learning [52.2663102239029]
アイドルヘイリングプラットフォーム上での現実世界の車両の深層強化学習と意思決定時間計画に基づく新しい実用的枠組みを提示する。
本手法は,重み付きバッチ学習アルゴリズムを用いて乗車時の状態値関数を学習する。
配車シミュレーション環境におけるベースラインでアルゴリズムをベンチマークし、収益効率の向上における優位性を実証します。
論文 参考訳(メタデータ) (2021-03-08T05:34:05Z) - A Reinforcement Learning Approach for Rebalancing Electric Vehicle
Sharing Systems [3.0553868534759725]
本稿では,フリーフローティング電気自動車共有システム(FFEVSS)における夜間オフラインリバランス運用のための強化学習手法を提案する。
ネットワークの需要が少なかったため、FFEVSSは充電ステーションや需要ノードに電気自動車(EV)を移動させる必要があり、通常はドライバーのグループによって行われる。
本稿では,複数のシャトル車両の経路方針を中央制御器が決定する問題に対する強化学習の枠組みを検討する。
論文 参考訳(メタデータ) (2020-10-05T22:24:36Z) - Data Freshness and Energy-Efficient UAV Navigation Optimization: A Deep
Reinforcement Learning Approach [88.45509934702913]
我々は、移動基地局(BS)が配備される複数の無人航空機(UAV)のナビゲーションポリシーを設計する。
我々は、地上BSにおけるデータの鮮度を確保するために、エネルギーや情報年齢(AoI)の制約などの異なる文脈情報を組み込んだ。
提案したトレーニングモデルを適用することで、UAV-BSに対する効果的なリアルタイム軌道ポリシーは、時間とともに観測可能なネットワーク状態をキャプチャする。
論文 参考訳(メタデータ) (2020-02-21T07:29:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。