論文の概要: Multi-Agent Deep Reinforcement Learning for Distributed and Autonomous Platoon Coordination via Speed-regulation over Large-scale Transportation Networks
- arxiv url: http://arxiv.org/abs/2412.01075v1
- Date: Mon, 02 Dec 2024 03:21:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:49:26.017108
- Title: Multi-Agent Deep Reinforcement Learning for Distributed and Autonomous Platoon Coordination via Speed-regulation over Large-scale Transportation Networks
- Title(参考訳): 大規模輸送ネットワーク上での速度制御による分散型・自律プラトン調整のためのマルチエージェント深層強化学習
- Authors: Dixiao Wei, Peng Yi, Jinlong Lei, Xingyi Zhu,
- Abstract要約: トラック小隊技術により、トラックのグループは、燃料を節約し、交通効率を向上し、安全性を向上させることができる。
本稿では,大規模輸送ネットワークにおける小隊調整の問題について考察し,トラック間の連携を促進し,全体の効率を最適化する。
- 参考スコア(独自算出の注目度): 2.4919288454226796
- License:
- Abstract: Truck platooning technology enables a group of trucks to travel closely together, with which the platoon can save fuel, improve traffic flow efficiency, and improve safety. In this paper, we consider the platoon coordination problem in a large-scale transportation network, to promote cooperation among trucks and optimize the overall efficiency. Involving the regulation of both speed and departure times at hubs, we formulate the coordination problem as a complicated dynamic stochastic integer programming under network and information constraints. To get an autonomous, distributed, and robust platoon coordination policy, we formulate the problem into a model of the Decentralized-Partial Observable Markov Decision Process. Then, we propose a Multi-Agent Deep Reinforcement Learning framework named Trcuk Attention-QMIX (TA-QMIX) to train an efficient online decision policy. TA-QMIX utilizes the attention mechanism to enhance the representation of truck fuel gains and delay times, and provides explicit truck cooperation information during the training process, promoting trucks' willingness to cooperate. The training framework adopts centralized training and distributed execution, thus training a policy for trucks to make decisions online using only nearby information. Hence, the policy can be autonomously executed on a large-scale network. Finally, we perform comparison experiments and ablation experiments in the transportation network of the Yangtze River Delta region in China to verify the effectiveness of the proposed framework. In a repeated comparative experiment with 5,000 trucks, our method average saves 19.17\% of fuel with an average delay of only 9.57 minutes per truck and a decision time of 0.001 seconds.
- Abstract(参考訳): トラック小隊技術により、トラックのグループは、燃料を節約し、交通効率を向上し、安全性を向上させることができる。
本稿では,大規模輸送ネットワークにおける小隊調整の問題について考察し,トラック間の連携を促進し,全体の効率を最適化する。
ハブにおける速度と出発時間の両方の制御を巻き込み、ネットワークおよび情報制約下での複雑な動的確率的整数プログラミングとしてコーディネーション問題を定式化する。
自律的で分散的でロバストな小隊調整政策を得るために、我々は問題を分散・パーティル可観測マルコフ決定プロセスのモデルに定式化する。
そこで我々は,Trcuk Attention-QMIX (TA-QMIX) というマルチエージェント深層強化学習フレームワークを提案する。
TA-QMIXは、トラックの燃料利得と遅延時間の表現を強化するために注意機構を利用し、トレーニングプロセス中に明示的なトラック協力情報を提供し、トラックの協力意欲を促進する。
トレーニングフレームワークは集中的なトレーニングと分散実行を採用しており、近くの情報のみを使用して、トラックがオンラインで意思決定を行うためのポリシーをトレーニングする。
したがって、このポリシーは大規模ネットワーク上で自律的に実行される。
最後に,中国長江デルタ地域の交通ネットワークにおける比較実験とアブレーション実験を行い,提案手法の有効性を検証した。
5000台のトラックで行った比較実験では, 平均19.17\%の燃料を節約し, 平均遅延は9.57分, 決定時間は0.001秒であった。
関連論文リスト
- Federated Data-Driven Kalman Filtering for State Estimation [49.40531019551957]
本稿では,協調学習やフェデレート学習のパラダイムに基づく,新たなローカライゼーションフレームワークを提案する。
我々は、従来の拡張カルマンフィルタの基盤となるシステム不確実性を推定することを目的とした、リカレントニューラルネットワークであるKalmanNetの標準的なアプローチに基づいて構築する。
FedKalmanNetは、関連するシステム不確実性行列を推定することにより、各車両が自身をローカライズするために使用される。
論文 参考訳(メタデータ) (2024-11-06T16:18:33Z) - Towards Interactive and Learnable Cooperative Driving Automation: a Large Language Model-Driven Decision-Making Framework [79.088116316919]
コネクテッド・オートモービルズ(CAV)は世界中の道路試験を開始したが、複雑なシナリオにおける安全性と効率性はまだ十分ではない。
本稿では,対話型かつ学習可能なLLM駆動協調運転フレームワークCoDrivingLLMを提案する。
論文 参考訳(メタデータ) (2024-09-19T14:36:00Z) - Shared learning of powertrain control policies for vehicle fleets [3.9325957466009203]
深部強化学習(DRL)は、燃料経済やその他のパフォーマンス指標を最適化するパワートレイン制御ポリシーを現場で学習することを目的としている。
本稿では, 蒸留グループ政策を用いて, 車両群間で共有学習を行うための新しい枠組みを提案する。
ベースラインに比べて燃料経済は平均8.5%改善している。
論文 参考訳(メタデータ) (2024-04-27T13:01:05Z) - Learning to Help Emergency Vehicles Arrive Faster: A Cooperative
Vehicle-Road Scheduling Approach [24.505687255063986]
車両中心のスケジューリングアプローチは、緊急車両の最適経路を推奨する。
道路中心のスケジューリングアプローチは、交通状況を改善し、EVが交差点を通過するための優先度を高めることを目的としている。
本稿では,リアルタイム経路計画モジュールと協調交通信号制御モジュールを含む協調型VehIcle-roaDスケジューリング手法であるLEVIDを提案する。
論文 参考訳(メタデータ) (2022-02-20T10:25:15Z) - CoTV: Cooperative Control for Traffic Light Signals and Connected
Autonomous Vehicles using Deep Reinforcement Learning [6.54928728791438]
本稿では,マルチエージェント深部強化学習(DRL)システムであるCoTVについて述べる。
CoTVは、交通信号とコネクテッド・オートモービル(CAV)の両方を協調的に制御する
一方、COTVは、入ってくる道路の信号管制官に最も近い1つのCAVと協力することで、容易に展開できる。
論文 参考訳(メタデータ) (2022-01-31T11:40:13Z) - A Deep Value-network Based Approach for Multi-Driver Order Dispatching [55.36656442934531]
そこで本研究では,注文発送のための深層強化学習に基づくソリューションを提案する。
DiDiの配車プラットフォーム上で大規模なオンラインA/Bテストを実施している。
その結果,CVNetは近年提案されているディスパッチ手法よりも一貫して優れていた。
論文 参考訳(メタデータ) (2021-06-08T16:27:04Z) - A Modular and Transferable Reinforcement Learning Framework for the
Fleet Rebalancing Problem [2.299872239734834]
モデルフリー強化学習(RL)に基づく艦隊再バランスのためのモジュラーフレームワークを提案する。
動作領域のグリッド上の分布としてRL状態とアクション空間を定式化し,フレームワークをスケーラブルにする。
実世界の旅行データとネットワークデータを用いた数値実験は、このアプローチがベースライン法よりもいくつかの異なる利点があることを実証している。
論文 参考訳(メタデータ) (2021-05-27T16:32:28Z) - Value Function is All You Need: A Unified Learning Framework for Ride
Hailing Platforms [57.21078336887961]
DiDi、Uber、Lyftなどの大型配車プラットフォームは、都市内の数万台の車両を1日中数百万の乗車要求に接続している。
両課題に対処するための統合価値に基づく動的学習フレームワーク(V1D3)を提案する。
論文 参考訳(メタデータ) (2021-05-18T19:22:24Z) - Flatland Competition 2020: MAPF and MARL for Efficient Train
Coordination on a Grid World [49.80905654161763]
車両再スケジュール問題(vrsp)の解法開発を目的としたフラットランドコンペティション
VRSPは、交通ネットワークにおける旅行のスケジュールと、故障が発生した場合の車両の再スケジュールに関するものである。
現代の鉄道網の複雑化は、交通の動的リアルタイムスケジューリングを事実上不可能にします。
論文 参考訳(メタデータ) (2021-03-30T17:13:29Z) - Vehicular Cooperative Perception Through Action Branching and Federated
Reinforcement Learning [101.64598586454571]
強化学習に基づく車両関連、リソースブロック(RB)割り当て、協調認識メッセージ(CPM)のコンテンツ選択を可能にする新しいフレームワークが提案されている。
車両全体のトレーニングプロセスをスピードアップするために、フェデレーションRLアプローチが導入されます。
その結果、フェデレーションRLはトレーニングプロセスを改善し、非フェデレーションアプローチと同じ時間内により良いポリシーを達成できることが示された。
論文 参考訳(メタデータ) (2020-12-07T02:09:15Z) - Mining Truck Platooning Patterns Through Massive Trajectory Data [9.559029665817656]
トラック小隊を適切に計画し、トラック小隊の可能性を評価することは、交通機関にとって不可欠である。
本研究では,大規模軌道から自発トラック小隊パターンを学習するための一連のデータマイニング手法を提案する。
我々は,中国梁寧省のトラック輸送システムから収集した実データを利用して,小隊成績を評価し,小隊パターンの抽出に成功した。
論文 参考訳(メタデータ) (2020-10-11T02:44:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。