論文の概要: Applying Neural Monte Carlo Tree Search to Unsignalized Multi-intersection Scheduling for Autonomous Vehicles
- arxiv url: http://arxiv.org/abs/2410.18786v1
- Date: Thu, 24 Oct 2024 14:37:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-25 16:43:41.648232
- Title: Applying Neural Monte Carlo Tree Search to Unsignalized Multi-intersection Scheduling for Autonomous Vehicles
- Title(参考訳): ニューラルモンテカルロ木探索を自律走行車用無署名多区間スケジューリングに適用する
- Authors: Yucheng Shi, Wenlong Wang, Xiaowen Tao, Ivana Dusparic, Vinny Cahill,
- Abstract要約: 本稿では,車両のプラトンからの道路空間予約要求と競合する可能性のある道路空間予約要求のシーケンスを,ボードゲームのような一連の問題にマッピングする変換モデルを提案する。
我々はNMCTSを用いて、過去のアロケーションの文脈で最適な道路空間割り当てスケジュールを表すソリューションを探索する。
提案手法は,全交差点がPNMCTSの制御下にある場合,平均走行時間74.5%,総スループット16%のPNMCTSおよび最先端のRLベースのトラヒックライトコントローラよりも高い性能を示した。
- 参考スコア(独自算出の注目度): 7.32653612106583
- License:
- Abstract: Dynamic scheduling of access to shared resources by autonomous systems is a challenging problem, characterized as being NP-hard. The complexity of this task leads to a combinatorial explosion of possibilities in highly dynamic systems where arriving requests must be continuously scheduled subject to strong safety and time constraints. An example of such a system is an unsignalized intersection, where automated vehicles' access to potential conflict zones must be dynamically scheduled. In this paper, we apply Neural Monte Carlo Tree Search (NMCTS) to the challenging task of scheduling platoons of vehicles crossing unsignalized intersections. Crucially, we introduce a transformation model that maps successive sequences of potentially conflicting road-space reservation requests from platoons of vehicles into a series of board-game-like problems and use NMCTS to search for solutions representing optimal road-space allocation schedules in the context of past allocations. To optimize search, we incorporate a prioritized re-sampling method with parallel NMCTS (PNMCTS) to improve the quality of training data. To optimize training, a curriculum learning strategy is used to train the agent to schedule progressively more complex boards culminating in overlapping boards that represent busy intersections. In a busy single four-way unsignalized intersection simulation, PNMCTS solved 95\% of unseen scenarios, reducing crossing time by 43\% in light and 52\% in heavy traffic versus first-in, first-out control. In a 3x3 multi-intersection network, the proposed method maintained free-flow in light traffic when all intersections are under control of PNMCTS and outperformed state-of-the-art RL-based traffic-light controllers in average travel time by 74.5\% and total throughput by 16\% in heavy traffic.
- Abstract(参考訳): 自律システムによる共有リソースへのアクセスの動的スケジューリングは、NPハードとして特徴付けられる難しい問題である。
このタスクの複雑さは、強い安全性と時間的制約の下で、到着要求を継続的にスケジュールしなければならない非常にダイナミックなシステムにおいて、コンビネータ的な可能性の爆発を引き起こします。
そのようなシステムの例としては、自動車両の潜在的な競合ゾーンへのアクセスを動的にスケジュールする必要がある、符号のない交差点がある。
本稿では,ニューラルモンテカルロ木探索(NMCTS)を,信号のない交差点を横断する車両のプラトンをスケジューリングする難しい課題に適用する。
重要なことは、車両のプラトンからの潜在的に矛盾する道路空間予約要求を一連のボードゲームのような問題にマッピングする変換モデルを導入し、過去のアロケーションの文脈で最適な道路空間割り当てスケジュールを表すソリューションを探索するためにNTCTSを使用する。
探索を最適化するために、並列NMCTS (PNMCTS) を用いた優先順位付け再サンプリング手法を導入し、トレーニングデータの質を向上させる。
トレーニングを最適化するために、エージェントを訓練するためにカリキュラム学習戦略が使用され、忙しい交差点を表す重なり合うボードで終わるより複雑なボードを徐々にスケジュールする。
PNMCTSは、多忙な4方向無署名の交差点シミュレーションにおいて、95 %の未確認シナリオを解決し、光量43 %、交通量52 %を減らした。
提案手法は,PNMCTSと最先端のRL方式のトラヒックライトコントローラを,平均走行時間74.5\%,全スループット16\%で上回った場合,光トラフィックのフリーフローを維持した。
関連論文リスト
- Improving Traffic Flow Predictions with SGCN-LSTM: A Hybrid Model for Spatial and Temporal Dependencies [55.2480439325792]
本稿ではSGCN-LSTM(Signal-Enhanced Graph Convolutional Network Long Short Term Memory)モデルを提案する。
PEMS-BAYロードネットワークトラフィックデータセットの実験は、SGCN-LSTMモデルの有効性を示す。
論文 参考訳(メタデータ) (2024-11-01T00:37:00Z) - Towards Multi-agent Reinforcement Learning based Traffic Signal Control through Spatio-temporal Hypergraphs [19.107744041461316]
交通信号制御システム(TSCS)は、インテリジェントな交通管理に不可欠なものであり、効率的な車両の流れを育んでいる。
従来のアプローチでは、道路網を標準的なグラフに単純化することが多い。
本稿では,インテリジェントトラフィック制御を実現するための新しいTSCSフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-17T02:46:18Z) - Adaptive Hierarchical SpatioTemporal Network for Traffic Forecasting [70.66710698485745]
本稿では,AHSTN(Adaptive Hierarchical SpatioTemporal Network)を提案する。
AHSTNは空間階層を利用し、マルチスケール空間相関をモデル化する。
2つの実世界のデータセットの実験により、AHSTNはいくつかの強いベースラインよりも優れたパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2023-06-15T14:50:27Z) - DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。
従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。
DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文 参考訳(メタデータ) (2023-06-13T05:58:57Z) - Real-time Cooperative Vehicle Coordination at Unsignalized Road
Intersections [7.860567520771493]
信号のない道路交差点での協調作業は、連結車両と自動車両の安全運転交通スループットを向上させることを目的としている。
我々はモデルフリーなマルコフ決定プロセス(MDP)を導入し、深層強化学習フレームワークにおける双遅延Deep Deterministic Policy(TD3)に基づく戦略によりそれに取り組む。
提案手法は, 準定常調整シナリオにおいて, ほぼ最適性能を達成し, 現実的な連続流れの制御を大幅に改善できることが示唆された。
論文 参考訳(メタデータ) (2022-05-03T02:56:02Z) - Intelligent Autonomous Intersection Management [1.3534683694551497]
本稿では、強化学習に基づくマルチエージェントアーキテクチャと、マルチディスカウントQ-ラーニングを用いた新しいRLアルゴリズムを提案する。
実験結果から, RLをベースとしたマルチエージェント・ソリューションは, ほぼ最適性能を効率よく達成できることが示唆された。
論文 参考訳(メタデータ) (2022-02-09T01:45:12Z) - Integrated Decision and Control at Multi-Lane Intersections with Mixed
Traffic Flow [6.233422723925688]
本稿では,混在交通流を伴う複雑な交差点を扱うための学習に基づくアルゴリズムを提案する。
まず、学習過程における緑と赤の異なる速度モデルについて検討し、有限状態マシンを用いて異なるモードの光変換を扱う。
次に, 車両, 信号機, 歩行者, 自転車にそれぞれ異なる種類の距離制約を設計し, 制約された最適制御問題をフォーミュレートする。
論文 参考訳(メタデータ) (2021-08-30T07:55:32Z) - Better than the Best: Gradient-based Improper Reinforcement Learning for
Network Scheduling [60.48359567964899]
パケット遅延を最小限に抑えるため,制約付き待ち行列ネットワークにおけるスケジューリングの問題を考える。
我々は、利用可能な原子ポリシーよりも優れたスケジューラを生成するポリシー勾配に基づく強化学習アルゴリズムを使用する。
論文 参考訳(メタデータ) (2021-05-01T10:18:34Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Batch-Augmented Multi-Agent Reinforcement Learning for Efficient Traffic
Signal Optimization [9.456254189014127]
提案手法は,現在使用されている固定時間信号機に比べて,待ち時間において交通渋滞を36%削減する。
提案手法は,現在使用されている固定時間信号計画と比較して,待ち時間において渋滞を36%低減することを示す。
論文 参考訳(メタデータ) (2020-05-19T17:53:05Z) - Reinforcement Learning Based Vehicle-cell Association Algorithm for
Highly Mobile Millimeter Wave Communication [53.47785498477648]
本稿では,ミリ波通信網における車とセルの関連性について検討する。
まず、ユーザ状態(VU)問題を離散的な非車両関連最適化問題として定式化する。
提案手法は,複数のベースライン設計と比較して,ユーザの複雑性とVUEの20%削減の合計で最大15%のゲインが得られる。
論文 参考訳(メタデータ) (2020-01-22T08:51:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。