論文の概要: DQN Control Solution for KDD Cup 2021 City Brain Challenge
- arxiv url: http://arxiv.org/abs/2108.06491v1
- Date: Sat, 14 Aug 2021 08:32:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-17 14:55:55.956953
- Title: DQN Control Solution for KDD Cup 2021 City Brain Challenge
- Title(参考訳): kdd cup 2021 都市脳チャレンジのためのdqn制御ソリューション
- Authors: Yitian Chen and Kunlong Chen and Kunjin Chen and Lin Wang
- Abstract要約: 私たちは市内のブレインチャレンジコンテストに参加し、8位を獲得しました。
この競技では、実際の交通データから都市規模の道路網と交通需要が提供される。
プレイヤーは自設計のエージェントと信号の調整を依頼され、許容できる遅延を維持しながら提供される車両の数を最大化する。
- 参考スコア(独自算出の注目度): 5.826801720733005
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We took part in the city brain challenge competition and achieved the 8th
place. In this competition, the players are provided with a real-world
city-scale road network and its traffic demand derived from real traffic data.
The players are asked to coordinate the traffic signals with a self-designed
agent to maximize the number of vehicles served while maintaining an acceptable
delay. In this abstract paper, we present an overall analysis and our detailed
solution to this competition. Our approach is mainly based on the adaptation of
the deep Q-network (DQN) for real-time traffic signal control. From our
perspective, the major challenge of this competition is how to extend the
classical DQN framework to traffic signals control in real-world complex road
network and traffic flow situation. After trying and implementing several
classical reward functions, we finally chose to apply our newly-designed reward
in our agent. By applying our newly-proposed reward function and carefully
tuning the control scheme, an agent based on a single DQN model can rank among
the top 15 teams. We hope this paper could serve, to some extent, as a baseline
solution to traffic signal control of real-world road network and inspire
further attempts and researches.
- Abstract(参考訳): 私たちは、city brain challengeコンテストに参加し、第8位を獲得しました。
このコンペティションでは、プレイヤーは実世界の都市規模の道路網と、その交通需要が実際の交通データから得られる。
プレイヤーは自設計のエージェントと信号の調整を依頼され、許容できる遅延を維持しながら提供される車両の数を最大化する。
本稿では,このコンペティションに対する総合分析と詳細な解法について述べる。
提案手法は主に,リアルタイム信号制御のためのディープQネットワーク(DQN)の適応に基づいている。
我々の見解では、この競争の大きな課題は、現実世界の複雑な道路網と交通流状況において、従来のDQNフレームワークを交通信号制御にどのように拡張するかである。
いくつかの古典的な報酬関数を試行した後、私たちは最終的に、新しく設計された報酬をエージェントに適用することにしました。
新たに提案した報酬関数を適用し、制御スキームを慎重にチューニングすることで、単一のDQNモデルに基づくエージェントがトップ15チームの中でランク付けできる。
この論文は、現実世界の道路網の交通信号制御のベースラインソリューションとしてある程度機能し、さらなる試みや研究を刺激できることを願っている。
関連論文リスト
- Towards Multi-agent Reinforcement Learning based Traffic Signal Control through Spatio-temporal Hypergraphs [19.107744041461316]
交通信号制御システム(TSCS)は、インテリジェントな交通管理に不可欠なものであり、効率的な車両の流れを育んでいる。
従来のアプローチでは、道路網を標準的なグラフに単純化することが多い。
本稿では,インテリジェントトラフィック制御を実現するための新しいTSCSフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-17T02:46:18Z) - DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。
従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。
DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文 参考訳(メタデータ) (2023-06-13T05:58:57Z) - A Novel Multi-Agent Deep RL Approach for Traffic Signal Control [13.927155702352131]
都市ネットワークにおける複数の交通信号制御のための Friend-Deep Q-network (Friend-DQN) アプローチを提案する。
特に、複数のエージェント間の協調は状態-作用空間を減少させ、収束を加速させる。
論文 参考訳(メタデータ) (2023-06-05T08:20:37Z) - Transposed Variational Auto-encoder with Intrinsic Feature Learning for
Traffic Forecasting [23.120977536899424]
我々は、Traffic4cast 2022のコアチャレンジと拡張チャレンジにソリューションを提示します。
この競技では、参加者は、前時間における車両カウンターデータに基づいて、将来の15分間の交通状況を予測する必要がある。
私たちのソリューションは、両方の課題において、最終リーダーボードで第1位にランクされています。
論文 参考訳(メタデータ) (2022-10-30T13:15:19Z) - Traffic4cast at NeurIPS 2021 -- Temporal and Spatial Few-Shot Transfer
Learning in Gridded Geo-Spatial Processes [61.16854022482186]
NeurIPS 2019と2020のIARAI Traffic4castコンペティションでは、ニューラルネットワークが将来の交通条件を1時間以内に予測することに成功した。
U-Netsは、この複雑な現実世界の地理空間的プロセスにおいて、関連する特徴を抽出する能力を実証し、勝利したアーキテクチャであることが証明された。
コンペティションは2年間で10都市をカバーし、1012以上のGPSプローブデータから収集したデータを提供する。
論文 参考訳(メタデータ) (2022-03-31T14:40:01Z) - Solving Traffic4Cast Competition with U-Net and Temporal Domain
Adaptation [0.0]
我々は、Traffic4Cast 2021 Core Challengeにソリューションを提示する。
この課題は、新型コロナウイルスのパンデミックによるトラフィックの時間的ドメインシフトに焦点を当てている。
我々の解決策は決勝戦で3位になった。
論文 参考訳(メタデータ) (2021-11-05T11:49:52Z) - Road Network Guided Fine-Grained Urban Traffic Flow Inference [108.64631590347352]
粗いトラフィックからのきめ細かなトラフィックフローの正確な推測は、新たな重要な問題である。
本稿では,道路ネットワークの知識を活かした新しい道路対応交通流磁化器(RATFM)を提案する。
提案手法は,高品質なトラフィックフローマップを作成できる。
論文 参考訳(メタデータ) (2021-09-29T07:51:49Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Flatland Competition 2020: MAPF and MARL for Efficient Train
Coordination on a Grid World [49.80905654161763]
車両再スケジュール問題(vrsp)の解法開発を目的としたフラットランドコンペティション
VRSPは、交通ネットワークにおける旅行のスケジュールと、故障が発生した場合の車両の再スケジュールに関するものである。
現代の鉄道網の複雑化は、交通の動的リアルタイムスケジューリングを事実上不可能にします。
論文 参考訳(メタデータ) (2021-03-30T17:13:29Z) - A Software Architecture for Autonomous Vehicles: Team LRM-B Entry in the
First CARLA Autonomous Driving Challenge [49.976633450740145]
本稿では,シミュレーション都市環境における自律走行車両のナビゲーション設計について述べる。
我々のアーキテクチャは、CARLA Autonomous Driving Challengeの要件を満たすために作られました。
論文 参考訳(メタデータ) (2020-10-23T18:07:48Z) - Area-wide traffic signal control based on a deep graph Q-Network (DGQN)
trained in an asynchronous manner [3.655021726150368]
強化学習(RL)アルゴリズムは交通信号研究に広く応用されている。
しかし,大規模交通ネットワークにおける信号機の共同制御にはいくつかの問題がある。
論文 参考訳(メタデータ) (2020-08-05T06:13:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。