論文の概要: DuaLight: Enhancing Traffic Signal Control by Leveraging
Scenario-Specific and Scenario-Shared Knowledge
- arxiv url: http://arxiv.org/abs/2312.14532v1
- Date: Fri, 22 Dec 2023 08:57:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-25 15:38:47.723204
- Title: DuaLight: Enhancing Traffic Signal Control by Leveraging
Scenario-Specific and Scenario-Shared Knowledge
- Title(参考訳): DuaLight: シナリオ特有かつシナリオ共有知識を活用した交通信号制御の強化
- Authors: Jiaming Lu, Jingqing Ruan, Haoyuan Jiang, Ziyue Li, Hangyu Mao and Rui
Zhao
- Abstract要約: 本研究では,単一のシナリオにおける経験的情報と,さまざまなシナリオにわたる一般化可能な情報の両方を活用することを目的としたDuaLightを提案する。
具体的には、DuaLightは2つの学習可能な部分を持つシナリオ固有の経験的加重モジュールを紹介している。
シナリオ共有型Co-Trainモジュールを実装し,様々なシナリオにまたがる一般化可能な動的情報の学習を容易にする。
- 参考スコア(独自算出の注目度): 14.188876528657703
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reinforcement learning has been revolutionizing the traditional traffic
signal control task, showing promising power to relieve congestion and improve
efficiency. However, the existing methods lack effective learning mechanisms
capable of absorbing dynamic information inherent to a specific scenario and
universally applicable dynamic information across various scenarios. Moreover,
within each specific scenario, they fail to fully capture the essential
empirical experiences about how to coordinate between neighboring and target
intersections, leading to sub-optimal system-wide outcomes.
Viewing these issues, we propose DuaLight, which aims to leverage both the
experiential information within a single scenario and the generalizable
information across various scenarios for enhanced decision-making.
Specifically, DuaLight introduces a scenario-specific experiential weight
module with two learnable parts: Intersection-wise and Feature-wise, guiding
how to adaptively utilize neighbors and input features for each scenario, thus
providing a more fine-grained understanding of different intersections.
Furthermore, we implement a scenario-shared Co-Train module to facilitate the
learning of generalizable dynamics information across different scenarios.
Empirical results on both real-world and synthetic scenarios show DuaLight
achieves competitive performance across various metrics, offering a promising
solution to alleviate traffic congestion, with 3-7\% improvements. The code is
available under: https://github.com/lujiaming-12138/DuaLight.
- Abstract(参考訳): 強化学習は従来の交通信号制御タスクに革命をもたらしており、混雑を緩和し効率を向上する有望な力を示している。
しかし,既存の手法では,特定のシナリオに固有の動的情報を吸収し,様々なシナリオにまたがる動的情報を普遍的に適用できる効果的な学習機構が欠如している。
さらに、それぞれのシナリオにおいて、隣り合う交差点とターゲットの交差点の調整方法に関する本質的な経験を完全に捉えることができず、システム全体の準最適結果をもたらす。
これらの問題を考察し、単一のシナリオにおける経験情報と様々なシナリオにわたる一般化可能な情報の両方を活用することを目的としたDuaLightを提案する。
具体的には、DuaLightは2つの学習可能な部分を持つシナリオ固有の経験的加重モジュールを紹介している。
さらに,シナリオ共有型Co-Trainモジュールを実装し,シナリオ間の動的情報の一般化を容易にする。
実世界のシナリオと合成のシナリオの実証結果から、dualightはさまざまなメトリクスで競争力のあるパフォーマンスを達成し、交通渋滞を緩和するための有望なソリューションを提供する。
コードは、https://github.com/lujiaming-12138/DuaLight.comで入手できる。
関連論文リスト
- TrACT: A Training Dynamics Aware Contrastive Learning Framework for Long-tail Trajectory Prediction [7.3292387742640415]
本稿では,よりリッチなトレーニングダイナミックス情報を,原型的コントラスト学習フレームワークに組み込むことを提案する。
我々は,2つの大規模自然主義データセットを用いたアプローチの実証評価を行った。
論文 参考訳(メタデータ) (2024-04-18T23:12:46Z) - Controllable Safety-Critical Closed-loop Traffic Simulation via Guided
Diffusion [100.4988219600854]
誘導拡散モデルに根ざした新しいクローズドループシミュレーションフレームワークを提案する。
提案手法は, 現実の条件を密にエミュレートする現実的なロングテールシナリオの生成と, 制御性の向上という, 二つの異なる利点をもたらす。
我々はNuScenesデータセットを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Variational Distillation for Multi-View Learning [104.17551354374821]
我々は,多視点表現学習における2つの重要な特徴を利用するために,様々な情報ボトルネックを設計する。
厳密な理論的保証の下で,本手法は,観察とセマンティックラベルの内在的相関の把握を可能にする。
論文 参考訳(メタデータ) (2022-06-20T03:09:46Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Divide-and-Conquer for Lane-Aware Diverse Trajectory Prediction [71.97877759413272]
軌道予測は、自動運転車が行動を計画し実行するための安全クリティカルなツールです。
近年の手法は,WTAやベスト・オブ・マニーといったマルチコース学習の目標を用いて,強力なパフォーマンスを実現している。
我々の研究は、軌道予測、学習出力、そして運転知識を使って制約を課すことによるより良い予測における2つの重要な課題に対処する。
論文 参考訳(メタデータ) (2021-04-16T17:58:56Z) - Generalizing Decision Making for Automated Driving with an Invariant
Environment Representation using Deep Reinforcement Learning [55.41644538483948]
現在のアプローチは、トレーニングデータを超えてよく一般化されないか、または可変数のトラフィック参加者を考慮することができない。
本研究では,エゴ車の観点から不変環境表現を提案する。
この抽象化により,エージェントが未確認シナリオに対してうまく一般化できることが示される。
論文 参考訳(メタデータ) (2021-02-12T20:37:29Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z) - Scenario-aware and Mutual-based approach for Multi-scenario
Recommendation in E-Commerce [12.794276204716642]
不均質な電子商取引のシナリオでユーザーのための正確な推奨を行う方法は、まだ継続的な研究トピックです。
本稿では,複数のシナリオの違いと類似性を活用するScenario-aware Mutual Learning (SAML) という新しい推奨モデルを提案する。
論文 参考訳(メタデータ) (2020-12-16T13:52:14Z) - AttendLight: Universal Attention-Based Reinforcement Learning Model for
Traffic Signal Control [5.944045645140131]
本稿では,交通信号制御問題に対するエンドツーエンド強化学習(RL)アルゴリズムであるAttendLightを提案する。
提案モデルでは、同様の構成がトレーニングセットで表現されている限り、任意の交差点構成で機能する。
我々は, (i) 単一環境訓練, (ii) 単一環境訓練, (ii) マルチ環境訓練, マルチデプロイメントの2つの体制を考察する。
論文 参考訳(メタデータ) (2020-10-12T15:07:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。