Fugu-MT 論文翻訳(概要): DuaLight: Enhancing Traffic Signal Control by Leveraging Scenario-Specific and Scenario-Shared Knowledge

論文の概要: DuaLight: Enhancing Traffic Signal Control by Leveraging Scenario-Specific and Scenario-Shared Knowledge

arxiv url: http://arxiv.org/abs/2312.14532v1
Date: Fri, 22 Dec 2023 08:57:43 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-25 15:38:47.723204
Title: DuaLight: Enhancing Traffic Signal Control by Leveraging Scenario-Specific and Scenario-Shared Knowledge
Title（参考訳）: DuaLight: シナリオ特有かつシナリオ共有知識を活用した交通信号制御の強化
Authors: Jiaming Lu, Jingqing Ruan, Haoyuan Jiang, Ziyue Li, Hangyu Mao and Rui Zhao
Abstract要約: 本研究では,単一のシナリオにおける経験的情報と,さまざまなシナリオにわたる一般化可能な情報の両方を活用することを目的としたDuaLightを提案する。具体的には、DuaLightは2つの学習可能な部分を持つシナリオ固有の経験的加重モジュールを紹介している。シナリオ共有型Co-Trainモジュールを実装し,様々なシナリオにまたがる一般化可能な動的情報の学習を容易にする。
参考スコア（独自算出の注目度）: 14.188876528657703
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Reinforcement learning has been revolutionizing the traditional traffic signal control task, showing promising power to relieve congestion and improve efficiency. However, the existing methods lack effective learning mechanisms capable of absorbing dynamic information inherent to a specific scenario and universally applicable dynamic information across various scenarios. Moreover, within each specific scenario, they fail to fully capture the essential empirical experiences about how to coordinate between neighboring and target intersections, leading to sub-optimal system-wide outcomes. Viewing these issues, we propose DuaLight, which aims to leverage both the experiential information within a single scenario and the generalizable information across various scenarios for enhanced decision-making. Specifically, DuaLight introduces a scenario-specific experiential weight module with two learnable parts: Intersection-wise and Feature-wise, guiding how to adaptively utilize neighbors and input features for each scenario, thus providing a more fine-grained understanding of different intersections. Furthermore, we implement a scenario-shared Co-Train module to facilitate the learning of generalizable dynamics information across different scenarios. Empirical results on both real-world and synthetic scenarios show DuaLight achieves competitive performance across various metrics, offering a promising solution to alleviate traffic congestion, with 3-7\% improvements. The code is available under: https://github.com/lujiaming-12138/DuaLight.
Abstract（参考訳）: 強化学習は従来の交通信号制御タスクに革命をもたらしており、混雑を緩和し効率を向上する有望な力を示している。しかし,既存の手法では,特定のシナリオに固有の動的情報を吸収し,様々なシナリオにまたがる動的情報を普遍的に適用できる効果的な学習機構が欠如している。さらに、それぞれのシナリオにおいて、隣り合う交差点とターゲットの交差点の調整方法に関する本質的な経験を完全に捉えることができず、システム全体の準最適結果をもたらす。これらの問題を考察し、単一のシナリオにおける経験情報と様々なシナリオにわたる一般化可能な情報の両方を活用することを目的としたDuaLightを提案する。具体的には、DuaLightは2つの学習可能な部分を持つシナリオ固有の経験的加重モジュールを紹介している。さらに,シナリオ共有型Co-Trainモジュールを実装し,シナリオ間の動的情報の一般化を容易にする。実世界のシナリオと合成のシナリオの実証結果から、dualightはさまざまなメトリクスで競争力のあるパフォーマンスを達成し、交通渋滞を緩和するための有望なソリューションを提供する。コードは、https://github.com/lujiaming-12138/DuaLight.comで入手できる。

関連論文リスト

Enhancing Traffic Signal Control through Model-based Reinforcement Learning and Policy Reuse [0.9995933996287355]
マルチエージェント強化学習(MARL)は交通信号制御(TSC)において有意な可能性を示した現在のMARLベースの手法は、訓練中に使用する固定された交通パターンと道路網条件により、一般化が不十分な場合が多い。この制限により、新しいトラフィックシナリオへの適応性が低下し、高い再トレーニングコストと複雑なデプロイメントが発生します。我々はPLightとPRLightの2つのアルゴリズムを提案する。PLightはモデルに基づく強化学習アプローチを採用し、事前定義されたソースドメイントラフィックシナリオを用いて制御ポリシーと環境モデルを事前訓練する。PRLightはさらに、事前学習されたPLightエージェントの類似性に基づいて適応性を向上させる。
論文参考訳（メタデータ） (2025-03-11T01:21:13Z)
GRAM: Generalization in Deep RL with a Robust Adaptation Module [29.303051759538416]
本研究では,深層強化学習における動的一般化の枠組みを提案する。本稿では,分散環境と分散環境の両方を識別・反応する機構を提供するロバスト適応モジュールを提案する。我々のアルゴリズムであるGRAMは,展開時の分布内および分布外シナリオにまたがる強力な一般化性能を実現する。
論文参考訳（メタデータ） (2024-12-05T16:39:01Z)
Hints of Prompt: Enhancing Visual Representation for Multimodal LLMs in Autonomous Driving [65.04643267731122]
一般的なMLLMとCLIPの組み合わせは、駆動固有のシナリオを正確に表現するのに苦労することが多い。 Hints of Prompt (HoP) フレームワークを提案する。これらのヒントはHint Fusionモジュールを通じて融合され、視覚的表現が強化され、マルチモーダル推論が強化される。
論文参考訳（メタデータ） (2024-11-20T06:58:33Z)
DeMo: Decoupling Motion Forecasting into Directional Intentions and Dynamic States [6.856351850183536]
マルチモーダルなトラジェクトリクエリを2つのタイプに分離するフレームワークであるDeMoを紹介する。この形式を利用することで、軌道の多モード性と動的進化特性を別々に最適化する。さらに,グローバルな情報集約と状態シーケンスモデリングのためのアテンションとマンバの併用手法についても紹介する。
論文参考訳（メタデータ） (2024-10-08T12:27:49Z)
TrACT: A Training Dynamics Aware Contrastive Learning Framework for Long-tail Trajectory Prediction [7.3292387742640415]
本稿では,よりリッチなトレーニングダイナミックス情報を,原型的コントラスト学習フレームワークに組み込むことを提案する。我々は,2つの大規模自然主義データセットを用いたアプローチの実証評価を行った。
論文参考訳（メタデータ） (2024-04-18T23:12:46Z)
SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文参考訳（メタデータ） (2023-12-31T04:14:43Z)
HiNet: Novel Multi-Scenario & Multi-Task Learning with Hierarchical Information Extraction [50.40732146978222]
マルチシナリオとマルチタスク学習は、産業アプリケーションにおける多くのレコメンデーションシステムに広く応用されている。階層型情報抽出ネットワーク(HiNet)を提案する。 HiNetは、新しい最先端のパフォーマンスを実現し、既存のソリューションを大幅に上回っている。
論文参考訳（メタデータ） (2023-03-10T17:24:41Z)
Variational Distillation for Multi-View Learning [104.17551354374821]
我々は,多視点表現学習における2つの重要な特徴を利用するために,様々な情報ボトルネックを設計する。厳密な理論的保証の下で,本手法は,観察とセマンティックラベルの内在的相関の把握を可能にする。
論文参考訳（メタデータ） (2022-06-20T03:09:46Z)
End-to-End Intersection Handling using Multi-Agent Deep Reinforcement Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文参考訳（メタデータ） (2021-04-28T07:54:40Z)
MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文参考訳（メタデータ） (2021-01-04T03:06:08Z)
Scenario-aware and Mutual-based approach for Multi-scenario Recommendation in E-Commerce [12.794276204716642]
不均質な電子商取引のシナリオでユーザーのための正確な推奨を行う方法は、まだ継続的な研究トピックです。本稿では,複数のシナリオの違いと類似性を活用するScenario-aware Mutual Learning (SAML) という新しい推奨モデルを提案する。
論文参考訳（メタデータ） (2020-12-16T13:52:14Z)
AttendLight: Universal Attention-Based Reinforcement Learning Model for Traffic Signal Control [5.944045645140131]
本稿では,交通信号制御問題に対するエンドツーエンド強化学習(RL)アルゴリズムであるAttendLightを提案する。提案モデルでは、同様の構成がトレーニングセットで表現されている限り、任意の交差点構成で機能する。我々は, (i) 単一環境訓練, (ii) 単一環境訓練, (ii) マルチ環境訓練, マルチデプロイメントの2つの体制を考察する。
論文参考訳（メタデータ） (2020-10-12T15:07:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。