Fugu-MT 論文翻訳(概要): Variationally and Intrinsically motivated reinforcement learning for decentralized traffic signal control

論文の概要: Variationally and Intrinsically motivated reinforcement learning for decentralized traffic signal control

arxiv url: http://arxiv.org/abs/2101.00746v4
Date: Wed, 20 Jan 2021 06:56:50 GMT
ステータス: 翻訳完了
システム内更新日: 2021-04-12 08:17:21.051518
Title: Variationally and Intrinsically motivated reinforcement learning for decentralized traffic signal control
Title（参考訳）: 分散トラヒック信号制御のための変分的・本質的強化学習
Authors: Liwen Zhu, Peixi Peng, Zongqing Lu, Xiangqian Wang, Yonghong Tian
Abstract要約: 交通信号コーディネート制御のための新しいMetaVRS法を提案する。環境報酬に本質的な報酬を適用することで、MetaVRSはエージェント対エージェントの相互作用を賢明に捉えることができる。 VAEが生み出す潜伏変数は、探査と搾取のトレードオフを自動的に行うためのポリシーに組み込まれる。
参考スコア（独自算出の注目度）: 31.33071476673294
License: http://creativecommons.org/licenses/by/4.0/
Abstract: One of the biggest challenges in multi-agent reinforcement learning is coordination, a typical application scenario of this is traffic signal control. Recently, it has attracted a rising number of researchers and has become a hot research field with great practical significance. In this paper, we propose a novel method called MetaVRS~(Meta Variational RewardShaping) for traffic signal coordination control. By heuristically applying the intrinsic reward to the environmental reward, MetaVRS can wisely capture the agent-to-agent interplay. Besides, latent variables generated by VAE are brought into policy for automatically tradeoff between exploration and exploitation to optimize the policy. In addition, meta learning was used in decoder for faster adaptation and better approximation. Empirically, we demonstate that MetaVRS substantially outperforms existing methods and shows superior adaptability, which predictably has a far-reaching significance to the multi-agent traffic signal coordination control.
Abstract（参考訳）: マルチエージェント強化学習の最大の課題の1つはコーディネーションであり、典型的な応用シナリオはトラフィック信号制御である。近年,多くの研究者を惹きつけ,実際的な意義を持つ熱い研究分野となっている。本稿では,交通信号調整制御のためのMetaVRS~(Meta Variational Reward Shaping)という新しい手法を提案する。環境報酬に本質的な報酬をヒューリスティックに適用することにより、MetaVRSはエージェント対エージェントの相互作用を賢明に捉えることができる。さらに、VAEが生成した潜伏変数は、探索とエクスプロイトの間で自動的にトレードオフを行い、ポリシーを最適化する。さらに、メタ学習はデコーダで高速な適応と近似のために使われた。実証的に、MetaVRSは既存の手法よりも大幅に優れ、適応性も優れており、マルチエージェントの信号調整制御において予測できるほど重要となる。

関連論文リスト

Zero-Shot Whole-Body Humanoid Control via Behavioral Foundation Models [71.34520793462069]
教師なし強化学習(RL)は、複雑な環境下で幅広い下流タスクを解くことができる事前学習エージェントを目標としている。本稿では,ラベルのない行動データセットからトラジェクトリを模倣するための,教師なしRLの正規化アルゴリズムを提案する。我々は,この手法の有効性を,挑戦的なヒューマノイド制御問題において実証する。
論文参考訳（メタデータ） (2025-04-15T10:41:11Z)
TransferLight: Zero-Shot Traffic Signal Control on any Road-Network [0.6274767633959003]
TransferLightは、ロードネットワーク全体の堅牢な一般化のために設計された新しいフレームワークである。階層的で、異質で、有向的なグラフニューラルネットワークアーキテクチャは、トラフィックの粒度の動態を効果的に捉えます。我々は、ゼロショットを任意の道路ネットワークに再トレーニングせずにスケールする、単一の重み付けポリシーを開発した。
論文参考訳（メタデータ） (2024-12-12T20:52:12Z)
A Holistic Framework Towards Vision-based Traffic Signal Control with Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文参考訳（メタデータ） (2024-03-11T16:42:29Z)
DenseLight: Efficient Control for Large-scale Traffic Signals with Dense Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。 DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文参考訳（メタデータ） (2023-06-13T05:58:57Z)
Reinforcement Learning Approaches for Traffic Signal Control under Missing Data [5.896742981602458]
現実世界の都市では、センサーの欠如により交通状態の観察が欠如することがある。本稿では, 適応制御を実現するために, トラフィック状態をインプットし, 適応制御とRLエージェントの訓練を可能にするために, 状態と報酬の両方をインプットする2つの方法を提案する。
論文参考訳（メタデータ） (2023-04-21T03:26:33Z)
SocialLight: Distributed Cooperation Learning towards Network-Wide Traffic Signal Control [7.387226437589183]
SocialLightは交通信号制御のための新しいマルチエージェント強化学習手法である。地元におけるエージェントの個人的限界貢献を推定することにより、協力的な交通規制政策を学習する。我々は,2つの交通シミュレータの標準ベンチマークにおける最先端の交通信号制御手法に対して,トレーニングネットワークをベンチマークした。
論文参考訳（メタデータ） (2023-04-20T12:41:25Z)
Model-based graph reinforcement learning for inductive traffic signal control [4.273991039651846]
適応的信号制御のためのほとんどの強化学習方法は、新しい交差点に適用するために、スクラッチからトレーニングを必要とする。近年のアプローチでは、見えない道路網のトポロジや交通分布を一般化する学習ポリシーが実現されている。モデルに基づく新しい手法である MuJAM を導入する。
論文参考訳（メタデータ） (2022-08-01T07:43:38Z)
AI-aided Traffic Control Scheme for M2M Communications in the Internet of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文参考訳（メタデータ） (2022-03-05T10:54:05Z)
A Deep Reinforcement Learning Approach for Traffic Signal Control Optimization [14.455497228170646]
非効率な信号制御手法は、交通渋滞やエネルギー浪費などの多くの問題を引き起こす可能性がある。本稿では,アクター・クリティカル・ポリシー・グラデーション・アルゴリズムを拡張し,マルチエージェント・ディープ・決定性ポリシー・グラデーション(MADDPG)法を提案する。
論文参考訳（メタデータ） (2021-07-13T14:11:04Z)
End-to-End Intersection Handling using Multi-Agent Deep Reinforcement Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文参考訳（メタデータ） (2021-04-28T07:54:40Z)
TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。 TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文参考訳（メタデータ） (2021-01-17T00:29:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。