論文の概要: Multi-Agent Broad Reinforcement Learning for Intelligent Traffic Light
Control
- arxiv url: http://arxiv.org/abs/2203.04310v1
- Date: Tue, 8 Mar 2022 14:04:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-11 08:44:31.173707
- Title: Multi-Agent Broad Reinforcement Learning for Intelligent Traffic Light
Control
- Title(参考訳): インテリジェント光制御のためのマルチエージェント広角強化学習
- Authors: Ruijie Zhu, Lulu Li, Shuning Wu, Pei Lv, Yafai Li, Mingliang Xu
- Abstract要約: 既存のマルチエージェントシステム(MAS)のアプローチは、主にマルチエージェントディープ強化学習(MADRL)に基づいている。
我々は,MASにおけるBLSの機能を探るため,マルチエージェントブロード強化学習(MABRL)フレームワークを提案する。
- 参考スコア(独自算出の注目度): 21.87935026688773
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Intelligent Traffic Light Control System (ITLCS) is a typical Multi-Agent
System (MAS), which comprises multiple roads and traffic lights.Constructing a
model of MAS for ITLCS is the basis to alleviate traffic congestion. Existing
approaches of MAS are largely based on Multi-Agent Deep Reinforcement Learning
(MADRL). Although the Deep Neural Network (DNN) of MABRL is effective, the
training time is long, and the parameters are difficult to trace. Recently,
Broad Learning Systems (BLS) provided a selective way for learning in the deep
neural networks by a flat network. Moreover, Broad Reinforcement Learning (BRL)
extends BLS in Single Agent Deep Reinforcement Learning (SADRL) problem with
promising results. However, BRL does not focus on the intricate structures and
interaction of agents. Motivated by the feature of MADRL and the issue of BRL,
we propose a Multi-Agent Broad Reinforcement Learning (MABRL) framework to
explore the function of BLS in MAS. Firstly, unlike most existing MADRL
approaches, which use a series of deep neural networks structures, we model
each agent with broad networks. Then, we introduce a dynamic self-cycling
interaction mechanism to confirm the "3W" information: When to interact, Which
agents need to consider, What information to transmit. Finally, we do the
experiments based on the intelligent traffic light control scenario. We compare
the MABRL approach with six different approaches, and experimental results on
three datasets verify the effectiveness of MABRL.
- Abstract(参考訳): インテリジェント・トラヒック・ライト・コントロール・システム(ITLCS)は、複数の道路と信号機で構成される典型的なマルチエージェント・システム(MAS)であり、ITLCSのためのMASモデルの構築が交通渋滞の緩和の基盤となっている。
既存のMASのアプローチは、主にマルチエージェントディープ強化学習(MADRL)に基づいている。
MABRLのディープニューラルネットワーク(DNN)は有効であるが、トレーニング時間は長く、パラメータの追跡は困難である。
近年,broad learning systems (bls) は,フラットネットワークによる深層ニューラルネットワーク学習のための選択的手法を提供している。
さらに,Broad Reinforcement Learning (BRL) は,単一エージェント深層強化学習 (SADRL) 問題における BLS を有望な結果で拡張する。
しかし、BRLはエージェントの複雑な構造や相互作用に重点を置いていない。
我々はMADRLの特徴とBRLの課題に感銘を受けて,MASにおけるBLSの機能を探るためのマルチエージェントブロード強化学習(MABRL)フレームワークを提案する。
まず、一連のディープニューラルネットワーク構造を使用する既存のMADRLアプローチとは異なり、各エージェントを広いネットワークでモデル化する。
次に,「3w」情報を確認するために,動的自己サイクリング相互作用機構を導入する。
最後に、インテリジェントな交通光制御シナリオに基づいて実験を行う。
我々は,MABRLのアプローチを6つの異なるアプローチと比較し,MABRLの有効性を3つのデータセットで検証した。
関連論文リスト
- Online Multi-modal Root Cause Analysis [61.94987309148539]
ルート原因分析(RCA)は、マイクロサービスシステムにおける障害の根本原因の特定に不可欠である。
既存のオンラインRCAメソッドは、マルチモーダルシステムにおける複雑な相互作用を見渡す単一モーダルデータのみを処理する。
OCEANは、根本原因の局在化のための新しいオンラインマルチモーダル因果構造学習手法である。
論文 参考訳(メタデータ) (2024-10-13T21:47:36Z) - An Examination of Offline-Trained Encoders in Vision-Based Deep Reinforcement Learning for Autonomous Driving [0.0]
部分観測可能なマルコフ決定過程(POMDP)における深層強化学習(DRL)の課題に関する研究
我々の研究は、オフラインで訓練されたエンコーダを用いて、自己教師付き学習を通じて大規模なビデオデータセットを活用し、一般化可能な表現を学習する。
CARLAシミュレータにおいて,BDD100Kの運転映像から得られた特徴を直接転送することで,車線追従や衝突回避を実現することができることを示す。
論文 参考訳(メタデータ) (2024-09-02T14:16:23Z) - MAIDCRL: Semi-centralized Multi-Agent Influence Dense-CNN Reinforcement
Learning [0.7366405857677227]
エージェント・インフルエンス・マップ(AIM)によって強化された半集中型Dense Reinforcement Learningアルゴリズムを用いて,StarCraft Multi-Agent Challenge (SMAC) シナリオにおける効果的なマルチエージェント制御を学習する。
その結果,CNN対応MAIDCRLは学習性能を大幅に向上し,既存のMAIDRLと比較して学習速度が向上した。
論文 参考訳(メタデータ) (2024-02-12T18:53:20Z) - M2CURL: Sample-Efficient Multimodal Reinforcement Learning via Self-Supervised Representation Learning for Robotic Manipulation [0.7564784873669823]
マルチモーダルコントラスト非教師強化学習(M2CURL)を提案する。
提案手法は,効率的な表現を学習し,RLアルゴリズムの高速収束に寄与する,新しいマルチモーダル自己教師学習技術を用いている。
Tactile Gym 2シミュレータ上でのM2CURLの評価を行い、異なる操作タスクにおける学習効率を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2024-01-30T14:09:35Z) - Contrastive UCB: Provably Efficient Contrastive Self-Supervised Learning in Online Reinforcement Learning [92.18524491615548]
対照的な自己指導型学習は、(深層)強化学習(RL)の実践にうまく統合されている
我々は,低ランク遷移を伴うマルコフ決定過程(MDP)とマルコフゲーム(MG)のクラスにおいて,コントラスト学習によってRLをどのように強化できるかを検討する。
オンライン環境下では,MDPやMGのオンラインRLアルゴリズムと対照的な損失を生かした,新しい高信頼境界(UCB)型アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-29T17:29:08Z) - Relative Distributed Formation and Obstacle Avoidance with Multi-agent
Reinforcement Learning [20.401609420707867]
マルチエージェント強化学習(MARL)に基づく分散生成・障害物回避手法を提案する。
提案手法は, 障害物回避における生成誤差, 生成収束率, オンパー成功率に関して, ベースラインと比較して高い性能を実現する。
論文 参考訳(メタデータ) (2021-11-14T13:02:45Z) - Multitask Adaptation by Retrospective Exploration with Learned World
Models [77.34726150561087]
本稿では,タスク非依存ストレージから取得したMBRLエージェントのトレーニングサンプルを提供するRAMaというメタ学習型アドレッシングモデルを提案する。
このモデルは、期待されるエージェントのパフォーマンスを最大化するために、ストレージから事前のタスクを解く有望な軌道を選択することで訓練される。
論文 参考訳(メタデータ) (2021-10-25T20:02:57Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - Combining Pessimism with Optimism for Robust and Efficient Model-Based
Deep Reinforcement Learning [56.17667147101263]
実世界のタスクでは、強化学習エージェントはトレーニング中に存在しない状況に遭遇する。
信頼性を確保するため、RLエージェントは最悪の状況に対して堅牢性を示す必要がある。
本稿では,Robust Hallucinated Upper-Confidence RL (RH-UCRL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-18T16:50:17Z) - Single and Multi-Agent Deep Reinforcement Learning for AI-Enabled
Wireless Networks: A Tutorial [29.76086936463468]
このチュートリアルは、AI対応の6Gネットワークのための深層マルチエージェント強化学習(MARL)に焦点を当て、DRL(Deep Reinforcement Learning)の役割に焦点を当てている。
本稿では, 単エージェント RL と MARL の数学的枠組みについて概説する。
モデルベースRL(MBRL)や協調MARLなどのRLアルゴリズムを選択的に記述する。
論文 参考訳(メタデータ) (2020-11-06T22:12:40Z) - Understanding Self-supervised Learning with Dual Deep Networks [74.92916579635336]
本稿では,2組の深層ReLUネットワークを用いたコントラスト型自己教師学習(SSL)手法を理解するための新しい枠組みを提案する。
種々の損失関数を持つSimCLRの各SGD更新において、各層の重みは共分散演算子によって更新されることを示す。
共分散演算子の役割と、そのようなプロセスでどのような特徴が学習されるかをさらに研究するために、我々は、階層的潜在木モデル(HLTM)を用いて、データ生成および増大過程をモデル化する。
論文 参考訳(メタデータ) (2020-10-01T17:51:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。