論文の概要: A Critical Review of Traffic Signal Control and A Novel Unified View of
Reinforcement Learning and Model Predictive Control Approaches for Adaptive
Traffic Signal Control
- arxiv url: http://arxiv.org/abs/2211.14426v1
- Date: Sat, 26 Nov 2022 01:18:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 20:27:57.227186
- Title: A Critical Review of Traffic Signal Control and A Novel Unified View of
Reinforcement Learning and Model Predictive Control Approaches for Adaptive
Traffic Signal Control
- Title(参考訳): 交通信号制御の批判的レビューと適応的交通信号制御のための強化学習とモデル予測制御アプローチの統一的展望
- Authors: Xiaoyu Wang (1), Scott Sanner (2), Baher Abdulhai (1) ((1) Department
of Civil Engineering, University of Toronto, (2) Department of Mechanical and
Industrial Engineering, University of Toronto)
- Abstract要約: この章では、既存の方法論の違いと欠点だけでなく、共通基盤を特定するために、近代ATSCの統一的な視点を提案する。
統一ビューはマルコフ決定プロセスの数学的言語を適用し、世界(確率)とソリューションモデリングの両方の観点からコントローラ設計のプロセスを記述する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent years have witnessed substantial growth in adaptive traffic signal
control (ATSC) methodologies that improve transportation network efficiency,
especially in branches leveraging artificial intelligence based optimization
and control algorithms such as reinforcement learning as well as conventional
model predictive control. However, lack of cross-domain analysis and comparison
of the effectiveness of applied methods in ATSC research limits our
understanding of existing challenges and research directions. This chapter
proposes a novel unified view of modern ATSCs to identify common ground as well
as differences and shortcomings of existing methodologies with the ultimate
goal to facilitate cross-fertilization and advance the state-of-the-art. The
unified view applies the mathematical language of the Markov decision process,
describes the process of controller design from both the world (problem) and
solution modeling perspectives. The unified view also analyses systematic
issues commonly ignored in existing studies and suggests future potential
directions to resolve these issues.
- Abstract(参考訳): 近年,特に人工知能に基づく最適化と強化学習などの制御アルゴリズムを活用する分野や,従来のモデル予測制御などにおいて,交通ネットワーク効率を向上させるための適応的交通信号制御(ATSC)手法が著しく成長している。
しかし,ATSC研究におけるクロスドメイン解析の欠如と適用方法の有効性の比較は,既存の課題や研究方向性の理解を制限している。
本章では、異種交配の促進と最先端化を目標として、共通基盤と既存の方法論の違いと欠点を識別する、近代ATSCの統一的視点を提案する。
統一ビューはマルコフ決定プロセスの数学的言語を適用し、世界(問題)とソリューションモデリングの両方の観点からコントローラ設計のプロセスを記述する。
統一的見解はまた、既存の研究で一般的に無視されている体系的な問題を分析し、これらの問題を解決する今後の方向性を示唆する。
関連論文リスト
- A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - Reinforcement Learning with Model Predictive Control for Highway Ramp Metering [14.389086937116582]
この研究は、交通フロー管理を強化するためのモデルベースと学習ベースの戦略の相乗効果について考察する。
制御問題は、適切なステージコスト関数を作成することにより、RLタスクとして定式化される。
RLアルゴリズムの関数近似として MPC 最適問題を利用する MPC ベースの RL アプローチを提案し,オンランプの効率的な制御について検討した。
論文 参考訳(メタデータ) (2023-11-15T09:50:54Z) - A Data-Driven Model-Reference Adaptive Control Approach Based on
Reinforcement Learning [4.817429789586126]
ここではモデル参照適応解が自律系に対して開発され、ハミルトン・ヤコビ・ベルマン方程式の誤差に基づく構造を解く。
これは、制御戦略におけるプロセスまたは参照モデルのダイナミクスを知らずにリアルタイムに行われる。
論文 参考訳(メタデータ) (2023-03-17T14:10:52Z) - Deep Learning for Wireless Networked Systems: a joint
Estimation-Control-Scheduling Approach [47.29474858956844]
ワイヤレスネットワーク制御システム(Wireless Networked Control System, WNCS)は、無線通信を介してセンサ、コントローラ、アクチュエータを接続する技術であり、産業用 4.0 時代において、高度にスケーラブルで低コストな制御システムの展開を可能にする技術である。
WNCSにおける制御と通信の密接な相互作用にもかかわらず、既存のほとんどの研究は分離設計アプローチを採用している。
モデルフリーデータとモデルベースデータの両方を利用する制御と最適化のための,DRLに基づく新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-10-03T01:29:40Z) - Comparative analysis of machine learning methods for active flow control [60.53767050487434]
遺伝的プログラミング(GP)と強化学習(RL)はフロー制御において人気を集めている。
この研究は2つの比較分析を行い、地球規模の最適化手法に対して最も代表的なアルゴリズムのいくつかをベンチマークする。
論文 参考訳(メタデータ) (2022-02-23T18:11:19Z) - A Deep Reinforcement Learning Approach for Traffic Signal Control
Optimization [14.455497228170646]
非効率な信号制御手法は、交通渋滞やエネルギー浪費などの多くの問題を引き起こす可能性がある。
本稿では,アクター・クリティカル・ポリシー・グラデーション・アルゴリズムを拡張し,マルチエージェント・ディープ・決定性ポリシー・グラデーション(MADDPG)法を提案する。
論文 参考訳(メタデータ) (2021-07-13T14:11:04Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z) - A Hamiltonian Monte Carlo Method for Probabilistic Adversarial Attack
and Learning [122.49765136434353]
本稿では,HMCAM (Acumulated Momentum) を用いたハミルトニアンモンテカルロ法を提案する。
また, 対数的対数的対数的学習(Contrastive Adversarial Training, CAT)と呼ばれる新たな生成法を提案し, 対数的例の平衡分布にアプローチする。
いくつかの自然画像データセットと実用システムに関する定量的および定性的な解析により、提案アルゴリズムの優位性が確認された。
論文 参考訳(メタデータ) (2020-10-15T16:07:26Z) - Reinforcement Learning as Iterative and Amortised Inference [62.997667081978825]
我々は、この制御を推論フレームワークとして使用し、償却および反復推論に基づく新しい分類スキームを概説する。
この観点から、比較的探索されていないアルゴリズム設計空間の一部を特定できることを示す。
論文 参考訳(メタデータ) (2020-06-13T16:10:03Z) - Learning Scalable Multi-Agent Coordination by Spatial Differentiation
for Traffic Signal Control [8.380832628205372]
交通信号制御のためのディープ強化学習法に基づくマルチエージェント協調フレームワークを設計する。
具体的には、リプレイバッファ内の時間空間情報を用いて各アクションの報酬を補正する調整のための空間差分法を提案する。
論文 参考訳(メタデータ) (2020-02-27T02:16:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。