論文の概要: Perimeter Control Using Deep Reinforcement Learning: A Model-free
Approach towards Homogeneous Flow Rate Optimization
- arxiv url: http://arxiv.org/abs/2305.19291v1
- Date: Mon, 29 May 2023 21:22:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-01 20:25:09.215974
- Title: Perimeter Control Using Deep Reinforcement Learning: A Model-free
Approach towards Homogeneous Flow Rate Optimization
- Title(参考訳): 深層強化学習を用いた周縁制御--均質流量最適化へのモデルフリーアプローチ
- Authors: Xiaocan Li, Ray Coden Mercurius, Ayal Taitler, Xiaoyu Wang, Mohammad
Noaeen, Scott Sanner, and Baher Abdulhai
- Abstract要約: 周辺制御は、交通密度が臨界値以下であることを保証するため、地域間の移動フローを制御することにより、保護領域内の交通効率を高く維持する。
既存のアプローチは、ネットワーク伝送モデル(NTM)とマクロ基礎図(MFD)に依存するかによって、モデルベースまたはモデルフリーに分類することができる。
- 参考スコア(独自算出の注目度): 28.851432612392436
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Perimeter control maintains high traffic efficiency within protected regions
by controlling transfer flows among regions to ensure that their traffic
densities are below critical values. Existing approaches can be categorized as
either model-based or model-free, depending on whether they rely on network
transmission models (NTMs) and macroscopic fundamental diagrams (MFDs).
Although model-based approaches are more data efficient and have performance
guarantees, they are inherently prone to model bias and inaccuracy. For
example, NTMs often become imprecise for a large number of protected regions,
and MFDs can exhibit scatter and hysteresis that are not captured in existing
model-based works. Moreover, no existing studies have employed reinforcement
learning for homogeneous flow rate optimization in microscopic simulation,
where spatial characteristics, vehicle-level information, and metering
realizations -- often overlooked in macroscopic simulations -- are taken into
account. To circumvent issues of model-based approaches and macroscopic
simulation, we propose a model-free deep reinforcement learning approach that
optimizes the flow rate homogeneously at the perimeter at the microscopic
level. Results demonstrate that our model-free reinforcement learning approach
without any knowledge of NTMs or MFDs can compete and match the performance of
a model-based approach, and exhibits enhanced generalizability and scalability.
- Abstract(参考訳): 周辺制御は、交通密度が臨界値以下であることを保証するため、地域間の移動フローを制御することにより、保護領域内の交通効率を高く維持する。
既存のアプローチは、ネットワーク伝送モデル(NTM)とマクロ基礎図(MFD)に依存するかによって、モデルベースまたはモデルフリーに分類することができる。
モデルベースのアプローチは、よりデータ効率が高く、パフォーマンスを保証するが、本質的にバイアスや不正確性をモデル化する傾向がある。
例えば、NTMは多数の保護された領域で不正確になることが多く、MFDは既存のモデルベースの作品では捉えられない散乱やヒステリシスを示すことがある。
さらに、微視的シミュレーションにおいて均質な流量最適化のために強化学習を用いた研究は行われておらず、空間特性、車両レベル情報、計測実現(しばしばマクロシミュレーションで見過ごされる)が考慮されている。
モデルベースアプローチとマクロシミュレーションの問題を回避すべく,顕微鏡レベルの周囲で均質に流量を最適化するモデルフリー深層強化学習手法を提案する。
その結果,NTMやMFDの知識のないモデルフリー強化学習手法は,モデルベースアプローチの性能と競合し,拡張性や拡張性を示した。
関連論文リスト
- A Priori Uncertainty Quantification of Reacting Turbulence Closure
Models using Bayesian Neural Networks [0.0]
反応流モデルにおける不確実性を捉えるためにベイズニューラルネットワークを用いる。
我々は、BNNモデルが、データ駆動クロージャモデルの不確実性の構造に関するユニークな洞察を提供することができることを示した。
このモデルの有効性は,様々な火炎条件と燃料からなるデータセットに対する事前評価によって実証される。
論文 参考訳(メタデータ) (2024-02-28T22:19:55Z) - Ensemble Kalman Filtering Meets Gaussian Process SSM for Non-Mean-Field
and Online Inference [50.91823345296243]
我々は,非平均場(NMF)変動推定フレームワークにアンサンブルカルマンフィルタ(EnKF)を導入し,潜在状態の後方分布を近似する。
EnKFとGPSSMのこの新しい結婚は、変分分布の学習における広範なパラメータ化の必要性をなくすだけでなく、エビデンスの下限(ELBO)の解釈可能でクローズドな近似を可能にする。
得られたEnKF支援オンラインアルゴリズムは、データ適合精度を確保しつつ、モデル正規化を組み込んで過度適合を緩和し、目的関数を具現化する。
論文 参考訳(メタデータ) (2023-12-10T15:22:30Z) - On the Impact of Sampling on Deep Sequential State Estimation [17.92198582435315]
逐次モデルにおける状態推定とパラメータ学習は近似手法を用いてうまく行うことができる。
モンテカルロの厳密な目的は、生成的モデリング性能を向上させるために文献で提案されている。
論文 参考訳(メタデータ) (2023-11-28T17:59:49Z) - A PAC-Bayesian Perspective on the Interpolating Information Criterion [54.548058449535155]
補間系の性能に影響を及ぼす要因を特徴付ける一般モデルのクラスに対して,PAC-Bayes境界がいかに得られるかを示す。
オーバーパラメータ化モデルに対するテスト誤差が、モデルとパラメータの初期化スキームの組み合わせによって課される暗黙の正規化の品質に依存するかの定量化を行う。
論文 参考訳(メタデータ) (2023-11-13T01:48:08Z) - Generative Modeling with Phase Stochastic Bridges [52.919600985186996]
拡散モデル(DM)は、連続入力のための最先端の生成モデルを表す。
我々はtextbfphase space dynamics に基づく新しい生成モデリングフレームワークを提案する。
我々のフレームワークは、動的伝播の初期段階において、現実的なデータポイントを生成する能力を示す。
論文 参考訳(メタデータ) (2023-10-11T18:38:28Z) - End-to-End Reinforcement Learning of Koopman Models for Economic
Nonlinear Model Predictive Control [50.0791489606211]
非線形モデル予測制御((e)NMPC)は、すべての状態空間領域において十分正確なシステムモデルを必要とする。
メカニスティックモデルのためのデータ駆動サロゲートモデルは、(e)NMPCの計算負担を軽減するために使用できる。
In this method for end-to-end reinforcement learning of dynamic surrogate model for optimal performance in (e)NMPC applications。
論文 参考訳(メタデータ) (2023-08-03T10:21:53Z) - Improving and generalizing flow-based generative models with minibatch
optimal transport [90.01613198337833]
連続正規化フロー(CNF)のための一般条件流整合(CFM)技術を導入する。
CFMは、拡散モデルのフローをトレーニングするために使用されるような安定した回帰目標を特徴としているが、決定論的フローモデルの効率的な推論を好んでいる。
我々の目的の変種は最適輸送CFM (OT-CFM) であり、訓練がより安定し、より高速な推論をもたらすより単純なフローを生成する。
論文 参考訳(メタデータ) (2023-02-01T14:47:17Z) - When to Update Your Model: Constrained Model-based Reinforcement
Learning [50.74369835934703]
モデルベースRL(MBRL)の非遅延性能保証のための新規で一般的な理論スキームを提案する。
続いて導いた境界は、モデルシフトとパフォーマンス改善の関係を明らかにします。
さらなる例では、動的に変化する探索からの学習モデルが、最終的なリターンの恩恵をもたらすことが示されている。
論文 参考訳(メタデータ) (2022-10-15T17:57:43Z) - Modeling Stochastic Microscopic Traffic Behaviors: a Physics Regularized
Gaussian Process Approach [1.6242924916178285]
本研究では,実世界のランダム性を捉え,誤差を計測できる微視的交通モデルを提案する。
提案フレームワークの特長の一つは,自動車追従行動と車線変更行動の両方を1つのモデルで捉える能力である。
論文 参考訳(メタデータ) (2020-07-17T06:03:32Z) - Macroscopic Traffic Flow Modeling with Physics Regularized Gaussian
Process: A New Insight into Machine Learning Applications [14.164058812512371]
本研究では,古典的トラフィックフローモデルを機械学習アーキテクチャにエンコードする,物理正規化機械学習(PRML)という新しいモデリングフレームワークを提案する。
提案手法の有効性を実証するため,ユタ州I-15高速道路から収集した実世界のデータセットについて実験的検討を行った。
論文 参考訳(メタデータ) (2020-02-06T17:22:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。