論文の概要: A Methodology for the Development of RL-Based Adaptive Traffic Signal
Controllers
- arxiv url: http://arxiv.org/abs/2101.09614v1
- Date: Sun, 24 Jan 2021 00:47:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-16 09:08:05.596215
- Title: A Methodology for the Development of RL-Based Adaptive Traffic Signal
Controllers
- Title(参考訳): RL型適応交通信号制御器の開発に関する一手法
- Authors: Guilherme S. Varela, Pedro P. Santos, Alberto Sardinha and Francisco
S. Melo
- Abstract要約: 提案手法は,適応型トラヒック信号制御装置の開発,デプロイ,評価に必要な全ステップを含む。
提案手法を2つの単純なシナリオで説明し,その異なるステップが現在の文献に見られる制限にどのように対処するかを強調する。
- 参考スコア(独自算出の注目度): 3.666599339851663
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This article proposes a methodology for the development of adaptive traffic
signal controllers using reinforcement learning. Our methodology addresses the
lack of standardization in the literature that renders the comparison of
approaches in different works meaningless, due to differences in metrics,
environments, and even experimental design and methodology. The proposed
methodology thus comprises all the steps necessary to develop, deploy and
evaluate an adaptive traffic signal controller -- from simulation setup to
problem formulation and experimental design. We illustrate the proposed
methodology in two simple scenarios, highlighting how its different steps
address limitations found in the current literature.
- Abstract(参考訳): 本稿では,強化学習を用いた適応型交通信号制御器の開発手法を提案する。
我々の方法論は、メトリクス、環境、さらには実験的な設計や方法論の違いから、異なる作業におけるアプローチの比較を無意味にする文献における標準化の欠如に対処する。
提案手法は,シミュレーションセットアップから問題定式化,実験設計まで,適応型交通信号コントローラの開発,展開,評価に必要なすべてのステップから構成される。
提案手法を2つの単純なシナリオで説明し,その異なるステップが現在の文献に見られる制限にどのように対処するかを強調する。
関連論文リスト
- A Thorough Examination of Decoding Methods in the Era of LLMs [72.65956436513241]
復号法は、次世代の予測器から実用的なタスク解決器に言語モデルを変換する上で、必須の役割を果たす。
本稿では,大規模言語モデルの文脈における様々な復号法を包括的かつ多面的に分析する。
その結果,復号法の性能は特にタスク依存的であり,アライメント,モデルサイズ,量子化などの要因に影響されていることが明らかとなった。
論文 参考訳(メタデータ) (2024-02-10T11:14:53Z) - Reinforcement Learning with Model Predictive Control for Highway Ramp Metering [14.389086937116582]
この研究は、交通フロー管理を強化するためのモデルベースと学習ベースの戦略の相乗効果について考察する。
制御問題は、適切なステージコスト関数を作成することにより、RLタスクとして定式化される。
RLアルゴリズムの関数近似として MPC 最適問題を利用する MPC ベースの RL アプローチを提案し,オンランプの効率的な制御について検討した。
論文 参考訳(メタデータ) (2023-11-15T09:50:54Z) - Learning Transferable Conceptual Prototypes for Interpretable
Unsupervised Domain Adaptation [79.22678026708134]
本稿では,Transferable Prototype Learning (TCPL) という,本質的に解釈可能な手法を提案する。
この目的を達成するために、ソースドメインからターゲットドメインにカテゴリの基本概念を転送する階層的なプロトタイプモジュールを設計し、基礎となる推論プロセスを説明するためにドメイン共有プロトタイプを学習する。
総合的な実験により,提案手法は有効かつ直感的な説明を提供するだけでなく,従来の最先端技術よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-10-12T06:36:41Z) - A Data-Driven Model-Reference Adaptive Control Approach Based on
Reinforcement Learning [4.817429789586126]
ここではモデル参照適応解が自律系に対して開発され、ハミルトン・ヤコビ・ベルマン方程式の誤差に基づく構造を解く。
これは、制御戦略におけるプロセスまたは参照モデルのダイナミクスを知らずにリアルタイムに行われる。
論文 参考訳(メタデータ) (2023-03-17T14:10:52Z) - A Critical Review of Traffic Signal Control and A Novel Unified View of
Reinforcement Learning and Model Predictive Control Approaches for Adaptive
Traffic Signal Control [0.0]
この章では、既存の方法論の違いと欠点だけでなく、共通基盤を特定するために、近代ATSCの統一的な視点を提案する。
統一ビューはマルコフ決定プロセスの数学的言語を適用し、世界(確率)とソリューションモデリングの両方の観点からコントローラ設計のプロセスを記述する。
論文 参考訳(メタデータ) (2022-11-26T01:18:39Z) - Transferring Reinforcement Learning for DC-DC Buck Converter Control via
Duty Ratio Mapping: From Simulation to Implementation [0.0]
本稿では,DC-DCコンバータ用のデリケートに設計されたデューティ比マッピング(DRM)を用いた転送手法を提案する。
モデルフリー深部強化学習(DRL)コントローラの実装を可能にするために,詳細なsim-to-realプロセスを提案する。
論文 参考訳(メタデータ) (2021-10-20T11:08:17Z) - A review of approaches to modeling applied vehicle routing problems [77.34726150561087]
車両経路問題のモデル化手法について概説する。
モデリング手法を評価するためのいくつかの基準を定式化する。
我々はVRPドメインのモデリング分野における今後の研究の道について論じる。
論文 参考訳(メタデータ) (2021-05-23T14:50:14Z) - A Survey on Deep Semi-supervised Learning [51.26862262550445]
まず,既存の手法を分類した深層半指導学習の分類法を提案する。
次に、損失の種類、貢献度、アーキテクチャの違いの観点から、これらのメソッドを詳細に比較します。
論文 参考訳(メタデータ) (2021-02-28T16:22:58Z) - Application-Driven Learning: A Closed-Loop Prediction and Optimization Approach Applied to Dynamic Reserves and Demand Forecasting [41.94295877935867]
我々は、予測と意思決定のプロセスが統合され、協調最適化される新しいクローズドループフレームワークであるアプリケーション駆動学習を提案する。
提案手法は拡張性があり,標準のオープンループ手法よりも一貫して性能が向上することを示す。
論文 参考訳(メタデータ) (2021-02-26T02:43:28Z) - There and Back Again: Revisiting Backpropagation Saliency Methods [87.40330595283969]
正当性法は,各入力サンプルの重要度マップを作成することによって,モデルの予測を説明する。
このような手法の一般的なクラスは、信号のバックプロパゲートと結果の勾配の分析に基づいている。
本稿では,そのような手法を統一可能な単一のフレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-06T17:58:08Z) - Disentangling Adaptive Gradient Methods from Learning Rates [65.0397050979662]
適応的勾配法が学習率のスケジュールとどのように相互作用するかを、より深く検討する。
我々は、更新の規模をその方向から切り離す"グラフティング"実験を導入する。
適応勾配法の一般化に関する経験的および理論的考察を示す。
論文 参考訳(メタデータ) (2020-02-26T21:42:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。