論文の概要: MTLight: Efficient Multi-Task Reinforcement Learning for Traffic Signal Control
- arxiv url: http://arxiv.org/abs/2404.00886v1
- Date: Mon, 1 Apr 2024 03:27:46 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-03 23:36:00.974471
- Title: MTLight: Efficient Multi-Task Reinforcement Learning for Traffic Signal Control
- Title(参考訳): MTLight:交通信号制御のための効率的なマルチタスク強化学習
- Authors: Liwen Zhu, Peixi Peng, Zongqing Lu, Yonghong Tian,
- Abstract要約: MTLightは、多数の交通指標から学習した潜伏状態のエージェント観測を強化するために提案されている。
CityFlowで行った実験は、MTLightが収束速度と性能をリードしていることを示している。
- 参考スコア(独自算出の注目度): 56.545522358606924
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Traffic signal control has a great impact on alleviating traffic congestion in modern cities. Deep reinforcement learning (RL) has been widely used for this task in recent years, demonstrating promising performance but also facing many challenges such as limited performances and sample inefficiency. To handle these challenges, MTLight is proposed to enhance the agent observation with a latent state, which is learned from numerous traffic indicators. Meanwhile, multiple auxiliary and supervisory tasks are constructed to learn the latent state, and two types of embedding latent features, the task-specific feature and task-shared feature, are used to make the latent state more abundant. Extensive experiments conducted on CityFlow demonstrate that MTLight has leading convergence speed and asymptotic performance. We further simulate under peak-hour pattern in all scenarios with increasing control difficulty and the results indicate that MTLight is highly adaptable.
- Abstract(参考訳): 交通信号の制御は、近代都市における交通渋滞の緩和に大きな影響を及ぼす。
近年、深部強化学習(RL)がこの課題に広く使われており、有望な性能を示す一方で、限られた性能やサンプル非効率といった多くの課題に直面している。
これらの課題に対処するため、MTLightは、多数の交通指標から学習した潜伏状態によるエージェント観測を強化するために提案されている。
一方、潜在状態を学習するために複数の補助的・監督的タスクを構築し、タスク固有特徴とタスク共有特徴の2種類の埋め込み潜時特徴を用いて潜時状態をより豊かにする。
CityFlowで実施された大規模な実験は、MTLightが収束速度と漸近性能を導くことを示した。
さらに,制御の困難さを増し,すべてのシナリオにおいてピーク時のパターンをシミュレートし,MTLightの適応性が高いことを示す。
関連論文リスト
- MoveLight: Enhancing Traffic Signal Control through Movement-Centric Deep Reinforcement Learning [13.369840354712021]
MoveLightは移動中心の深層強化学習を通じて都市交通管理を強化する新しい交通信号制御システムである。
詳細なリアルタイムデータと高度な機械学習技術を活用することで、MoveLightは従来の信号制御手法の限界を克服する。
論文 参考訳(メタデータ) (2024-07-24T14:17:16Z) - Hard Cases Detection in Motion Prediction by Vision-Language Foundation Models [16.452638202694246]
本研究は、自動運転におけるハードケースの検出におけるビジョン・ランゲージ・ファンデーション・モデル(VLM)の可能性を探るものである。
設計したプロンプトで逐次画像フレームを供給し,課題のあるエージェントやシナリオを効果的に識別する,実現可能なパイプラインを提案する。
NuScenesデータセット上で、パイプラインを最先端の手法に組み込むことの有効性と可能性を示す。
論文 参考訳(メタデータ) (2024-05-31T16:35:41Z) - MTDT: A Multi-Task Deep Learning Digital Twin [8.600701437207725]
我々は,多面的かつ正確な交差点交通流シミュレーションのソリューションとして,MTDT(Multi-Task Deep Learning Digital Twin)を導入した。
MTDTは,移動車線毎のループ検出波形時系列の精度,きめ細かな推定を可能にする。
複数のタスクにまたがって学習プロセスを統合することで、MTDTはオーバーフィッティングの削減、効率の向上、有効性の向上を示す。
論文 参考訳(メタデータ) (2024-05-02T00:34:10Z) - Generalizing Cooperative Eco-driving via Multi-residual Task Learning [6.864745785996583]
MRTL(Multi-Residual Task Learning)はマルチタスク学習に基づく汎用的な学習フレームワークである。
MRTLは制御を従来の制御法と残留項によって効果的に解決される名目成分に分解する。
我々は、システム制御の手段として自律走行車を用いた混合交通における艦隊レベルの排出削減にMRTLを使用している。
論文 参考訳(メタデータ) (2024-03-07T05:25:34Z) - TrafficMOT: A Challenging Dataset for Multi-Object Tracking in Complex
Traffic Scenarios [23.831048188389026]
トラヒックビデオにおける多目的追跡は、交通監視の精度を高め、道路安全対策を促進する大きな可能性を秘めている。
トラヒックビデオにおけるマルチオブジェクトトラッキングのための既存のデータセットは、制限されたインスタンスや単一のクラスにフォーカスすることが多い。
複雑なシナリオを持つ多様なトラフィック状況をカバーするために設計された、広範なデータセットであるTrafficMOTを紹介する。
論文 参考訳(メタデータ) (2023-11-30T18:59:56Z) - Contrastive Example-Based Control [163.6482792040079]
報酬関数ではなく多段階遷移の暗黙的なモデルを学ぶオフラインのサンプルベース制御法を提案する。
状態ベースおよび画像ベースのオフライン制御タスクの範囲で、学習された報酬関数を使用するベースラインよりも優れています。
論文 参考訳(メタデータ) (2023-07-24T19:43:22Z) - M$^3$ViT: Mixture-of-Experts Vision Transformer for Efficient Multi-task
Learning with Model-Accelerator Co-design [95.41238363769892]
マルチタスク学習(MTL)は、複数の学習タスクを単一のモデルにカプセル化し、それらのタスクを共同でよりよく学習できるようにする。
現在のMTLレギュレータは、1つのタスクだけを実行するためにさえ、ほぼすべてのモデルを起動する必要がある。
効率的なオンデバイスMTLを実現するためのモデル-アクセラレータ共設計フレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-26T15:40:24Z) - Learning energy-efficient driving behaviors by imitating experts [75.12960180185105]
本稿では,コミュニケーション・センシングにおける制御戦略と現実的限界のギャップを埋める上で,模倣学習が果たす役割について考察する。
擬似学習は、車両の5%に採用されれば、局地的な観測のみを用いて、交通条件の異なるネットワークのエネルギー効率を15%向上させる政策を導出できることを示す。
論文 参考訳(メタデータ) (2022-06-28T17:08:31Z) - Multi-intersection Traffic Optimisation: A Benchmark Dataset and a
Strong Baseline [85.9210953301628]
交通信号の制御は、都市部の交通渋滞の緩和に必要不可欠である。
問題モデリングの複雑さが高いため、現在の作業の実験的な設定はしばしば矛盾する。
エンコーダ・デコーダ構造を用いた深層強化学習に基づく新規で強力なベースラインモデルを提案する。
論文 参考訳(メタデータ) (2021-01-24T03:55:39Z) - Learning Sparse Rewarded Tasks from Sub-Optimal Demonstrations [78.94386823185724]
模倣学習は、既存の専門家のデモンストレーションを活用することで、スパース・リワードされたタスクで効果的に学習する。
実際には、十分な量の専門家によるデモンストレーションを集めることは、違法にコストがかかる。
限られた数の準最適実演に限り、最適性能を(ほぼ)達成できる自己適応学習(SAIL)を提案する。
論文 参考訳(メタデータ) (2020-04-01T15:57:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。