論文の概要: Reducing Bus Bunching with Asynchronous Multi-Agent Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2105.00376v1
- Date: Sun, 2 May 2021 02:08:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-04 13:43:37.150074
- Title: Reducing Bus Bunching with Asynchronous Multi-Agent Reinforcement
Learning
- Title(参考訳): 非同期マルチエージェント強化学習によるバスバンチ低減
- Authors: Jiawei Wang and Lijun Sun
- Abstract要約: バスフラッキングは、バスサービスの信頼性と効率を損なう一般的な現象である。
経路レベルのバスフリート制御を非同期マルチエージェント強化学習問題として定式化する。
古典的なアクタークリティカルアーキテクチャを拡張して、非同期問題を扱う。
- 参考スコア(独自算出の注目度): 11.168121941015013
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The bus system is a critical component of sustainable urban transportation.
However, due to the significant uncertainties in passenger demand and traffic
conditions, bus operation is unstable in nature and bus bunching has become a
common phenomenon that undermines the reliability and efficiency of bus
services. Despite recent advances in multi-agent reinforcement learning (MARL)
on traffic control, little research has focused on bus fleet control due to the
tricky asynchronous characteristic -- control action only happens when a bus
arrives at a bus stop and thus agents do not act simultaneously. In this study,
we formulate route-level bus fleet control as an asynchronous multi-agent
reinforcement learning (ASMR) problem and extend the classical actor-critic
architecture to handle the asynchronous issue. Specifically, we design a novel
critic network to effectively approximate the marginal contribution for other
agents, in which graph attention neural network is used to conduct inductive
learning for policy evaluation. The critic structure also helps the ego agent
optimize its policy more efficiently. We evaluate the proposed framework on
real-world bus services and actual passenger demand derived from smart card
data. Our results show that the proposed model outperforms both traditional
headway-based control methods and existing MARL methods.
- Abstract(参考訳): バスシステムは持続可能な都市交通の重要な要素である。
しかし、旅客需要や交通状況のかなりの不確実性から、バスの運行は自然に不安定であり、バスフラッキングはバスの信頼性や効率を損なう一般的な現象となっている。
交通制御におけるマルチエージェント強化学習(MARL)の最近の進歩にもかかわらず、トリッキー非同期特性によるバスフリート制御に焦点を当てた研究はほとんどなく、バスが停留所に到着してエージェントが同時に動作しない場合にのみ制御アクションが発生する。
本研究では,経路レベルのバス群制御を非同期マルチエージェント強化学習(ASMR)問題として定式化し,非同期問題を扱うために古典的アクター・クリティカルアーキテクチャを拡張した。
具体的には,グラフアテンションニューラルネットワークを用いて政策評価のための帰納的学習を行う,他のエージェントの限界貢献を効果的に近似する新たな批判ネットワークを設計する。
批評家の構造は、egoエージェントがそのポリシーをより効率的に最適化するのに役立つ。
提案手法は,現実のバスサービスと,スマートカードデータに基づく実際の乗客需要に関するものである。
提案手法は従来のヘッドウェイ制御法と既存のMARL法の両方より優れていることを示す。
関連論文リスト
- Improving Traffic Flow Predictions with SGCN-LSTM: A Hybrid Model for Spatial and Temporal Dependencies [55.2480439325792]
本稿ではSGCN-LSTM(Signal-Enhanced Graph Convolutional Network Long Short Term Memory)モデルを提案する。
PEMS-BAYロードネットワークトラフィックデータセットの実験は、SGCN-LSTMモデルの有効性を示す。
論文 参考訳(メタデータ) (2024-11-01T00:37:00Z) - Semantic Communication for Cooperative Perception using HARQ [51.148203799109304]
我々は重要セマンティック情報を抽出するために重要地図を活用し、協調的な知覚セマンティックコミュニケーションフレームワークを導入する。
周波数分割多重化(OFDM)とチャネル推定と等化戦略を併用して,時間変化によるマルチパスフェーディングによる課題に対処する。
我々は,ハイブリッド自動繰り返し要求(HARQ)の精神において,我々の意味コミュニケーションフレームワークと統合された新しい意味エラー検出手法を提案する。
論文 参考訳(メタデータ) (2024-08-29T08:53:26Z) - GPT-Augmented Reinforcement Learning with Intelligent Control for Vehicle Dispatching [82.19172267487998]
GARLIC: GPT拡張強化学習のフレームワーク。
本稿では,GPT強化強化学習とインテリジェント制御のフレームワークであるGARLICについて紹介する。
論文 参考訳(メタデータ) (2024-08-19T08:23:38Z) - Agent-Agnostic Centralized Training for Decentralized Multi-Agent Cooperative Driving [17.659812774579756]
本研究では,自律走行車における分散型協調運転ポリシーを学習する非対称アクター・批判モデルを提案する。
マスキングを用いたアテンションニューラルネットワークを用いることで,実世界の交通動態と部分観測可能性の効率よく管理できる。
論文 参考訳(メタデータ) (2024-03-18T16:13:02Z) - RL-MSA: a Reinforcement Learning-based Multi-line bus Scheduling
Approach [0.0]
既存のアプローチは、通常、オフラインでバススケジューリングスキームを生成し、そのスキームに従ってバスをスケジュールする。
本稿では,MLBSPをマルコフ決定過程(MDP)としてモデル化する。
RL-MSA(Reinforcement Learning-based Multi-line bus Scheduling Approach)は,オフラインとオンラインの両フェーズでバススケジューリングを行うための手法である。
論文 参考訳(メタデータ) (2024-03-11T07:07:05Z) - An Online Approach to Solving Public Transit Stationing and Dispatch
Problem [7.948662269574215]
交通機関は限られた数の車両を予備に保管し、破壊時に被害経路を緩和するために派遣する。
本稿では、この問題を解決するために、非ミオピックシーケンシャルな決定手順を用いた原則的アプローチについて述べる。
実験の結果、提案手法は乗客を2%増やし、デッドヘッドマイルを40%削減することがわかった。
論文 参考訳(メタデータ) (2024-03-05T21:48:29Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - Safe Model-Based Multi-Agent Mean-Field Reinforcement Learning [48.667697255912614]
平均場強化学習は、同一エージェントの無限集団と相互作用する代表エージェントのポリシーに対処する。
モデルベースの平均場強化学習アルゴリズムであるSafe-M$3$-UCRLを提案する。
本アルゴリズムは,低需要領域におけるサービスアクセシビリティを確保しつつ,重要な領域における需要を効果的に満たす。
論文 参考訳(メタデータ) (2023-06-29T15:57:07Z) - Towards Robust On-Ramp Merging via Augmented Multimodal Reinforcement
Learning [9.48157144651867]
本稿では,CAVのマルチモーダル強化学習によるロバスト・オン・ランプ・マージに対する新しいアプローチを提案する。
具体的には、運転安全性、快適運転行動、交通効率を考慮に入れ、マークフ決定プロセス(MDP)としてオンランプマージ問題を定式化する。
信頼性の高い統合操作を実現するため,BSMと監視画像を同時に活用してマルチモーダル観測を行う。
論文 参考訳(メタデータ) (2022-07-21T16:34:57Z) - Robust Dynamic Bus Control: A Distributional Multi-agent Reinforcement
Learning Approach [11.168121941015013]
バスの束縛は、バスシステムの効率性と信頼性を損なう一般的な現象である。
我々は,連続制御学習のための分散MARLフレームワーク,IQNC-Mを開発した。
提案するIQNC-Mフレームワークは,様々な極端な事象を効果的に処理できることを示す。
論文 参考訳(メタデータ) (2021-11-02T23:41:09Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。