論文の概要: Flatland Competition 2020: MAPF and MARL for Efficient Train
Coordination on a Grid World
- arxiv url: http://arxiv.org/abs/2103.16511v1
- Date: Tue, 30 Mar 2021 17:13:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-31 15:12:12.251553
- Title: Flatland Competition 2020: MAPF and MARL for Efficient Train
Coordination on a Grid World
- Title(参考訳): フラットランド・コンペティション2020:MAPFとMARLのグリッドワールドにおける効率的な列車調整
- Authors: Florian Laurent, Manuel Schneider, Christian Scheller, Jeremy Watson,
Jiaoyang Li, Zhe Chen, Yi Zheng, Shao-Hung Chan, Konstantin Makhnev, Oleg
Svidchenko, Vladimir Egorov, Dmitry Ivanov, Aleksei Shpilman, Evgenija
Spirovska, Oliver Tanevski, Aleksandar Nikov, Ramon Grunder, David Galevski,
Jakov Mitrovski, Guillaume Sartoretti, Zhiyao Luo, Mehul Damani, Nilabha
Bhattacharya, Shivam Agarwal, Adrian Egli, Erik Nygren, Sharada Mohanty
- Abstract要約: 車両再スケジュール問題(vrsp)の解法開発を目的としたフラットランドコンペティション
VRSPは、交通ネットワークにおける旅行のスケジュールと、故障が発生した場合の車両の再スケジュールに関するものである。
現代の鉄道網の複雑化は、交通の動的リアルタイムスケジューリングを事実上不可能にします。
- 参考スコア(独自算出の注目度): 49.80905654161763
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Flatland competition aimed at finding novel approaches to solve the
vehicle re-scheduling problem (VRSP). The VRSP is concerned with scheduling
trips in traffic networks and the re-scheduling of vehicles when disruptions
occur, for example the breakdown of a vehicle. While solving the VRSP in
various settings has been an active area in operations research (OR) for
decades, the ever-growing complexity of modern railway networks makes dynamic
real-time scheduling of traffic virtually impossible. Recently, multi-agent
reinforcement learning (MARL) has successfully tackled challenging tasks where
many agents need to be coordinated, such as multiplayer video games. However,
the coordination of hundreds of agents in a real-life setting like a railway
network remains challenging and the Flatland environment used for the
competition models these real-world properties in a simplified manner.
Submissions had to bring as many trains (agents) to their target stations in as
little time as possible. While the best submissions were in the OR category,
participants found many promising MARL approaches. Using both centralized and
decentralized learning based approaches, top submissions used graph
representations of the environment to construct tree-based observations.
Further, different coordination mechanisms were implemented, such as
communication and prioritization between agents. This paper presents the
competition setup, four outstanding solutions to the competition, and a
cross-comparison between them.
- Abstract(参考訳): フラットランド・コンペティションは、車両再スケジュール問題(vrsp)を解決するための新しいアプローチを見つけることを目的とした。
VRSPは、例えば車両の故障などの混乱が発生した場合、交通ネットワークでの旅行のスケジュールと車両の再スケジュールに関するものである。
様々な環境でVRSPを解くことは、何十年にもわたって運用研究(OR)の活発な領域であったが、現代の鉄道網の複雑さは、交通の動的リアルタイムスケジューリングを事実上不可能にしている。
近年,マルチエージェント強化学習(MARL)は,マルチプレイヤーゲームなど,多くのエージェントをコーディネートする必要がある課題に対処することに成功した。
しかし、鉄道ネットワークのような現実の環境で数百人のエージェントの協調は依然として困難であり、競争に使用されるフラットランド環境はこれらの現実のプロパティを簡易にモデル化する。
提案はできるだけ多くの列車(エイジェント)を目標駅にできるだけ短時間で持ち込む必要があった。
最も優れた応募はORカテゴリーであったが、参加者は多くの有望なMARLアプローチを発見した。
集中型学習と分散型学習の両方のアプローチを用いて、トップサブミッションは、木に基づく観察を構築するために環境のグラフ表現を使用した。
さらに、エージェント間のコミュニケーションや優先順位付けなど、異なる調整機構が実装された。
本稿では,コンペティションのセットアップ,コンペティションに対する4つの優れたソリューション,それらの相互比較について述べる。
関連論文リスト
- Cooperative Path Planning with Asynchronous Multiagent Reinforcement Learning [4.640948267127441]
複数のソース-決定ペア(MSD)を持つ最短経路問題(SPP)
本稿では,最短経路問題(SPP)について,複数の経路対,すなわちMSD-SPPを用いて検討し,最短経路の平均走行時間を最小化する。
論文 参考訳(メタデータ) (2024-09-01T15:48:14Z) - A Reinforcement Learning Approach for Dynamic Rebalancing in
Bike-Sharing System [11.237099288412558]
自転車シェアリングシステムはエコフレンドリーな都市移動を提供し、交通渋滞と健康的な生活様式の緩和に貢献している。
駅間で自転車を再分配するための車両を用いた効果的な再バランス戦略の開発は、オペレーターにとって非常に重要である。
本稿では,複数の車両との動的再バランス問題に対する時間的強化学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-02-05T23:46:42Z) - Optimizing Crowd-Aware Multi-Agent Path Finding through Local Communication with Graph Neural Networks [15.88107215224685]
混在環境におけるマルチエージェントパス探索 (MAPF) は, 移動計画において困難な問題となる。
本稿では,この問題を解決するために,クラウド対応の分散強化学習手法であるCRAMPを紹介する。
CRAMPは, メースパンと衝突数で測定された溶液品質を最大59%改善し, 従来の方法と比較して最大35%改善した。
論文 参考訳(メタデータ) (2023-09-19T03:02:43Z) - Learning to Sail Dynamic Networks: The MARLIN Reinforcement Learning
Framework for Congestion Control in Tactical Environments [53.08686495706487]
本稿では, 正確な並列化可能なエミュレーション環境を利用して, 戦術ネットワークの環境を再現するRLフレームワークを提案する。
衛星通信(SATCOM)とUHFワイドバンド(UHF)の無線リンク間のボトルネックリンク遷移を再現した条件下で、MARLINエージェントを訓練することにより、我々のRL学習フレームワークを評価する。
論文 参考訳(メタデータ) (2023-06-27T16:15:15Z) - NeurIPS 2022 Competition: Driving SMARTS [60.948652154552136]
ドライビングSMARTSは、動的相互作用コンテキストにおける分散シフトに起因する問題に対処するために設計された定期的な競争である。
提案するコンペティションは,強化学習(RL)やオフライン学習など,方法論的に多様なソリューションをサポートする。
論文 参考訳(メタデータ) (2022-11-14T17:10:53Z) - Value Function is All You Need: A Unified Learning Framework for Ride
Hailing Platforms [57.21078336887961]
DiDi、Uber、Lyftなどの大型配車プラットフォームは、都市内の数万台の車両を1日中数百万の乗車要求に接続している。
両課題に対処するための統合価値に基づく動的学習フレームワーク(V1D3)を提案する。
論文 参考訳(メタデータ) (2021-05-18T19:22:24Z) - Competing Adaptive Networks [56.56653763124104]
適応エージェントのチーム間での分散競争のためのアルゴリズムを開発する。
本稿では,生成的対向ニューラルネットワークの分散学習への応用について述べる。
論文 参考訳(メタデータ) (2021-03-29T14:42:15Z) - Multi-Agent Reinforcement Learning for Markov Routing Games: A New
Modeling Paradigm For Dynamic Traffic Assignment [11.093194714316434]
我々は,各エージェントが自身の経路選択ポリシーを学習し,更新するマルコフルーティングゲーム(MRG)を開発した。
知的エージェントのルーティング動作は、予測動的ユーザ均衡という古典的な概念に収束することが示されている。
論文 参考訳(メタデータ) (2020-11-22T02:31:14Z) - Multi-Agent Routing Value Iteration Network [88.38796921838203]
疎結合グラフの学習値に基づいてマルチエージェントルーティングを行うことができるグラフニューラルネットワークに基づくモデルを提案する。
最大25ノードのグラフ上で2つのエージェントでトレーニングしたモデルでは,より多くのエージェントやノードを持つ状況に容易に一般化できることが示されている。
論文 参考訳(メタデータ) (2020-07-09T22:16:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。