論文の概要: Multi-Agent Routing Value Iteration Network
- arxiv url: http://arxiv.org/abs/2007.05096v2
- Date: Fri, 14 Aug 2020 18:08:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-12 03:13:05.217191
- Title: Multi-Agent Routing Value Iteration Network
- Title(参考訳): マルチエージェントルーティング値イテレーションネットワーク
- Authors: Quinlan Sykora, Mengye Ren, Raquel Urtasun
- Abstract要約: 疎結合グラフの学習値に基づいてマルチエージェントルーティングを行うことができるグラフニューラルネットワークに基づくモデルを提案する。
最大25ノードのグラフ上で2つのエージェントでトレーニングしたモデルでは,より多くのエージェントやノードを持つ状況に容易に一般化できることが示されている。
- 参考スコア(独自算出の注目度): 88.38796921838203
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we tackle the problem of routing multiple agents in a
coordinated manner. This is a complex problem that has a wide range of
applications in fleet management to achieve a common goal, such as mapping from
a swarm of robots and ride sharing. Traditional methods are typically not
designed for realistic environments hich contain sparsely connected graphs and
unknown traffic, and are often too slow in runtime to be practical. In
contrast, we propose a graph neural network based model that is able to perform
multi-agent routing based on learned value iteration in a sparsely connected
graph with dynamically changing traffic conditions. Moreover, our learned
communication module enables the agents to coordinate online and adapt to
changes more effectively. We created a simulated environment to mimic realistic
mapping performed by autonomous vehicles with unknown minimum edge coverage and
traffic conditions; our approach significantly outperforms traditional solvers
both in terms of total cost and runtime. We also show that our model trained
with only two agents on graphs with a maximum of 25 nodes can easily generalize
to situations with more agents and/or nodes.
- Abstract(参考訳): 本稿では,複数のエージェントを協調的にルーティングする問題に取り組む。
これは複雑な問題であり、ロボット群からのマッピングやライドシェアリングなど、共通の目標を達成するためにフリート管理に幅広く応用されている。
従来の手法は通常、hichは疎結合なグラフと未知のトラフィックを含む現実的な環境向けに設計されていない。
これとは対照的に,交通条件が動的に変化する疎結合グラフにおいて,学習値の反復に基づくマルチエージェントルーティングを実現できるグラフニューラルネットワークモデルを提案する。
さらに,学習したコミュニケーションモジュールにより,エージェントがオンラインでコーディネートし,変更をより効果的に適応できる。
私たちは、未知のエッジカバレッジとトラフィック条件を持つ自動運転車が行う現実的なマッピングを模倣するシミュレーション環境を作成しました。
また,25ノード以上のグラフ上の2つのエージェントでトレーニングしたモデルでは,より多くのエージェントやノードの状況に容易に一般化できることを示した。
関連論文リスト
- Improving Traffic Flow Predictions with SGCN-LSTM: A Hybrid Model for Spatial and Temporal Dependencies [55.2480439325792]
本稿ではSGCN-LSTM(Signal-Enhanced Graph Convolutional Network Long Short Term Memory)モデルを提案する。
PEMS-BAYロードネットワークトラフィックデータセットの実験は、SGCN-LSTMモデルの有効性を示す。
論文 参考訳(メタデータ) (2024-11-01T00:37:00Z) - Towards Multi-agent Reinforcement Learning based Traffic Signal Control through Spatio-temporal Hypergraphs [19.107744041461316]
交通信号制御システム(TSCS)は、インテリジェントな交通管理に不可欠なものであり、効率的な車両の流れを育んでいる。
従来のアプローチでは、道路網を標準的なグラフに単純化することが多い。
本稿では,インテリジェントトラフィック制御を実現するための新しいTSCSフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-17T02:46:18Z) - Dynamic Graph Message Passing Networks for Visual Recognition [112.49513303433606]
長距離依存のモデリングは、コンピュータビジョンにおけるシーン理解タスクに不可欠である。
完全連結グラフはそのようなモデリングには有益であるが、計算オーバーヘッドは禁じられている。
本稿では,計算複雑性を大幅に低減する動的グラフメッセージパッシングネットワークを提案する。
論文 参考訳(メタデータ) (2022-09-20T14:41:37Z) - Feudal Multi-Agent Reinforcement Learning with Adaptive Network
Partition for Traffic Signal Control [44.09601435685123]
マルチエージェント強化学習 (MARL) を応用し, 交通信号制御に大きな可能性を示した。
以前の作業では、トラフィックネットワークを複数のリージョンに分割し、封建的構造におけるエージェントのポリシーを学ぶ。
適応型ネットワーク分割を用いた新しい封建的MARL手法を提案する。
論文 参考訳(メタデータ) (2022-05-27T09:02:10Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Autonomous Navigation through intersections with Graph
ConvolutionalNetworks and Conditional Imitation Learning for Self-driving
Cars [10.080958939027363]
自動運転では、信号のない交差点を通るナビゲーションは難しい作業だ。
ナビゲーションポリシー学習のための新しい分岐ネットワークG-CILを提案する。
エンドツーエンドのトレーニング可能なニューラルネットワークは、より高い成功率と短いナビゲーション時間でベースラインを上回っています。
論文 参考訳(メタデータ) (2021-02-01T07:33:12Z) - Multi-intersection Traffic Optimisation: A Benchmark Dataset and a
Strong Baseline [85.9210953301628]
交通信号の制御は、都市部の交通渋滞の緩和に必要不可欠である。
問題モデリングの複雑さが高いため、現在の作業の実験的な設定はしばしば矛盾する。
エンコーダ・デコーダ構造を用いた深層強化学習に基づく新規で強力なベースラインモデルを提案する。
論文 参考訳(メタデータ) (2021-01-24T03:55:39Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z) - Optimizing Large-Scale Fleet Management on a Road Network using
Multi-Agent Deep Reinforcement Learning with Graph Neural Network [0.8702432681310401]
本稿では,マルチエージェント強化学習とグラフニューラルネットワークを組み合わせることで,艦隊管理を最適化する新しい手法を提案する。
本研究では,実証タクシー呼出データをエミュレートした現実的なシミュレータを設計し,提案モデルの有効性を種々の条件で検証する。
論文 参考訳(メタデータ) (2020-11-12T03:01:37Z) - IG-RL: Inductive Graph Reinforcement Learning for Massive-Scale Traffic
Signal Control [4.273991039651846]
適応的な交通信号制御のスケーリングには、状態と行動空間を扱う必要がある。
本稿では,グラフ畳み込みネットワークに基づくインダクティブグラフ強化学習(IG-RL)を紹介する。
我々のモデルは、新しい道路網、交通分布、交通体制に一般化することができる。
論文 参考訳(メタデータ) (2020-03-06T17:17:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。