論文の概要: Distributed Deep Reinforcement Learning for Intelligent Traffic
Monitoring with a Team of Aerial Robots
- arxiv url: http://arxiv.org/abs/2107.04924v1
- Date: Sat, 10 Jul 2021 22:41:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-13 15:44:38.230292
- Title: Distributed Deep Reinforcement Learning for Intelligent Traffic
Monitoring with a Team of Aerial Robots
- Title(参考訳): 航空ロボットチームによるインテリジェントトラヒックモニタリングのための分散深層強化学習
- Authors: Behzad Khamidehi and Elvino S. Sousa
- Abstract要約: 本研究では,航空ロボットチームによる道路ネットワークにおける交通監視問題について検討する。
深層強化学習に基づく分散スケーラブルなアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 3.04585143845864
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper studies the traffic monitoring problem in a road network using a
team of aerial robots. The problem is challenging due to two main reasons.
First, the traffic events are stochastic, both temporally and spatially.
Second, the problem has a non-homogeneous structure as the traffic events
arrive at different locations of the road network at different rates.
Accordingly, some locations require more visits by the robots compared to other
locations. To address these issues, we define an uncertainty metric for each
location of the road network and formulate a path planning problem for the
aerial robots to minimize the network's average uncertainty. We express this
problem as a partially observable Markov decision process (POMDP) and propose a
distributed and scalable algorithm based on deep reinforcement learning to
solve it. We consider two different scenarios depending on the communication
mode between the agents (aerial robots) and the traffic management center
(TMC). The first scenario assumes that the agents continuously communicate with
the TMC to send/receive real-time information about the traffic events. Hence,
the agents have global and real-time knowledge of the environment. However, in
the second scenario, we consider a challenging setting where the observation of
the aerial robots is partial and limited to their sensing ranges. Moreover, in
contrast to the first scenario, the information exchange between the aerial
robots and the TMC is restricted to specific time instances. We evaluate the
performance of our proposed algorithm in both scenarios for a real road network
topology and demonstrate its functionality in a traffic monitoring system.
- Abstract(参考訳): 本稿では,航空ロボットを用いた道路網における交通監視問題について検討する。
問題は2つの主な理由から難しい。
まず、交通イベントは時間的にも空間的にも確率的です。
第二に、交通イベントが異なる速度で道路網の異なる場所に到着すると、この問題は非均質な構造となる。
そのため、場所によっては、ロボットが他の場所よりも多くの訪問を必要とする。
これらの問題に対処するために,道路網の各位置に対する不確実性指標を定義し,ネットワークの平均不確実性を最小限に抑えるための航空ロボットの経路計画問題を定式化する。
本稿では,この問題を部分可観測マルコフ決定プロセス(pomdp)として表現し,深層強化学習に基づく分散スケーラブルなアルゴリズムを提案する。
エージェント(aerial robot)と交通管理センター(traffic management center, tmc)の通信モードによって異なる2つのシナリオを検討する。
最初のシナリオでは、エージェントがTMCと継続的に通信して、トラフィックイベントに関するリアルタイム情報を送受信していると仮定する。
したがって、エージェントは環境のグローバルかつリアルタイムな知識を持っている。
しかし,第2のシナリオでは,空中ロボットの観測が部分的かつセンシング範囲に限定された,困難な設定を考える。
さらに、第1のシナリオとは対照的に、空中ロボットとTMCとの間の情報交換は特定の時間インスタンスに限定される。
本研究では,実際の道路ネットワークトポロジーにおける両シナリオにおける提案アルゴリズムの性能を評価し,その性能を交通監視システムで実証する。
関連論文リスト
- Generalizability of Graph Neural Networks for Decentralized Unlabeled Motion Planning [72.86540018081531]
ラベルなしの動作計画では、衝突回避を確保しながら、ロボットのセットを目標の場所に割り当てる。
この問題は、探査、監視、輸送などの応用において、マルチロボットシステムにとって不可欠なビルディングブロックを形成している。
この問題に対処するために、各ロボットは、その400ドルのアネレストロボットと$k$アネレストターゲットの位置のみを知っている分散環境で対処する。
論文 参考訳(メタデータ) (2024-09-29T23:57:25Z) - Towards Multi-agent Reinforcement Learning based Traffic Signal Control through Spatio-temporal Hypergraphs [19.107744041461316]
交通信号制御システム(TSCS)は、インテリジェントな交通管理に不可欠なものであり、効率的な車両の流れを育んでいる。
従来のアプローチでは、道路網を標準的なグラフに単純化することが多い。
本稿では,インテリジェントトラフィック制御を実現するための新しいTSCSフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-17T02:46:18Z) - Real-Time Network-Level Traffic Signal Control: An Explicit Multiagent
Coordination Method [9.761657423863706]
交通信号の効率的な制御 (TSC) は, 都市交通渋滞の低減に最も有用な方法の1つである。
強化学習(RL)手法を適用した最近の取り組みは、トラフィック状態を信号決定にリアルタイムでマッピングすることでポリシーをクエリすることができる。
本稿では,適応的,リアルタイム,ネットワークレベルのTSCを満足する,EMCに基づくオンライン計画手法を提案する。
論文 参考訳(メタデータ) (2023-06-15T04:08:09Z) - S2TNet: Spatio-Temporal Transformer Networks for Trajectory Prediction
in Autonomous Driving [7.862992905548721]
本稿では,S時間変換器による時空間相互作用をモデル化し,時空間変換器によるテンポレルシーケンスを扱うS2TNetを提案する。
この手法は、ApolloScape Trajectoryデータセットにおける最先端の手法を平均と最終変位誤差の重み付け和で7%以上上回る。
論文 参考訳(メタデータ) (2022-06-22T08:12:31Z) - DMGCRN: Dynamic Multi-Graph Convolution Recurrent Network for Traffic
Forecasting [7.232141271583618]
以上の問題に対処する新しい動的多重グラフ畳み込み再帰ネットワーク(DMG)を提案する。
距離に基づくグラフを用いて,距離の近いノードから空間情報をキャプチャする。
また,道路間の構造相関を符号化した新しい潜在グラフを構築し,ノードから空間情報をキャプチャする。
論文 参考訳(メタデータ) (2021-12-04T06:51:55Z) - Road Network Guided Fine-Grained Urban Traffic Flow Inference [108.64631590347352]
粗いトラフィックからのきめ細かなトラフィックフローの正確な推測は、新たな重要な問題である。
本稿では,道路ネットワークの知識を活かした新しい道路対応交通流磁化器(RATFM)を提案する。
提案手法は,高品質なトラフィックフローマップを作成できる。
論文 参考訳(メタデータ) (2021-09-29T07:51:49Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Learning Connectivity for Data Distribution in Robot Teams [96.39864514115136]
グラフニューラルネットワーク(GNN)を用いたアドホックネットワークにおけるデータ分散のためのタスク非依存,分散化,低レイテンシ手法を提案する。
当社のアプローチは、グローバル状態情報に基づいたマルチエージェントアルゴリズムを各ロボットで利用可能にすることで機能させます。
我々は,情報の平均年齢を報酬関数として強化学習を通じて分散gnn通信政策を訓練し,タスク固有の報酬関数と比較してトレーニング安定性が向上することを示す。
論文 参考訳(メタデータ) (2021-03-08T21:48:55Z) - Multi-Agent Routing Value Iteration Network [88.38796921838203]
疎結合グラフの学習値に基づいてマルチエージェントルーティングを行うことができるグラフニューラルネットワークに基づくモデルを提案する。
最大25ノードのグラフ上で2つのエージェントでトレーニングしたモデルでは,より多くのエージェントやノードを持つ状況に容易に一般化できることが示されている。
論文 参考訳(メタデータ) (2020-07-09T22:16:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。