論文の概要: $ \text{T}^3 $OMVP: A Transformer-based Time and Team Reinforcement
Learning Scheme for Observation-constrained Multi-Vehicle Pursuit in Urban
Area
- arxiv url: http://arxiv.org/abs/2203.00183v1
- Date: Tue, 1 Mar 2022 02:19:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-02 14:22:31.211590
- Title: $ \text{T}^3 $OMVP: A Transformer-based Time and Team Reinforcement
Learning Scheme for Observation-constrained Multi-Vehicle Pursuit in Urban
Area
- Title(参考訳): $ \text{T}^3 $OMVP: 都市域における観測制約付き多車両探索のためのトランスフォーマーによる時間とチームの強化学習スキーム
- Authors: Zheng Yuan, Tianhao Wu, Qinwen Wang, Yiying Yang, Lei Li, Lin Zhang
- Abstract要約: マルチVehicle Pursuitゲーム(MVP)は、徐々にホットな研究トピックになりつつある。
都市部は、MVPゲームの解決に向けた課題として、複雑な道路構造と制限された移動空間をもたらす。
本稿では,トランスフォーマーを用いた時間とチームの強化学習手法(textT3 $OMVP)を提案する。
- 参考スコア(独自算出の注目度): 15.327768887978841
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Smart Internet of Vehicles (IoVs) combined with Artificial Intelligence (AI)
will contribute to vehicle decision-making in the Intelligent Transportation
System (ITS). Multi-Vehicle Pursuit games (MVP), a multi-vehicle cooperative
ability to capture mobile targets, is becoming a hot research topic gradually.
Although there are some achievements in the field of MVP in the open space
environment, the urban area brings complicated road structures and restricted
moving spaces as challenges to the resolution of MVP games. We define an
Observation-constrained MVP (OMVP) problem in this paper and propose a
Transformer-based Time and Team Reinforcement Learning scheme ($ \text{T}^3
$OMVP) to address the problem. First, a new multi-vehicle pursuit model is
constructed based on decentralized partially observed Markov decision processes
(Dec-POMDP) to instantiate this problem. Second, by introducing and modifying
the transformer-based observation sequence, QMIX is redefined to adapt to the
complicated road structure, restricted moving spaces and constrained
observations, so as to control vehicles to pursue the target combining the
vehicle's observations. Third, a multi-intersection urban environment is built
to verify the proposed scheme. Extensive experimental results demonstrate that
the proposed $ \text{T}^3 $OMVP scheme achieves significant improvements
relative to state-of-the-art QMIX approaches by 9.66\%\textasciitilde106.25\%.
Code is available at \url{https://github.com/pipihaiziguai/T3OMVP}.
- Abstract(参考訳): Smart Internet of Vehicles (IoVs) と人工知能 (AI) が組み合わさって、Intelligent Transportation System (ITS) における車両の意思決定に貢献する。
モバイルターゲットを捕捉するマルチ車両協調能力であるmvp(multi-vehicle pursuit games)は、徐々にホットな研究テーマになりつつある。
オープンスペース環境におけるmvpの分野にはいくつかの成果があるが、都市部では複雑な道路構造や移動スペースがmvpゲームの解決に課題となっている。
本稿では、観測制約付きMVP(OMVP)問題を定義し、その問題に対処するためのトランスフォーマーベースの時間とチームの強化学習スキーム(「text{T}^3 $OMVP」)を提案する。
まず, 分散部分観測マルコフ決定過程 (dec-pomdp) に基づいて, 新たな多車追従モデルを構築し, この問題をインスタンス化する。
第二に、トランスフォーマーに基づく観測シーケンスの導入と修正により、QMIXは、複雑な道路構造、制限された移動空間、制約された観測に適応するように再定義され、車両の観測と組み合わせた目標を追従するために車両を制御する。
第3に,提案手法を検証するため,多区間都市環境を構築した。
大規模な実験結果から、提案された $ \text{T}^3 $OMVP スキームは、最先端の QMIX アプローチに対して 9.66\%\textasciitilde106.25\% の大幅な改善を実現することが示された。
コードは \url{https://github.com/pipihaiziguai/t3omvp}で入手できる。
関連論文リスト
- Deep Perspective Transformation Based Vehicle Localization on Bird's Eye
View [0.49747156441456597]
従来のアプローチでは、環境をシミュレートする複数のセンサーのインストールに依存していた。
シーンのトップダウン表現を生成することで、代替ソリューションを提案する。
本稿では,RGB画像の視点ビューを,周囲の車両を分割した鳥眼ビューマップに変換するアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-11-12T10:16:42Z) - VT-Former: An Exploratory Study on Vehicle Trajectory Prediction for Highway Surveillance through Graph Isomorphism and Transformer [2.812395851874055]
車両軌道予測(VTP)は、車両の過去と現在の動きに基づいて将来の位置を予測することを目的としている。
VTPは道路安全の重要な要素であり、交通管理、事故防止、ワークゾーン安全性、エネルギー最適化などの応用を支援する。
本稿では,高速道路の安全と監視のための新しいトランスフォーマーベースのVTPアプローチであるVT-Formerを紹介する。
論文 参考訳(メタデータ) (2023-11-11T17:52:06Z) - Progression Cognition Reinforcement Learning with Prioritized Experience
for Multi-Vehicle Pursuit [19.00359253910912]
本稿では,都市交通現場におけるMVPの優先体験を考慮した認知強化学習を提案する。
PEPCRL-MVPは優先順位付けネットワークを使用して、各MARLエージェントのパラメータに従ってグローバルエクスペリエンス再生バッファの遷移を評価する。
PEPCRL-MVPはTD3-DMAPよりも3.95%効率を向上し、その成功率はMADDPGよりも34.78%高い。
論文 参考訳(メタデータ) (2023-06-08T08:10:46Z) - Graded-Q Reinforcement Learning with Information-Enhanced State Encoder
for Hierarchical Collaborative Multi-Vehicle Pursuit [11.195170949292496]
インテリジェントトランスポーテーションシステム(ITS)における多車追跡(MVP)の話題になりつつある。
本稿では,この階層的協調探索問題に対処するために,情報強化状態エンコーダ(GQRL-IESE)フレームワークを用いたグレードQ強化学習を提案する。
GQRL-IESEでは、車両の追従効率を向上させるための意思決定を容易にするために、協調的なグレードQスキームが提案されている。
論文 参考訳(メタデータ) (2022-10-24T16:35:34Z) - AI-aided Traffic Control Scheme for M2M Communications in the Internet
of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。
本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文 参考訳(メタデータ) (2022-03-05T10:54:05Z) - Connecting Language and Vision for Natural Language-Based Vehicle
Retrieval [77.88818029640977]
本稿では,言語記述という新たなモダリティを,興味ある車両の探索に適用する。
言語と視覚を結びつけるために,トランスフォーマーに基づく言語モデルを用いて最先端の視覚モデルを共同で訓練することを提案する。
提案手法は第5回AIシティチャレンジで1位を獲得し、18.69%のMRRの精度で競争性能を得た。
論文 参考訳(メタデータ) (2021-05-31T11:42:03Z) - End-to-end Interpretable Neural Motion Planner [78.69295676456085]
複雑な都市環境での自律走行学習のためのニューラルモーションプランナー(NMP)を提案する。
我々は,生lidarデータとhdマップを入力とし,解釈可能な中間表現を生成する全体モデルを設計した。
北米のいくつかの都市で収集された実世界の運転データにおける我々のアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2021-01-17T14:16:12Z) - Detecting 32 Pedestrian Attributes for Autonomous Vehicles [103.87351701138554]
本稿では、歩行者を共同で検出し、32の歩行者属性を認識するという課題に対処する。
本稿では,複合フィールドフレームワークを用いたマルチタスク学習(MTL)モデルを提案する。
競合検出と属性認識の結果と,より安定したMTLトレーニングを示す。
論文 参考訳(メタデータ) (2020-12-04T15:10:12Z) - A Software Architecture for Autonomous Vehicles: Team LRM-B Entry in the
First CARLA Autonomous Driving Challenge [49.976633450740145]
本稿では,シミュレーション都市環境における自律走行車両のナビゲーション設計について述べる。
我々のアーキテクチャは、CARLA Autonomous Driving Challengeの要件を満たすために作られました。
論文 参考訳(メタデータ) (2020-10-23T18:07:48Z) - Towards Autonomous Driving: a Multi-Modal 360$^{\circ}$ Perception
Proposal [87.11988786121447]
本稿では,自動運転車の3次元物体検出と追跡のためのフレームワークを提案する。
このソリューションは、新しいセンサ融合構成に基づいて、正確で信頼性の高い道路環境検出を提供する。
自動運転車に搭載されたシステムの様々なテストは、提案された知覚スタックの適合性を評価することに成功している。
論文 参考訳(メタデータ) (2020-08-21T20:36:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。