論文の概要: Efficient Connected and Automated Driving System with Multi-agent Graph
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2007.02794v5
- Date: Fri, 22 Oct 2021 21:17:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-13 01:33:44.753656
- Title: Efficient Connected and Automated Driving System with Multi-agent Graph
Reinforcement Learning
- Title(参考訳): 多エージェントグラフ強化学習による効率的な連結自動運転システム
- Authors: Tianyu Shi, Jiawei Wang, Yuankai Wu, Luis Miranda-Moreno, Lijun Sun
- Abstract要約: 最近、コネクテッド・アンド・オートマチック・ビークル(CAV)が注目を集めている。
我々は,各自動走行車両が相互に協力関係を学べるようにすることで,交通システム全体の成果を改善する方法に焦点をあてる。
- 参考スコア(独自算出の注目度): 22.369111982782634
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Connected and automated vehicles (CAVs) have attracted more and more
attention recently. The fast actuation time allows them having the potential to
promote the efficiency and safety of the whole transportation system. Due to
technical challenges, there will be a proportion of vehicles that can be
equipped with automation while other vehicles are without automation. Instead
of learning a reliable behavior for ego automated vehicle, we focus on how to
improve the outcomes of the total transportation system by allowing each
automated vehicle to learn cooperation with each other and regulate
human-driven traffic flow. One of state of the art method is using
reinforcement learning to learn intelligent decision making policy. However,
direct reinforcement learning framework cannot improve the performance of the
whole system. In this article, we demonstrate that considering the problem in
multi-agent setting with shared policy can help achieve better system
performance than non-shared policy in single-agent setting. Furthermore, we
find that utilization of attention mechanism on interaction features can
capture the interplay between each agent in order to boost cooperation. To the
best of our knowledge, while previous automated driving studies mainly focus on
enhancing individual's driving performance, this work serves as a starting
point for research on system-level multi-agent cooperation performance using
graph information sharing. We conduct extensive experiments in car-following
and unsignalized intersection settings. The results demonstrate that CAVs
controlled by our method can achieve the best performance against several state
of the art baselines.
- Abstract(参考訳): 最近、コネクテッドと自動走行車(CAV)が注目を集めている。
迅速な作動時間は、輸送システム全体の効率と安全性を促進する可能性を秘めている。
技術的課題のため、他の車両が自動化されていない間は、自動化を装備できる車両の割合が大きくなる。
我々は,自走車における信頼性の高い行動を学ぶ代わりに,各自動車両が相互に協力関係を学習し,人力による交通の流れを調節することで,交通システム全体の成果を改善することに注力する。
技術手法の1つは、強化学習を用いて知的意思決定ポリシーを学ぶことである。
しかし、直接強化学習フレームワークはシステム全体のパフォーマンスを改善することができない。
本稿では,共有ポリシーを用いたマルチエージェント設定における問題を考えることで,単一エージェント設定における非共有ポリシーよりも優れたシステム性能を実現することができることを示す。
さらに,インタラクション機能に対する注意機構の利用により,各エージェント間の相互作用を捉え,協調性を高めることができることがわかった。
我々の知る限り、従来の自動運転研究は主に個人の運転性能の向上に焦点を当てていたが、この研究は、グラフ情報共有を用いたシステムレベルのマルチエージェント協調性能の研究の出発点となっている。
車両追従および符号なし交差点設定において広範な実験を行う。
その結果,本手法により制御されたCAVは,いくつかのアートベースラインに対して最高の性能が得られることが示された。
関連論文リスト
- SPformer: A Transformer Based DRL Decision Making Method for Connected Automated Vehicles [9.840325772591024]
本稿ではトランスフォーマーと強化学習アルゴリズムに基づくCAV意思決定アーキテクチャを提案する。
学習可能なポリシートークンは、多車連携ポリシーの学習媒体として使用される。
我々のモデルは交通シナリオにおける車両の全ての状態情報をうまく活用することができる。
論文 参考訳(メタデータ) (2024-09-23T15:16:35Z) - Learning Driver Models for Automated Vehicles via Knowledge Sharing and
Personalization [2.07180164747172]
本稿では,自動車間の知識共有とパーソナライゼーションを通じて,自動走行車(AV)ドライバモデルを学習するためのフレームワークについて述べる。
インテリジェントな輸送システム、交通管理、車両間通信など、輸送工学にまたがるいくつかの応用を見出している。
論文 参考訳(メタデータ) (2023-08-31T17:18:15Z) - FastRLAP: A System for Learning High-Speed Driving via Deep RL and
Autonomous Practicing [71.76084256567599]
本稿では、自律型小型RCカーを強化学習(RL)を用いた視覚的観察から積極的に駆動するシステムを提案する。
我々のシステムであるFastRLAP (faster lap)は、人間の介入なしに、シミュレーションや専門家によるデモンストレーションを必要とせず、現実世界で自律的に訓練する。
結果として得られたポリシーは、タイミングブレーキや回転の加速度などの突発的な運転スキルを示し、ロボットの動きを妨げる領域を避け、トレーニングの途中で同様の1対1のインタフェースを使用して人間のドライバーのパフォーマンスにアプローチする。
論文 参考訳(メタデータ) (2023-04-19T17:33:47Z) - Automatic Intersection Management in Mixed Traffic Using Reinforcement
Learning and Graph Neural Networks [0.5801044612920815]
接続された自動運転は、都市交通効率を大幅に改善する可能性がある。
協調行動計画(cooperative behavior planning)は、複数の車両の動作を協調的に最適化するために用いられる。
本研究は,協調型マルチエージェント計画における強化学習とグラフに基づくシーン表現を活用することを提案する。
論文 参考訳(メタデータ) (2023-01-30T08:21:18Z) - Unified Automatic Control of Vehicular Systems with Reinforcement
Learning [64.63619662693068]
本稿では,車載マイクロシミュレーションの合理化手法について述べる。
最小限の手動設計で高性能な制御戦略を発見する。
この研究は、波動緩和、交通信号、ランプ計測に類似した多くの創発的挙動を明らかにしている。
論文 参考訳(メタデータ) (2022-07-30T16:23:45Z) - Learning energy-efficient driving behaviors by imitating experts [75.12960180185105]
本稿では,コミュニケーション・センシングにおける制御戦略と現実的限界のギャップを埋める上で,模倣学習が果たす役割について考察する。
擬似学習は、車両の5%に採用されれば、局地的な観測のみを用いて、交通条件の異なるネットワークのエネルギー効率を15%向上させる政策を導出できることを示す。
論文 参考訳(メタデータ) (2022-06-28T17:08:31Z) - Multi-Agent Car Parking using Reinforcement Learning [0.0]
本研究は、マルチエージェント駐車場問題に強化学習を適用した。
我々は、独立学習者とマルコフ決定プロセスの形で、フレキシブルな駐車場環境を設計し、実装する。
我々は、98.1%以上の成功率で7台の車に駐車するモデルを取得し、既存のシングルエージェントモデルを大きく上回った。
論文 参考訳(メタデータ) (2022-06-22T16:50:04Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Improving Robustness of Learning-based Autonomous Steering Using
Adversarial Images [58.287120077778205]
自動運転用画像入力における学習アルゴリズムw.r.tの堅牢性を解析するためのフレームワークについて紹介する。
感度分析の結果を用いて, 「操縦への学習」 タスクの総合的性能を向上させるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-26T02:08:07Z) - A Multi-Agent Reinforcement Learning Approach For Safe and Efficient
Behavior Planning Of Connected Autonomous Vehicles [21.132777568170702]
我々は、コネクテッド・自動運転車のための情報共有型強化学習フレームワークを設計する。
提案手法は, 平均速度と快適性の観点から, CAV システムの効率性を向上させることができることを示す。
我々は,共用視覚が早期に障害物を観測し,交通渋滞を避けるために行動を起こすのに役立つことを示すために,障害物回避シナリオを構築した。
論文 参考訳(メタデータ) (2020-03-09T19:15:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。