論文の概要: Level-$k$ Meta-Learning for Pedestrian-Aware Self-Driving
- arxiv url: http://arxiv.org/abs/2212.08800v1
- Date: Sat, 17 Dec 2022 05:11:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-20 15:52:32.468932
- Title: Level-$k$ Meta-Learning for Pedestrian-Aware Self-Driving
- Title(参考訳): 歩行者対応自動運転のためのレベル-k$メタラーニング
- Authors: Haozhe Lei and Quanyan Zhu
- Abstract要約: 交差点での歩行者行動の予測不能は 事故の頻度を高くする
自動運転車が車を制御し、事故を防ぐためのさまざまな歩行者行動に適応できるマシンインテリジェンスを作成する必要がある。
- 参考スコア(独自算出の注目度): 22.102728605081534
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: One challenge for self-driving cars is their interactions not only with other
vehicles but also with pedestrians in urban environments. The unpredictability
of pedestrian behaviors at intersections can lead to a high rate of accidents.
The first pedestrian fatality caused by autonomous vehicles was reported in
2018 when a self-driving Uber vehicle struck a woman crossing an intersection
in Tempe, Arizona in the nighttime. There is a need for creating machine
intelligence that allows autonomous vehicles to control the car and adapt to
different pedestrian behaviors to prevent accidents. In this work, (a) We
develop a Level-$k$ Meta Reinforcement Learning model for the vehicle-human
interactions and define its solution concept; (b) We test our LK-MRL structure
in level-$0$ pedestrians interacting with level-$1$ car scenario, compare the
trained policy with multiple baseline methods, and demonstrate its advantage in
road safety; (c) Furthermore, based on the properties of level-$k$ thinking, we
test our LK-MRL structure in level-$1$ pedestrians interacting with level-$2$
car scenario and verify by experimental results that LK-MRL maintains its
advantageous with the using of reinforcement learning of producing different
level of agents with strategies of the best response of their lower level
thinkers, which provides us possible to create higher level scenarios.
- Abstract(参考訳): 自動運転車の課題のひとつは、他の車だけでなく、都市環境の歩行者との対話だ。
交差点での歩行者行動の予測不能は、高い事故率につながる可能性がある。
自動運転車による最初の歩行者死亡事故は、2018年にアリゾナ州テンペの交差点を横断する女性に自動運転車が衝突した際に報告された。
自動運転車が車を制御し、事故を防ぐためのさまざまな歩行者行動に適応できるマシンインテリジェンスを作成する必要がある。
この作品では
(a)車と人間のインタラクションのためのレベル-k$メタ強化学習モデルを開発し、そのソリューション概念を定義する。
b)LK-MRL構造をレベル1の自動車シナリオと相互作用するレベル0の歩行者でテストし、トレーニングされたポリシーを複数のベースライン手法と比較し、道路安全におけるその優位性を実証する。
さらに、レベル-k$思考の特性に基づき、レベル-$2$カーシナリオと相互作用する歩行者1ドル分のLK-MRL構造を検証し、LK-MRLが低レベルの思考者に対して最適な反応の戦略を用いて異なるレベルのエージェントを生成することによる強化学習を使用することにより、より高レベルのシナリオを作成できることを示す。
関連論文リスト
- ReMAV: Reward Modeling of Autonomous Vehicles for Finding Likely Failure
Events [1.84926694477846]
本稿では、まず、オフライン軌道を用いて、既存の自動運転車の挙動を分析するブラックボックステストフレームワークを提案する。
実験の結果,車両衝突,道路物体衝突,歩行者衝突,オフロードステアリング事故の発生率は35,23,48,50%増加した。
論文 参考訳(メタデータ) (2023-08-28T13:09:00Z) - Robust Driving Policy Learning with Guided Meta Reinforcement Learning [49.860391298275616]
本稿では,ソーシャルカーの多種多様な運転方針を一つのメタ政治として訓練する効率的な方法を提案する。
ソーシャルカーのインタラクションに基づく報酬関数をランダム化することにより、多様な目的を生み出し、メタ政治を効率的に訓練することができる。
本研究では,社会自動車が学習メタ政治によって制御される環境を利用して,エゴ自動車の運転方針の堅牢性を高めるためのトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2023-07-19T17:42:36Z) - FastRLAP: A System for Learning High-Speed Driving via Deep RL and
Autonomous Practicing [71.76084256567599]
本稿では、自律型小型RCカーを強化学習(RL)を用いた視覚的観察から積極的に駆動するシステムを提案する。
我々のシステムであるFastRLAP (faster lap)は、人間の介入なしに、シミュレーションや専門家によるデモンストレーションを必要とせず、現実世界で自律的に訓練する。
結果として得られたポリシーは、タイミングブレーキや回転の加速度などの突発的な運転スキルを示し、ロボットの動きを妨げる領域を避け、トレーニングの途中で同様の1対1のインタフェースを使用して人間のドライバーのパフォーマンスにアプローチする。
論文 参考訳(メタデータ) (2023-04-19T17:33:47Z) - Reinforcement Learning based Cyberattack Model for Adaptive Traffic
Signal Controller in Connected Transportation Systems [61.39400591328625]
接続輸送システムにおいて、適応交通信号制御装置(ATSC)は、車両から受信したリアルタイム車両軌跡データを利用して、グリーンタイムを規制する。
この無線接続されたATSCはサイバー攻撃面を増やし、その脆弱性を様々なサイバー攻撃モードに拡大する。
そのようなモードの1つは、攻撃者がネットワーク内で偽の車両を作成する「シビル」攻撃である。
RLエージェントは、シビル車噴射の最適速度を学習し、アプローチの混雑を生じさせるように訓練される
論文 参考訳(メタデータ) (2022-10-31T20:12:17Z) - Bilateral Deep Reinforcement Learning Approach for Better-than-human Car
Following Model [0.0]
後続車は自動運転における主要な機能である。
近年の文献では、後続の車両と後続の車両がシステム安定性の向上を図っている。
両立情報と報酬関数を組み込んだ自動車追従制御のためのDeep Reinforcement Learningフレームワークを提案し,導入する。
論文 参考訳(メタデータ) (2022-03-03T17:23:36Z) - Adversarial Deep Reinforcement Learning for Trustworthy Autonomous
Driving Policies [5.254093731341154]
我々は、自動運転車の深い強化学習ポリシーの改善を支援するために、敵対的な例が利用できることを示した。
高忠実度都市運転シミュレーション環境と視覚ベース運転エージェントを用いて、敵プレイヤーを用いて再訓練した自動運転車が、その運転ポリシーの性能を著しく向上させることを実証した。
論文 参考訳(メタデータ) (2021-12-22T15:00:16Z) - Modeling Interactions of Autonomous Vehicles and Pedestrians with Deep
Multi-Agent Reinforcement Learning for Collision Avoidance [20.542143534865154]
本研究では,対話系列をマルコフ決定過程 (MDP) としてモデル化し,深部強化学習 (DRL) アルゴリズムを用いて解析する。
知的歩行者行動の異なるPCAMシステムは,エージェントの衝突速度と結果の交通流効率に応じてベンチマークを行う。
その結果, AV は実験条件の大部分で完全に衝突を緩和できることがわかった。
論文 参考訳(メタデータ) (2021-09-30T17:06:39Z) - A Reinforcement Learning Benchmark for Autonomous Driving in
Intersection Scenarios [11.365750371241154]
本稿では,RL-CISと呼ばれる複雑な交差点シナリオにおける自律走行エージェントの訓練と試験のためのベンチマークを提案する。
テストベンチマークとベースラインは、交差点シナリオにおける自動運転のためのRLの研究のための公平で包括的なトレーニングおよびテストプラットフォームを提供する。
論文 参考訳(メタデータ) (2021-09-22T07:38:23Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Emergent Road Rules In Multi-Agent Driving Environments [84.82583370858391]
運転環境の要素が道路ルールの出現の原因となるかを分析する。
2つの重要な要因が雑音知覚とエージェントの空間密度であることがわかった。
我々の結果は、世界中の国々が安全で効率的な運転で合意した社会道路規則を実証的に支持する。
論文 参考訳(メタデータ) (2020-11-21T09:43:50Z) - A Software Architecture for Autonomous Vehicles: Team LRM-B Entry in the
First CARLA Autonomous Driving Challenge [49.976633450740145]
本稿では,シミュレーション都市環境における自律走行車両のナビゲーション設計について述べる。
我々のアーキテクチャは、CARLA Autonomous Driving Challengeの要件を満たすために作られました。
論文 参考訳(メタデータ) (2020-10-23T18:07:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。