論文の概要: Modeling Interactions of Autonomous Vehicles and Pedestrians with Deep
Multi-Agent Reinforcement Learning for Collision Avoidance
- arxiv url: http://arxiv.org/abs/2109.15266v1
- Date: Thu, 30 Sep 2021 17:06:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-01 14:59:56.009515
- Title: Modeling Interactions of Autonomous Vehicles and Pedestrians with Deep
Multi-Agent Reinforcement Learning for Collision Avoidance
- Title(参考訳): 衝突回避のための多エージェント強化学習による自動運転車と歩行者の相互作用のモデル化
- Authors: Raphael Trumpp, Harald Bayerlein and David Gesbert
- Abstract要約: 本研究では,対話系列をマルコフ決定過程 (MDP) としてモデル化し,深部強化学習 (DRL) アルゴリズムを用いて解析する。
知的歩行者行動の異なるPCAMシステムは,エージェントの衝突速度と結果の交通流効率に応じてベンチマークを行う。
その結果, AV は実験条件の大部分で完全に衝突を緩和できることがわかった。
- 参考スコア(独自算出の注目度): 20.542143534865154
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reliable pedestrian crash avoidance mitigation (PCAM) systems are crucial
components of safe autonomous vehicles (AVs). The sequential nature of the
vehicle-pedestrian interaction, i.e., where immediate decisions of one agent
directly influence the following decisions of the other agent, is an often
neglected but important aspect. In this work, we model the corresponding
interaction sequence as a Markov decision process (MDP) that is solved by deep
reinforcement learning (DRL) algorithms to define the PCAM system's policy. The
simulated driving scenario is based on an AV acting as a DRL agent driving
along an urban street, facing a pedestrian at an unmarked crosswalk who tries
to cross. Since modeling realistic crossing behavior of the pedestrian is
challenging, we introduce two levels of intelligent pedestrian behavior: While
the baseline model follows a predefined strategy, our advanced model captures
continuous learning and the inherent uncertainty in human behavior by defining
the pedestrian as a second DRL agent, i.e., we introduce a deep multi-agent
reinforcement learning (DMARL) problem. The presented PCAM system with
different levels of intelligent pedestrian behavior is benchmarked according to
the agents' collision rate and the resulting traffic flow efficiency. In this
analysis, our focus lies on evaluating the influence of observation noise on
the decision making of the agents. The results show that the AV is able to
completely mitigate collisions under the majority of the investigated
conditions and that the DRL-based pedestrian model indeed learns a more
human-like crossing behavior.
- Abstract(参考訳): 安全自動運転車(AV)の重要な構成要素は、信頼性の高い歩行者衝突回避システム(PCAM)である。
車両と歩行者の相互作用のシーケンシャルな性質、すなわち一方のエージェントの即時決定が他方のエージェントの次の決定に直接影響を与える場合、しばしば無視されるが重要な側面である。
本研究は,PCAMシステムのポリシーを定義するために,深部強化学習(DRL)アルゴリズムによって解決されるマルコフ決定過程(MDP)として対応する相互作用列をモデル化する。
シミュレーションされた運転シナリオは、都市通りを走行するDRLエージェントとして働くAVに基づいており、横断歩道で歩行者に面している。
歩行者の現実的な横断行動のモデル化は困難であるため,我々は2段階の知的歩行者行動を導入する。ベースラインモデルが事前定義された戦略に従う一方で,歩行者を第2のdrlエージェントとして定義することで,人間の行動に固有の不確実性と連続学習を捉えている。
知的歩行者行動の異なるPCAMシステムは,エージェントの衝突速度と結果の交通流効率に応じてベンチマークを行う。
本分析では,観測騒音がエージェントの意思決定に与える影響を評価することに重点を置いている。
その結果,AVは調査対象のほとんどの条件下での衝突を完全に軽減し,DRLに基づく歩行者モデルにより,より人間らしい横断行動が学べることが示唆された。
関連論文リスト
- Towards Interactive and Learnable Cooperative Driving Automation: a Large Language Model-Driven Decision-Making Framework [79.088116316919]
コネクテッド・オートモービルズ(CAV)は世界中の道路試験を開始したが、複雑なシナリオにおける安全性と効率性はまだ十分ではない。
本稿では,対話型かつ学習可能なLLM駆動協調運転フレームワークCoDrivingLLMを提案する。
論文 参考訳(メタデータ) (2024-09-19T14:36:00Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - DRUformer: Enhancing the driving scene Important object detection with
driving relationship self-understanding [50.81809690183755]
交通事故はしばしば致命傷を負い、2023年まで5000万人以上の死者を出した。
従来の研究は、主に個々の参加者の重要性を評価し、それらを独立した存在として扱うものであった。
本稿では、重要な物体検出タスクを強化するために、運転シーン関連自己理解変換器(DRUformer)を紹介する。
論文 参考訳(メタデータ) (2023-11-11T07:26:47Z) - Implicit Sensing in Traffic Optimization: Advanced Deep Reinforcement
Learning Techniques [4.042717292629285]
本稿では,Deep Reinforcement Learning(DRL)に基づく車追従・車線変更決定制御システムを提案する。
我々は、よく知られたDQNアルゴリズムを用いてRLエージェントを訓練し、適切な判断を下す。
提案したモデルの性能を,エプシロン・グレーディ・ポリシーとボルツマン・ポリシーの2つのポリシーで評価する。
論文 参考訳(メタデータ) (2023-09-25T15:33:08Z) - Decision Making for Autonomous Driving in Interactive Merge Scenarios
via Learning-based Prediction [39.48631437946568]
本稿では,他のドライバの動作から不確実性が生ずる移動トラフィックにマージする複雑なタスクに焦点を当てる。
我々はこの問題を部分的に観測可能なマルコフ決定プロセス(POMDP)とみなし、モンテカルロ木探索でオンラインに解決する。
POMDPの解決策は、接近する車に道を譲る、前方の車から安全な距離を維持する、あるいは交通に合流するといった、高いレベルの運転操作を行う政策である。
論文 参考訳(メタデータ) (2023-03-29T16:12:45Z) - Causal Imitative Model for Autonomous Driving [85.78593682732836]
慣性および衝突問題に対処するための因果Imitative Model (CIM)を提案する。
CIMは因果モデルを明確に発見し、ポリシーのトレーニングに利用します。
実験の結果,本手法は慣性および衝突速度において従来の手法よりも優れていたことがわかった。
論文 参考訳(メタデータ) (2021-12-07T18:59:15Z) - Multi-Agent Variational Occlusion Inference Using People as Sensors [28.831182328958477]
エージェントの振る舞いから占有度を推定することは本質的にマルチモーダル問題である。
そこで本研究では,人間のエージェントの観察行動をセンサ測定として特徴付けるオクルージョン推論手法を提案する。
我々のアプローチは、実世界のデータセットで検証され、ベースラインを上回り、リアルタイムに有能なパフォーマンスを示す。
論文 参考訳(メタデータ) (2021-09-05T21:56:54Z) - Deep Structured Reactive Planning [94.92994828905984]
自動運転のための新しいデータ駆動型リアクティブ計画目標を提案する。
本モデルは,非常に複雑な操作を成功させる上で,非反応性変種よりも優れることを示す。
論文 参考訳(メタデータ) (2021-01-18T01:43:36Z) - Detecting 32 Pedestrian Attributes for Autonomous Vehicles [103.87351701138554]
本稿では、歩行者を共同で検出し、32の歩行者属性を認識するという課題に対処する。
本稿では,複合フィールドフレームワークを用いたマルチタスク学習(MTL)モデルを提案する。
競合検出と属性認識の結果と,より安定したMTLトレーニングを示す。
論文 参考訳(メタデータ) (2020-12-04T15:10:12Z) - Integrating Deep Reinforcement Learning with Model-based Path Planners
for Automated Driving [0.0]
本稿では、経路計画管を視覚ベースのDRLフレームワークに統合するためのハイブリッドアプローチを提案する。
要約すると、DRLエージェントは、パスプランナーのウェイポイントをできるだけ近くに追従するように訓練される。
実験の結果,提案手法は経路を計画し,ランダムに選択した起点-終点間を移動可能であることがわかった。
論文 参考訳(メタデータ) (2020-02-02T17:10:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。