論文の概要: Exploring the trade off between human driving imitation and safety for
traffic simulation
- arxiv url: http://arxiv.org/abs/2208.04803v1
- Date: Tue, 9 Aug 2022 14:30:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-10 13:21:25.033709
- Title: Exploring the trade off between human driving imitation and safety for
traffic simulation
- Title(参考訳): 交通シミュレーションにおける運転模倣と安全のトレードオフを探る
- Authors: Yann Koeberle, Stefano Sabatini, Dzmitry Tsishkou, Christophe Sabourin
- Abstract要約: 運転方針の学習において,人間の運転の模倣と安全維持との間にはトレードオフが存在することを示す。
両目的を協調的に改善する多目的学習アルゴリズム(MOPPO)を提案する。
- 参考スコア(独自算出の注目度): 0.34410212782758043
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Traffic simulation has gained a lot of interest for quantitative evaluation
of self driving vehicles performance. In order for a simulator to be a valuable
test bench, it is required that the driving policy animating each traffic agent
in the scene acts as humans would do while maintaining minimal safety
guarantees. Learning the driving policies of traffic agents from recorded human
driving data or through reinforcement learning seems to be an attractive
solution for the generation of realistic and highly interactive traffic
situations in uncontrolled intersections or roundabouts. In this work, we show
that a trade-off exists between imitating human driving and maintaining safety
when learning driving policies. We do this by comparing how various Imitation
learning and Reinforcement learning algorithms perform when applied to the
driving task. We also propose a multi objective learning algorithm (MOPPO) that
improves both objectives together. We test our driving policies on highly
interactive driving scenarios extracted from INTERACTION Dataset to evaluate
how human-like they behave.
- Abstract(参考訳): 交通シミュレーションは、自動運転車の性能の定量的評価に多くの関心を集めている。
シミュレータが価値のあるテストベンチとなるためには、シーン内の各トラフィックエージェントを模倣する運転ポリシーが、最小限の安全性保証を維持しながら、人間と同じように振る舞う必要がある。
記録された人間の運転データから交通エージェントの運転方針を学習したり、強化学習を通じて学習することは、制御されていない交差点やラウンドアバウトにおける現実的で高度に対話的な交通状況を生み出すための魅力的な解決策であると考えられる。
本研究は,運転政策の学習において,運転の模倣と安全維持との間にトレードオフが存在することを示す。
様々な模倣学習アルゴリズムと強化学習アルゴリズムが運転課題に適用した場合の性能を比較してこれを行う。
また、両目的を同時に改善する多目的学習アルゴリズム(MOPPO)を提案する。
我々は、インターアクションデータセットから抽出した高度にインタラクティブな運転シナリオに対して、運転ポリシーをテストする。
関連論文リスト
- Robust Driving Policy Learning with Guided Meta Reinforcement Learning [49.860391298275616]
本稿では,ソーシャルカーの多種多様な運転方針を一つのメタ政治として訓練する効率的な方法を提案する。
ソーシャルカーのインタラクションに基づく報酬関数をランダム化することにより、多様な目的を生み出し、メタ政治を効率的に訓練することができる。
本研究では,社会自動車が学習メタ政治によって制御される環境を利用して,エゴ自動車の運転方針の堅牢性を高めるためのトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2023-07-19T17:42:36Z) - Decision Making for Autonomous Driving in Interactive Merge Scenarios
via Learning-based Prediction [39.48631437946568]
本稿では,他のドライバの動作から不確実性が生ずる移動トラフィックにマージする複雑なタスクに焦点を当てる。
我々はこの問題を部分的に観測可能なマルコフ決定プロセス(POMDP)とみなし、モンテカルロ木探索でオンラインに解決する。
POMDPの解決策は、接近する車に道を譲る、前方の車から安全な距離を維持する、あるいは交通に合流するといった、高いレベルの運転操作を行う政策である。
論文 参考訳(メタデータ) (2023-03-29T16:12:45Z) - Learning Interactive Driving Policies via Data-driven Simulation [125.97811179463542]
データ駆動シミュレータは、ポリシー学習の駆動に高いデータ効率を約束する。
小さな基盤となるデータセットは、インタラクティブな運転を学ぶための興味深い、挑戦的なエッジケースを欠いていることが多い。
本研究では,ロバストな運転方針の学習に塗装されたアドカーを用いたシミュレーション手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T20:14:02Z) - Learning Interaction-aware Guidance Policies for Motion Planning in
Dense Traffic Scenarios [8.484564880157148]
本稿では,高密度交通シナリオにおける対話型モーションプランニングのための新しい枠組みを提案する。
我々は,他車両の協調性に関する国際的ガイダンスを提供するインタラクション対応政策であるDeep Reinforcement Learning (RL) を通じて学習することを提案する。
学習されたポリシーは、ローカル最適化ベースのプランナーを推論し、対話的な振る舞いで誘導し、他の車両が収まらない場合に安全を維持しながら、密集したトラフィックに積極的にマージする。
論文 参考訳(メタデータ) (2021-07-09T16:43:12Z) - Learning to drive from a world on rails [78.28647825246472]
モデルベースアプローチによって,事前記録された運転ログからインタラクティブな視覚ベースの運転方針を学習する。
世界の前方モデルは、あらゆる潜在的な運転経路の結果を予測する運転政策を監督する。
提案手法は,carla リーダボードにまずランク付けし,40 倍少ないデータを用いて25%高い運転スコアを得た。
論文 参考訳(メタデータ) (2021-05-03T05:55:30Z) - Multi-Modal Fusion Transformer for End-to-End Autonomous Driving [59.60483620730437]
画像表現とLiDAR表現を注目で統合する,新しいマルチモードフュージョントランスフォーマであるTransFuserを提案する。
本手法は, 衝突を76%低減しつつ, 最先端駆動性能を実現する。
論文 参考訳(メタデータ) (2021-04-19T11:48:13Z) - Building Safer Autonomous Agents by Leveraging Risky Driving Behavior
Knowledge [1.52292571922932]
本研究は,モデルフリーな学習エージェントを作成するために,重交通や予期せぬランダムな行動を伴うリスクやすいシナリオの作成に重点を置いている。
ハイウェイ-envシミュレーションパッケージに新しいカスタムマルコフ決定プロセス(MDP)環境イテレーションを作成することにより、複数の自動運転シナリオを生成します。
リスクの高い運転シナリオを補足したモデル自由学習エージェントを訓練し,その性能をベースラインエージェントと比較する。
論文 参考訳(メタデータ) (2021-03-16T23:39:33Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z) - Learning Accurate and Human-Like Driving using Semantic Maps and
Attention [152.48143666881418]
本稿では,より正確かつ人間らしく運転できるエンド・ツー・エンド駆動モデルについて検討する。
HERE Technologiesのセマンティックマップとビジュアルマップを活用し、既存のDrive360データセットを拡張します。
私たちのモデルは、実世界の運転データ60時間3000kmのDrive360+HEREデータセットでトレーニングされ、評価されています。
論文 参考訳(メタデータ) (2020-07-10T22:25:27Z) - Deep Reinforcement Learning for Human-Like Driving Policies in Collision
Avoidance Tasks of Self-Driving Cars [1.160208922584163]
自動運転ポリシーを生成するために,モデルフリーで深層強化学習手法を導入する。
本研究では,2車線道路における静的障害物回避タスクをシミュレーションで検討する。
このアプローチが人間ライクな運転ポリシーにつながることを実証します。
論文 参考訳(メタデータ) (2020-06-07T18:20:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。