論文の概要: Symphony: Learning Realistic and Diverse Agents for Autonomous Driving
Simulation
- arxiv url: http://arxiv.org/abs/2205.03195v1
- Date: Fri, 6 May 2022 13:21:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-09 14:26:53.967195
- Title: Symphony: Learning Realistic and Diverse Agents for Autonomous Driving
Simulation
- Title(参考訳): symphony: 自律運転シミュレーションのためのリアルで多様なエージェントの学習
- Authors: Maximilian Igl, Daewoo Kim, Alex Kuefler, Paul Mougin, Punit Shah,
Kyriacos Shiarlis, Dragomir Anguelov, Mark Palatucci, Brandyn White, Shimon
Whiteson
- Abstract要約: 本稿では,従来のポリシーと並列ビーム探索を組み合わせることで,リアリズムを大幅に改善するSymphonyを提案する。
Symphonyはこの問題を階層的なアプローチで解決し、エージェントの振る舞いをゴール生成とゴール条件に分解する。
実験により、交響楽団のエージェントは複数のベースラインよりも現実的で多様な行動を学ぶことが確認される。
- 参考スコア(独自算出の注目度): 45.09881984441893
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Simulation is a crucial tool for accelerating the development of autonomous
vehicles. Making simulation realistic requires models of the human road users
who interact with such cars. Such models can be obtained by applying learning
from demonstration (LfD) to trajectories observed by cars already on the road.
However, existing LfD methods are typically insufficient, yielding policies
that frequently collide or drive off the road. To address this problem, we
propose Symphony, which greatly improves realism by combining conventional
policies with a parallel beam search. The beam search refines these policies on
the fly by pruning branches that are unfavourably evaluated by a discriminator.
However, it can also harm diversity, i.e., how well the agents cover the entire
distribution of realistic behaviour, as pruning can encourage mode collapse.
Symphony addresses this issue with a hierarchical approach, factoring agent
behaviour into goal generation and goal conditioning. The use of such goals
ensures that agent diversity neither disappears during adversarial training nor
is pruned away by the beam search. Experiments on both proprietary and open
Waymo datasets confirm that Symphony agents learn more realistic and diverse
behaviour than several baselines.
- Abstract(参考訳): シミュレーションは自動運転車の開発を加速するための重要なツールである。
シミュレーションを現実的にするには、そのような車と対話する人間の道路利用者のモデルが必要である。
このようなモデルは、既に道路上で観測されている車両の軌跡に、実演(LfD)から学習を適用することで得ることができる。
しかし、既存のlfd手法は概して不十分であり、頻繁に衝突したり道路から外れたりする政策をもたらす。
この問題に対処するために,従来のポリシーと並列ビーム探索を組み合わせることで,リアリズムを大幅に改善するSymphonyを提案する。
ビームサーチは、判別器によって不当に評価される枝を刈り取ることにより、これらの方針をフライで洗練する。
しかし、これは多様性、すなわち、刈り取りがモード崩壊を促進するため、エージェントが現実的な行動の分布全体をいかにうまくカバーするかを損なうこともある。
Symphonyはこの問題を階層的なアプローチで解決し、エージェントの振る舞いをゴール生成とゴール条件に分解する。
このような目標を用いることで、敵の訓練中にエージェントの多様性が消えることも、ビームサーチによって追い払われることもなくなる。
プロプライエタリとオープン両方のWaymoデータセットの実験は、Symphonyエージェントが複数のベースラインよりも現実的で多様な振る舞いを学ぶことを確認した。
関連論文リスト
- Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Prompt to Transfer: Sim-to-Real Transfer for Traffic Signal Control with
Prompt Learning [4.195122359359966]
大規模言語モデル(LLM)は大量知識に基づいて訓練されており、驚くべき推論能力を備えていることが判明した。
本研究では,LLMを利用してシステムダイナミクスの理解と解析を行う。
論文 参考訳(メタデータ) (2023-08-28T03:49:13Z) - Optimizing Trajectories for Highway Driving with Offline Reinforcement
Learning [11.970409518725491]
自律運転に対する強化学習に基づくアプローチを提案する。
我々のエージェントの性能を他の4つのハイウェイ運転エージェントと比較する。
ランダムに収集されたデータを持つオフライントレーニングエージェントが、望ましい速度に可能な限り近い速度で、他のエージェントよりも優れた速度で、スムーズに駆動することを学ぶことを実証します。
論文 参考訳(メタデータ) (2022-03-21T13:13:08Z) - Learning Interactive Driving Policies via Data-driven Simulation [125.97811179463542]
データ駆動シミュレータは、ポリシー学習の駆動に高いデータ効率を約束する。
小さな基盤となるデータセットは、インタラクティブな運転を学ぶための興味深い、挑戦的なエッジケースを欠いていることが多い。
本研究では,ロバストな運転方針の学習に塗装されたアドカーを用いたシミュレーション手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T20:14:02Z) - Multi-Agent Variational Occlusion Inference Using People as Sensors [28.831182328958477]
エージェントの振る舞いから占有度を推定することは本質的にマルチモーダル問題である。
そこで本研究では,人間のエージェントの観察行動をセンサ測定として特徴付けるオクルージョン推論手法を提案する。
我々のアプローチは、実世界のデータセットで検証され、ベースラインを上回り、リアルタイムに有能なパフォーマンスを示す。
論文 参考訳(メタデータ) (2021-09-05T21:56:54Z) - Building Safer Autonomous Agents by Leveraging Risky Driving Behavior
Knowledge [1.52292571922932]
本研究は,モデルフリーな学習エージェントを作成するために,重交通や予期せぬランダムな行動を伴うリスクやすいシナリオの作成に重点を置いている。
ハイウェイ-envシミュレーションパッケージに新しいカスタムマルコフ決定プロセス(MDP)環境イテレーションを作成することにより、複数の自動運転シナリオを生成します。
リスクの高い運転シナリオを補足したモデル自由学習エージェントを訓練し,その性能をベースラインエージェントと比較する。
論文 参考訳(メタデータ) (2021-03-16T23:39:33Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z) - SMARTS: Scalable Multi-Agent Reinforcement Learning Training School for
Autonomous Driving [96.50297622371457]
マルチエージェントインタラクションは、現実の世界における自律運転の基本的な側面である。
研究と開発が10年以上続いたにもかかわらず、様々なシナリオで多様な道路ユーザーと対話する方法の問題は未解決のままである。
SMARTSと呼ばれる,多種多様な運転インタラクションを生成する専用シミュレーションプラットフォームを開発した。
論文 参考訳(メタデータ) (2020-10-19T18:26:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。