論文の概要: Modeling Human Driving Behavior through Generative Adversarial Imitation
Learning
- arxiv url: http://arxiv.org/abs/2006.06412v1
- Date: Wed, 10 Jun 2020 05:47:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 05:42:54.643996
- Title: Modeling Human Driving Behavior through Generative Adversarial Imitation
Learning
- Title(参考訳): 生成的逆模倣学習による人間の運転行動のモデル化
- Authors: Raunak Bhattacharyya, Blake Wulfe, Derek Phillips, Alex Kuefler,
Jeremy Morton, Ransalu Senanayake, Mykel Kochenderfer
- Abstract要約: 本稿では、学習に基づくドライバモデリングにおけるGAIL(Generative Adversarial Imitation Learning)の使用について述べる。
ドライバモデリングは本質的にマルチエージェント問題であるため,PS-GAILと呼ばれるGAILのパラメータ共有拡張について述べる。
本稿では、報酬信号を変更し、エージェントにドメイン固有の知識を提供するReward Augmented Imitation Learning (RAIL)について述べる。
- 参考スコア(独自算出の注目度): 7.387855463533219
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Imitation learning is an approach for generating intelligent behavior when
the cost function is unknown or difficult to specify. Building upon work in
inverse reinforcement learning (IRL), Generative Adversarial Imitation Learning
(GAIL) aims to provide effective imitation even for problems with large or
continuous state and action spaces. Driver modeling is one example of a problem
where the state and action spaces are continuous. Human driving behavior is
characterized by non-linearity and stochasticity, and the underlying cost
function is unknown. As a result, learning from human driving demonstrations is
a promising approach for generating human-like driving behavior. This article
describes the use of GAIL for learning-based driver modeling. Because driver
modeling is inherently a multi-agent problem, where the interaction between
agents needs to be modeled, this paper describes a parameter-sharing extension
of GAIL called PS-GAIL to tackle multi-agent driver modeling. In addition, GAIL
is domain agnostic, making it difficult to encode specific knowledge relevant
to driving in the learning process. This paper describes Reward Augmented
Imitation Learning (RAIL), which modifies the reward signal to provide
domain-specific knowledge to the agent. Finally, human demonstrations are
dependent upon latent factors that may not be captured by GAIL. This paper
describes Burn-InfoGAIL, which allows for disentanglement of latent variability
in demonstrations. Imitation learning experiments are performed using NGSIM, a
real-world highway driving dataset. Experiments show that these modifications
to GAIL can successfully model highway driving behavior, accurately replicating
human demonstrations and generating realistic, emergent behavior in the traffic
flow arising from the interaction between driving agents.
- Abstract(参考訳): 模倣学習(imitation learning)とは、コスト関数が未知あるいは特定が難しい場合に、インテリジェントな振る舞いを生成するアプローチである。
逆強化学習(IRL)において、GAIL(Generative Adversarial Imitation Learning)は、大規模または連続的な状態や行動空間の問題に対しても効果的な模倣を提供することを目的としている。
ドライバ・モデリングは状態と行動空間が連続している問題の一例である。
人間の運転行動は非線形性と確率性が特徴であり,その基礎となるコスト関数は不明である。
結果として、人間の運転デモから学ぶことは、人間のような運転行動を生み出すための有望なアプローチである。
本稿では,学習型ドライバモデリングにおけるGAILの利用について述べる。
ドライバモデリングは本質的にはエージェント間の相互作用をモデル化する必要があるマルチエージェント問題であるので,PS-GAILと呼ばれるGAILのパラメータ共有拡張について述べる。
さらに、gailはドメインに依存しないため、学習プロセスの駆動に関連する特定の知識をエンコードすることが難しい。
本稿では、報酬信号を変更し、エージェントにドメイン固有の知識を提供するReward Augmented Imitation Learning (RAIL)について述べる。
最後に、ヒトのデモンストレーションはGAILによって捕捉されない潜在因子に依存する。
本稿では,実演における潜伏変動の解消を可能にするBurn-InfoGAILについて述べる。
実世界の高速道路走行データセットであるNGSIMを用いてシミュレーション学習実験を行う。
実験により、これらの変更は高速道路の運転行動のモデル化に成功し、人間の実演を正確に再現し、運転エージェント間の相互作用から生じる交通の流れにおいて現実的な創発的な行動を生み出すことが示されている。
関連論文リスト
- Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models [60.87795376541144]
World Model(ワールドモデル)は、エージェントの次の状態を予測できるニューラルネットワークである。
エンド・ツー・エンドのトレーニングでは、人間のデモで観察された状態と整合してエラーから回復する方法を学ぶ。
クローズドループ試験における先行技術に有意な改善がみられた定性的,定量的な結果を示す。
論文 参考訳(メタデータ) (2024-09-25T06:48:25Z) - GenFollower: Enhancing Car-Following Prediction with Large Language Models [11.847589952558566]
我々は、これらの課題に対処するために、大規模言語モデル(LLM)を活用する新しいゼロショットプロンプトアプローチであるGenFollowerを提案する。
我々は,車追従動作を言語モデリング問題として再編成し,不均一な入力をLLMのための構造化プロンプトに統合する。
オープンデータセットの実験は、GenFollowerの優れたパフォーマンスと解釈可能な洞察を提供する能力を示している。
論文 参考訳(メタデータ) (2024-07-08T04:54:42Z) - BeTAIL: Behavior Transformer Adversarial Imitation Learning from Human Racing Gameplay [48.75878234995544]
模倣学習は、手作りの報酬関数を必要とせずに、デモンストレーションからポリシーを学ぶ。
本稿では,BeTAIL: Behavior Transformer Adversarial Imitation Learningを提案する。
我々は,Gran Turismo Sportにおけるリアルヒューマンゲームプレイのエキスパートレベルのデモンストレーションで,BeTAILを3つの課題でテストした。
論文 参考訳(メタデータ) (2024-02-22T00:38:43Z) - Causal Imitative Model for Autonomous Driving [85.78593682732836]
慣性および衝突問題に対処するための因果Imitative Model (CIM)を提案する。
CIMは因果モデルを明確に発見し、ポリシーのトレーニングに利用します。
実験の結果,本手法は慣性および衝突速度において従来の手法よりも優れていたことがわかった。
論文 参考訳(メタデータ) (2021-12-07T18:59:15Z) - Learning Interactive Driving Policies via Data-driven Simulation [125.97811179463542]
データ駆動シミュレータは、ポリシー学習の駆動に高いデータ効率を約束する。
小さな基盤となるデータセットは、インタラクティブな運転を学ぶための興味深い、挑戦的なエッジケースを欠いていることが多い。
本研究では,ロバストな運転方針の学習に塗装されたアドカーを用いたシミュレーション手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T20:14:02Z) - Generative Adversarial Imitation Learning for End-to-End Autonomous
Driving on Urban Environments [0.8122270502556374]
GAIL(Generative Adversarial Imitation Learning)は、報酬関数を明示的に定義することなくポリシーを訓練することができる。
両モデルとも,訓練終了後に開始から終了まで,専門家の軌道を模倣できることを示す。
論文 参考訳(メタデータ) (2021-10-16T15:04:13Z) - Inverse Reinforcement Learning Based Stochastic Driver Behavior Learning [3.4979173592795374]
ドライバーは、交通の中で車両を操作する際に、ユニークでリッチな運転行動を持つ。
本稿では,現実的な運転シナリオにおける人間の運転行動の独特性と豊かさを捉えた,新しい運転行動学習手法を提案する。
論文 参考訳(メタデータ) (2021-07-01T20:18:03Z) - Building Safer Autonomous Agents by Leveraging Risky Driving Behavior
Knowledge [1.52292571922932]
本研究は,モデルフリーな学習エージェントを作成するために,重交通や予期せぬランダムな行動を伴うリスクやすいシナリオの作成に重点を置いている。
ハイウェイ-envシミュレーションパッケージに新しいカスタムマルコフ決定プロセス(MDP)環境イテレーションを作成することにより、複数の自動運転シナリオを生成します。
リスクの高い運転シナリオを補足したモデル自由学習エージェントを訓練し,その性能をベースラインエージェントと比較する。
論文 参考訳(メタデータ) (2021-03-16T23:39:33Z) - A Driving Behavior Recognition Model with Bi-LSTM and Multi-Scale CNN [59.57221522897815]
運転行動認識のための軌道情報に基づくニューラルネットワークモデルを提案する。
提案手法を公開BLVDデータセット上で評価し,満足な性能を実現する。
論文 参考訳(メタデータ) (2021-03-01T06:47:29Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z) - A Probabilistic Framework for Imitating Human Race Driver Behavior [31.524303667746643]
本稿では,運転行動モデリングのタスクを複数のモジュールに分割するモジュラーフレームワークProMoDを提案する。
確率的運動プリミティブを用いて大域的目標軌道分布を学習し、局所経路生成にウエイドを使用し、ニューラルネットワークにより対応する行動選択を行う。
シミュレーションカーレースセッティングの実験は、他の模倣学習アルゴリズムと比較して、模倣精度とロバスト性にかなりの利点がある。
論文 参考訳(メタデータ) (2020-01-22T20:06:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。