論文の概要: Causal Imitative Model for Autonomous Driving
- arxiv url: http://arxiv.org/abs/2112.03908v1
- Date: Tue, 7 Dec 2021 18:59:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-08 15:20:16.559525
- Title: Causal Imitative Model for Autonomous Driving
- Title(参考訳): 自律運転における因果Immitative Model
- Authors: Mohammad Reza Samsami, Mohammadhossein Bahari, Saber Salehkaleybar,
Alexandre Alahi
- Abstract要約: 慣性および衝突問題に対処するための因果Imitative Model (CIM)を提案する。
CIMは因果モデルを明確に発見し、ポリシーのトレーニングに利用します。
実験の結果,本手法は慣性および衝突速度において従来の手法よりも優れていたことがわかった。
- 参考スコア(独自算出の注目度): 85.78593682732836
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Imitation learning is a powerful approach for learning autonomous driving
policy by leveraging data from expert driver demonstrations. However, driving
policies trained via imitation learning that neglect the causal structure of
expert demonstrations yield two undesirable behaviors: inertia and collision.
In this paper, we propose Causal Imitative Model (CIM) to address inertia and
collision problems. CIM explicitly discovers the causal model and utilizes it
to train the policy. Specifically, CIM disentangles the input to a set of
latent variables, selects the causal variables, and determines the next
position by leveraging the selected variables. Our experiments show that our
method outperforms previous work in terms of inertia and collision rates.
Moreover, thanks to exploiting the causal structure, CIM shrinks the input
dimension to only two, hence, can adapt to new environments in a few-shot
setting. Code is available at https://github.com/vita-epfl/CIM.
- Abstract(参考訳): シミュレーション学習は、専門家のドライバーによるデモンストレーションのデータを活用することで、自動運転ポリシーを学ぶための強力なアプローチである。
しかし、専門家によるデモンストレーションの因果構造を無視した模倣学習を通じて訓練された運転方針は、2つの望ましくない行動(慣性と衝突)をもたらす。
本稿では,慣性および衝突問題に対処する因果Imitative Model (CIM)を提案する。
CIMは因果モデルを明確に発見し、ポリシーのトレーニングに利用します。
具体的には、cimは入力を潜在変数のセットに切り離し、因果変数を選択し、選択した変数を利用して次の位置を決定する。
実験の結果, 本手法は慣性および衝突率の点で従来の研究よりも優れていた。
さらに、因果構造を利用することにより、CIMは入力次元を2つに縮小するので、数ショット設定で新しい環境に適応することができる。
コードはhttps://github.com/vita-epfl/CIMで入手できる。
関連論文リスト
- DriveMLM: Aligning Multi-Modal Large Language Models with Behavioral
Planning States for Autonomous Driving [69.82743399946371]
DriveMLMは、現実的なシミュレータでクローズループの自律運転を実行するためのフレームワークである。
モジュールADシステムの動作計画モジュールをモデル化するために,MLLM (Multi-modal LLM) を用いる。
このモデルは、Apolloのような既存のADシステムでプラグイン・アンド・プレイすることで、クローズループ運転を行うことができる。
論文 参考訳(メタデータ) (2023-12-14T18:59:05Z) - Interpretable Imitation Learning with Dynamic Causal Relations [65.18456572421702]
得られた知識を有向非巡回因果グラフの形で公開することを提案する。
また、この因果発見プロセスを状態依存的に設計し、潜在因果グラフのダイナミクスをモデル化する。
提案するフレームワークは,動的因果探索モジュール,因果符号化モジュール,予測モジュールの3つの部分から構成され,エンドツーエンドで訓練される。
論文 参考訳(メタデータ) (2023-09-30T20:59:42Z) - On Learning the Tail Quantiles of Driving Behavior Distributions via
Quantile Regression and Flows [13.540998552232006]
本研究では,人間の運転行動確率分布の多様性とテール量子化を正確に把握する学習モデルの問題点を考察する。
この設定に2つのフレキシブルな量子学習フレームワークを適用し、強い分布仮定を避ける。
我々は1ステップの加速予測タスクと複数ステップのドライバーシミュレーションのロールアウトでアプローチを評価した。
論文 参考訳(メタデータ) (2023-05-22T15:09:04Z) - NeurIPS 2022 Competition: Driving SMARTS [60.948652154552136]
ドライビングSMARTSは、動的相互作用コンテキストにおける分散シフトに起因する問題に対処するために設計された定期的な競争である。
提案するコンペティションは,強化学習(RL)やオフライン学習など,方法論的に多様なソリューションをサポートする。
論文 参考訳(メタデータ) (2022-11-14T17:10:53Z) - Learning Latent Traits for Simulated Cooperative Driving Tasks [10.009803620912777]
我々は,人間の行動や嗜好の観点から,人間のコンパクトな潜在表現を捉えることのできるフレームワークを構築した。
そして、注意を散らす運転行動の1形態をモデル化するための軽量なシミュレーション環境、HMIway-envを構築します。
最終的にこの環境を利用して、ドライバを識別する能力と介入ポリシーの有効性の両方を定量化します。
論文 参考訳(メタデータ) (2022-07-20T02:27:18Z) - Building Safer Autonomous Agents by Leveraging Risky Driving Behavior
Knowledge [1.52292571922932]
本研究は,モデルフリーな学習エージェントを作成するために,重交通や予期せぬランダムな行動を伴うリスクやすいシナリオの作成に重点を置いている。
ハイウェイ-envシミュレーションパッケージに新しいカスタムマルコフ決定プロセス(MDP)環境イテレーションを作成することにより、複数の自動運転シナリオを生成します。
リスクの高い運転シナリオを補足したモデル自由学習エージェントを訓練し,その性能をベースラインエージェントと比較する。
論文 参考訳(メタデータ) (2021-03-16T23:39:33Z) - Injecting Knowledge in Data-driven Vehicle Trajectory Predictors [82.91398970736391]
車両軌道予測タスクは、一般的に知識駆動とデータ駆動の2つの視点から取り組まれている。
本稿では,これら2つの視点を効果的に結合する「現実的残留ブロック」 (RRB) の学習を提案する。
提案手法は,残留範囲を限定し,その不確実性を考慮した現実的な予測を行う。
論文 参考訳(メタデータ) (2021-03-08T16:03:09Z) - Motion Prediction Using Temporal Inception Module [96.76721173517895]
人間の動作を符号化するTIM(Temporal Inception Module)を提案する。
本フレームワークは,異なる入力長に対して異なるカーネルサイズを用いて,畳み込み層を用いて入力埋め込みを生成する。
標準的な動き予測ベンチマークデータセットであるHuman3.6MとCMUのモーションキャプチャデータセットの実験結果から,我々の手法は一貫して技術手法の状態を上回ります。
論文 参考訳(メタデータ) (2020-10-06T20:26:01Z) - Modeling Human Driving Behavior through Generative Adversarial Imitation
Learning [7.387855463533219]
本稿では、学習に基づくドライバモデリングにおけるGAIL(Generative Adversarial Imitation Learning)の使用について述べる。
ドライバモデリングは本質的にマルチエージェント問題であるため,PS-GAILと呼ばれるGAILのパラメータ共有拡張について述べる。
本稿では、報酬信号を変更し、エージェントにドメイン固有の知識を提供するReward Augmented Imitation Learning (RAIL)について述べる。
論文 参考訳(メタデータ) (2020-06-10T05:47:39Z) - Integrating Deep Reinforcement Learning with Model-based Path Planners
for Automated Driving [0.0]
本稿では、経路計画管を視覚ベースのDRLフレームワークに統合するためのハイブリッドアプローチを提案する。
要約すると、DRLエージェントは、パスプランナーのウェイポイントをできるだけ近くに追従するように訓練される。
実験の結果,提案手法は経路を計画し,ランダムに選択した起点-終点間を移動可能であることがわかった。
論文 参考訳(メタデータ) (2020-02-02T17:10:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。