論文の概要: Generalizing Decision Making for Automated Driving with an Invariant
Environment Representation using Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2102.06765v1
- Date: Fri, 12 Feb 2021 20:37:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-16 15:41:31.624930
- Title: Generalizing Decision Making for Automated Driving with an Invariant
Environment Representation using Deep Reinforcement Learning
- Title(参考訳): 深層強化学習を用いた不変環境表現による自動運転の一般化意思決定
- Authors: Karl Kurzer, Philip Sch\"orner, Alexander Albers, Hauke Thomsen, Karam
Daaboul, J. Marius Z\"ollner
- Abstract要約: 現在のアプローチは、トレーニングデータを超えてよく一般化されないか、または可変数のトラフィック参加者を考慮することができない。
本研究では,エゴ車の観点から不変環境表現を提案する。
この抽象化により,エージェントが未確認シナリオに対してうまく一般化できることが示される。
- 参考スコア(独自算出の注目度): 55.41644538483948
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data driven approaches for decision making applied to automated driving
require appropriate generalization strategies, to ensure applicability to the
world's variability. Current approaches either do not generalize well beyond
the training data or are not capable to consider a variable number of traffic
participants. Therefore we propose an invariant environment representation from
the perspective of the ego vehicle. The representation encodes all necessary
information for safe decision making. To assess the generalization capabilities
of the novel environment representation, we train our agents on a small subset
of scenarios and evaluate on the entire set. Here we show that the agents are
capable to generalize successfully to unseen scenarios, due to the abstraction.
In addition we present a simple occlusion model that enables our agents to
navigate intersections with occlusions without a significant change in
performance.
- Abstract(参考訳): 自動運転に適用する意思決定のためのデータ駆動アプローチは、世界の可変性に適用性を確保するために、適切な一般化戦略を必要とする。
現在のアプローチは、トレーニングデータを超えてよく一般化されないか、または可変数のトラフィック参加者を考慮することができない。
そこで我々は,エゴ車の観点から不変環境表現を提案する。
この表現は安全な意思決定に必要な情報を全て符号化する。
新規な環境表現の一般化能力を評価するために、エージェントをシナリオの小さなサブセットでトレーニングし、セット全体を評価します。
ここでは,エージェントが抽象化によって,未知のシナリオにうまく一般化できることを示す。
さらに、エージェントが性能を大きく変更することなく、閉塞を伴う交差点をナビゲートできるシンプルな閉塞モデルを提示します。
関連論文リスト
- Improving Explainable Object-induced Model through Uncertainty for
Automated Vehicles [13.514721609660521]
最近の説明可能な自動車両(AV)は、動作の説明を提供しながら、固有の不確実性に関連する重要な情報を無視している。
本研究は、意思決定の場面におけるオブジェクトの役割を優先する「対象誘導型」モデルアプローチに基づく。
また、不確実性によって導かれる先進的なトレーニング戦略についても検討する。
論文 参考訳(メタデータ) (2024-02-23T19:14:57Z) - HAZARD Challenge: Embodied Decision Making in Dynamically Changing
Environments [93.94020724735199]
HAZARDは、火災、洪水、風などの3つの予期せぬ災害シナリオで構成されている。
このベンチマークにより、さまざまなパイプラインで自律エージェントの意思決定能力を評価することができる。
論文 参考訳(メタデータ) (2024-01-23T18:59:43Z) - Controllable Safety-Critical Closed-loop Traffic Simulation via Guided
Diffusion [100.4988219600854]
誘導拡散モデルに根ざした新しいクローズドループシミュレーションフレームワークを提案する。
提案手法は, 現実の条件を密にエミュレートする現実的なロングテールシナリオの生成と, 制御性の向上という, 二つの異なる利点をもたらす。
我々はNuScenesデータセットを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Invariance is Key to Generalization: Examining the Role of
Representation in Sim-to-Real Transfer for Visual Navigation [35.01394611106655]
一般化の鍵は、すべてのタスク関連情報をキャプチャするのに十分なリッチな表現である。
このような視覚ナビゲーションの表現を実験的に研究する。
我々の表現は、トレーニングドメインとテストドメイン間のA距離を減少させる。
論文 参考訳(メタデータ) (2023-10-23T15:15:19Z) - Analysis of the Memorization and Generalization Capabilities of AI
Agents: Are Continual Learners Robust? [91.682459306359]
連続学習(CL)では、AIエージェントが動的環境下で非定常データストリームから学習する。
本稿では,過去の知識を維持しつつ,動的環境への堅牢な一般化を実現するための新しいCLフレームワークを提案する。
提案フレームワークの一般化と記憶性能を理論的に解析した。
論文 参考訳(メタデータ) (2023-09-18T21:00:01Z) - Leveraging sparse and shared feature activations for disentangled
representation learning [112.22699167017471]
本稿では,教師付きタスクの多種多様な集合から抽出した知識を活用し,共通不整合表現を学習することを提案する。
我々は6つの実世界分布シフトベンチマークと異なるデータモダリティに対するアプローチを検証する。
論文 参考訳(メタデータ) (2023-04-17T01:33:24Z) - Deep Occupancy-Predictive Representations for Autonomous Driving [6.591194329459251]
提案アーキテクチャは,事前学習した状態表現のプロキシとして確率的占有率マップを符号化している。
エージェント中心エンコーダは,環境のマップ対応グラフ定式化を利用して任意の道路網や交通状況に一般化する。
論文 参考訳(メタデータ) (2023-03-07T20:21:49Z) - Concept-modulated model-based offline reinforcement learning for rapid
generalization [5.512991103610139]
本研究では,環境概念や非教師付き手法で学習したダイナミックスに制約されたシナリオを自己生成する手法を提案する。
特に、エージェントの環境の内部モデルは、エージェントの動作に敏感な入力空間の低次元概念表現に条件付けされる。
モデルベースおよびモデルフリーアプローチと比較して,特定の障害事例の異なるインスタンスに対するワンショット一般化の劇的な改善と,同様のバリエーションに対するゼロショット一般化を示す。
論文 参考訳(メタデータ) (2022-09-07T15:06:38Z) - Dynamic Memory for Interpretable Sequential Optimisation [0.0]
大規模展開に適した非定常性を扱うためのソリューションを提案する。
動的メモリの新たな形態を取り入れた適応型ベイズ学習エージェントを開発した。
自動アズ・ア・サービス(Automatic-as-a-service)の大規模展開のアーキテクチャについて説明する。
論文 参考訳(メタデータ) (2022-06-28T12:29:13Z) - Can Autonomous Vehicles Identify, Recover From, and Adapt to
Distribution Shifts? [104.04999499189402]
トレーニング外の配布(OOD)シナリオは、デプロイ時にエージェントを学ぶ上で一般的な課題である。
インプロバスト模倣計画(RIP)と呼ばれる不確実性を考慮した計画手法を提案する。
提案手法は,OODシーンにおける過信および破滅的な外挿を低減し,分布変化を検知し,回復することができる。
分散シフトを伴うタスク群に対する駆動エージェントのロバスト性を評価するために,自動走行車ノベルシーンベンチマークであるtexttCARNOVEL を導入する。
論文 参考訳(メタデータ) (2020-06-26T11:07:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。