論文の概要: Learning to Drive Safely with Hybrid Options
- arxiv url: http://arxiv.org/abs/2510.24674v1
- Date: Tue, 28 Oct 2025 17:40:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-29 15:35:37.313002
- Title: Learning to Drive Safely with Hybrid Options
- Title(参考訳): ハイブリッドオプションによる安全運転の学習
- Authors: Bram De Cooman, Johan Suykens,
- Abstract要約: 本研究は, 安全性と快適性の制約を組み込んだ縦・横操作の専用オプションを定義する。
提案手法は,最先端の強化学習手法に倣って,階層制御を選択肢付きで提案し,実用的なアルゴリズムを導出するものである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Out of the many deep reinforcement learning approaches for autonomous driving, only few make use of the options (or skills) framework. That is surprising, as this framework is naturally suited for hierarchical control applications in general, and autonomous driving tasks in specific. Therefore, in this work the options framework is applied and tailored to autonomous driving tasks on highways. More specifically, we define dedicated options for longitudinal and lateral manoeuvres with embedded safety and comfort constraints. This way, prior domain knowledge can be incorporated into the learning process and the learned driving behaviour can be constrained more easily. We propose several setups for hierarchical control with options and derive practical algorithms following state-of-the-art reinforcement learning techniques. By separately selecting actions for longitudinal and lateral control, the introduced policies over combined and hybrid options obtain the same expressiveness and flexibility that human drivers have, while being easier to interpret than classical policies over continuous actions. Of all the investigated approaches, these flexible policies over hybrid options perform the best under varying traffic conditions, outperforming the baseline policies over actions.
- Abstract(参考訳): 自律運転のための多くの深い強化学習アプローチのうち、選択肢(またはスキル)フレームワークを利用するのはごくわずかである。
このフレームワークは、一般に階層的な制御アプリケーションや、特定の自律運転タスクに自然に適しているため、驚くべきことです。
そのため、この作業では、高速道路の自動運転タスクにオプションフレームワークを適用し、調整する。
具体的には,安全性と快適さの制約を組み込んだ縦・横操作の専用オプションを定義する。
このように、事前のドメイン知識を学習プロセスに組み込むことができ、学習された駆動動作をより簡単に制約することができる。
提案手法は,最先端の強化学習手法に倣って,階層制御を選択肢付きで提案し,実用的なアルゴリズムを導出するものである。
縦方向と横方向の制御のためのアクションを別々に選択することで、統合されたオプションとハイブリッドなオプションに対するポリシーは、人間のドライバーが持つのと同じ表現力と柔軟性を得ると同時に、連続的なアクションに対する古典的なポリシーよりも容易に解釈できる。
検討されたすべてのアプローチの中で、これらのハイブリッドオプションに対する柔軟なポリシーは、様々な交通条件下で最高の性能を発揮し、アクションに対する基本方針よりも優れています。
関連論文リスト
- Hybrid Action Based Reinforcement Learning for Multi-Objective Compatible Autonomous Driving [9.39122455540358]
マルチオブジェクト対応自律運転のためのハイブリッドパラメタライズアクションを用いた多目的アンサンブル・クリティカル強化学習法を提案する。
実験により,シミュレータベースと高次元データセットベースの両方のマルチレーンハイウェイシナリオにおいて,本手法は多目的対応ポリシーを効率的に学習することを示した。
論文 参考訳(メタデータ) (2025-01-14T13:10:13Z) - RACER: Epistemic Risk-Sensitive RL Enables Fast Driving with Fewer Crashes [57.319845580050924]
本稿では,リスク感応制御と適応行動空間のカリキュラムを組み合わせた強化学習フレームワークを提案する。
提案アルゴリズムは,現実世界のオフロード運転タスクに対して,高速なポリシーを学習可能であることを示す。
論文 参考訳(メタデータ) (2024-05-07T23:32:36Z) - Robust Driving Policy Learning with Guided Meta Reinforcement Learning [49.860391298275616]
本稿では,ソーシャルカーの多種多様な運転方針を一つのメタ政治として訓練する効率的な方法を提案する。
ソーシャルカーのインタラクションに基づく報酬関数をランダム化することにより、多様な目的を生み出し、メタ政治を効率的に訓練することができる。
本研究では,社会自動車が学習メタ政治によって制御される環境を利用して,エゴ自動車の運転方針の堅牢性を高めるためのトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2023-07-19T17:42:36Z) - Optimizing Trajectories for Highway Driving with Offline Reinforcement
Learning [11.970409518725491]
自律運転に対する強化学習に基づくアプローチを提案する。
我々のエージェントの性能を他の4つのハイウェイ運転エージェントと比較する。
ランダムに収集されたデータを持つオフライントレーニングエージェントが、望ましい速度に可能な限り近い速度で、他のエージェントよりも優れた速度で、スムーズに駆動することを学ぶことを実証します。
論文 参考訳(メタデータ) (2022-03-21T13:13:08Z) - Learning Interactive Driving Policies via Data-driven Simulation [125.97811179463542]
データ駆動シミュレータは、ポリシー学習の駆動に高いデータ効率を約束する。
小さな基盤となるデータセットは、インタラクティブな運転を学ぶための興味深い、挑戦的なエッジケースを欠いていることが多い。
本研究では,ロバストな運転方針の学習に塗装されたアドカーを用いたシミュレーション手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T20:14:02Z) - Spatially and Seamlessly Hierarchical Reinforcement Learning for State
Space and Policy space in Autonomous Driving [0.9899017174990579]
状態空間と政策空間の空間的階層的強化学習法を提案する。
提案手法は, 基本的階層的強化学習法よりも優れ, 初期エピソードからほぼ最適なポリシーを導出する。
道路上の軌道は、行動計画レベルでの人間の戦略と類似していた。
論文 参考訳(メタデータ) (2021-11-10T01:35:14Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - Intelligent Roundabout Insertion using Deep Reinforcement Learning [68.8204255655161]
本稿では,多忙なラウンドアバウンドの入場を交渉できる演習計画モジュールを提案する。
提案されたモジュールは、トレーニングされたニューラルネットワークに基づいて、操作の全期間にわたって、ラウンドアバウンドに入るタイミングと方法を予測する。
論文 参考訳(メタデータ) (2020-01-03T11:16:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。