論文の概要: Exploiting Prior Knowledge in Preferential Learning of Individualized Autonomous Vehicle Driving Styles
- arxiv url: http://arxiv.org/abs/2503.15407v1
- Date: Wed, 19 Mar 2025 16:47:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-20 15:21:37.043145
- Title: Exploiting Prior Knowledge in Preferential Learning of Individualized Autonomous Vehicle Driving Styles
- Title(参考訳): 個別自動車運転スタイルの優先学習における事前知識の活用
- Authors: Lukas Theiner, Sebastian Hirt, Alexander Steinke, Rolf Findeisen,
- Abstract要約: 自動車両の軌道計画では、一般的に移動地平線上を最適化するモデル予測制御を用いる。
乗客に好まれる運転スタイルをもたらす適切なコスト関数を見つけることは、現在進行中の課題である。
我々は、乗客の好みを反復的にクエリすることでコスト関数の学習に優先的なベイズ最適化を用いる。
- 参考スコア(独自算出の注目度): 41.94295877935867
- License:
- Abstract: Trajectory planning for automated vehicles commonly employs optimization over a moving horizon - Model Predictive Control - where the cost function critically influences the resulting driving style. However, finding a suitable cost function that results in a driving style preferred by passengers remains an ongoing challenge. We employ preferential Bayesian optimization to learn the cost function by iteratively querying a passenger's preference. Due to increasing dimensionality of the parameter space, preference learning approaches might struggle to find a suitable optimum with a limited number of experiments and expose the passenger to discomfort when exploring the parameter space. We address these challenges by incorporating prior knowledge into the preferential Bayesian optimization framework. Our method constructs a virtual decision maker from real-world human driving data to guide parameter sampling. In a simulation experiment, we achieve faster convergence of the prior-knowledge-informed learning procedure compared to existing preferential Bayesian optimization approaches and reduce the number of inadequate driving styles sampled.
- Abstract(参考訳): 自動車両の軌道計画では、一般的に、コスト関数が結果の運転スタイルに重大な影響を及ぼす移動地平線(モデル予測制御)を最適化する。
しかし、乗客に好まれる運転スタイルをもたらす適切なコスト関数の発見は現在も続いている課題である。
我々は、乗客の好みを反復的にクエリすることでコスト関数の学習に優先的なベイズ最適化を用いる。
パラメータ空間の次元性の増加により、嗜好学習アプローチは、限られた実験数で最適な最適条件を見つけ出すのに苦労し、パラメータ空間を探索する際、乗客を不快に晒す。
優先的なベイズ最適化フレームワークに事前知識を組み込むことにより,これらの課題に対処する。
本手法は,実世界の人間運転データから仮想決定器を構築し,パラメータサンプリングをガイドする。
シミュレーション実験では,従来のベイズ最適化手法と比較して,事前知識インフォームド学習手法のより高速な収束を実現し,サンプリングした不適切な運転スタイルの数を削減した。
関連論文リスト
- MetaFollower: Adaptable Personalized Autonomous Car Following [63.90050686330677]
適応型パーソナライズされた自動車追従フレームワークであるMetaFollowerを提案する。
まず,モデルに依存しないメタラーニング(MAML)を用いて,様々なCFイベントから共通運転知識を抽出する。
さらに、Long Short-Term Memory (LSTM) と Intelligent Driver Model (IDM) を組み合わせて、時間的不均一性を高い解釈性で反映する。
論文 参考訳(メタデータ) (2024-06-23T15:30:40Z) - Adaptive Preference Scaling for Reinforcement Learning with Human Feedback [103.36048042664768]
人間からのフィードバックからの強化学習(RLHF)は、AIシステムと人間の価値を合わせるための一般的なアプローチである。
本稿では,分散ロバスト最適化(DRO)に基づく適応的優先損失を提案する。
提案手法は多用途であり,様々な選好最適化フレームワークに容易に適用可能である。
論文 参考訳(メタデータ) (2024-06-04T20:33:22Z) - Integrating Higher-Order Dynamics and Roadway-Compliance into
Constrained ILQR-based Trajectory Planning for Autonomous Vehicles [3.200238632208686]
軌道計画は、自動運転車のグローバルな最適ルートを作成することを目的としている。
既存の自転車キネマティックモデルを用いた実装では、制御可能な軌道は保証できない。
このモデルを、曲率と長手ジャークの1階および2階微分を含む高階項で拡張する。
論文 参考訳(メタデータ) (2023-09-25T22:30:18Z) - Bi-Level Optimization Augmented with Conditional Variational Autoencoder
for Autonomous Driving in Dense Traffic [0.9281671380673306]
本稿では、最適行動決定と結果の軌跡を共同で計算するパラメータ化バイレベル最適化を提案する。
当社のアプローチは,GPUアクセラレーションバッチを使用してリアルタイムに動作し,変分オートエンコーダがウォームスタート戦略を学習する。
本手法は, 運転効率の競争力に優れながら, 衝突速度の観点から, 最先端モデル予測制御とRLアプローチより優れる。
論文 参考訳(メタデータ) (2022-12-05T12:56:42Z) - Bayesian Optimization and Deep Learning forsteering wheel angle
prediction [58.720142291102135]
本研究の目的は,自動走行システムにおける操舵角度予測の精度の高いモデルを得ることである。
BOは限られた試行数で、BOST-LSTMと呼ばれるモデルを特定し、古典的なエンドツーエンド駆動モデルと比較して最も正確な結果を得た。
論文 参考訳(メタデータ) (2021-10-22T15:25:14Z) - Fast Rates for Contextual Linear Optimization [52.39202699484225]
提案手法は, 下流決定性能を直接最適化する手法よりもはるかに高速な, 後悔の収束率を実現する。
予測モデルは、既存のツールを使ったトレーニングが簡単かつ高速で、解釈が簡単で、私たちが示しているように、非常にうまく機能する決定につながる。
論文 参考訳(メタデータ) (2020-11-05T18:43:59Z) - Imitative Planning using Conditional Normalizing Flow [2.8978926857710263]
自律走行車のための動的な都市シナリオにおける軌道計画の一般的な方法は、明確に特定され手作業によるコスト関数に依存することである。
自律走行車(AV)の軌道計画性能向上のための正規化フローの適用について検討する。
軌道プランナーのコスト多様体をエネルギー関数としてモデル化することにより、AV制御空間上のボルツマン分布以前のシーン条件付き写像を学習する。
論文 参考訳(メタデータ) (2020-07-31T16:32:23Z) - Efficient Sampling-Based Maximum Entropy Inverse Reinforcement Learning
with Application to Autonomous Driving [35.44498286245894]
本稿では,効率的なサンプリングに基づく最大エントロピー逆強化学習(IRL)アルゴリズムを提案する。
提案アルゴリズムは,非対話的シナリオと対話的シナリオの両方を含む実運転データに基づいて評価する。
論文 参考訳(メタデータ) (2020-06-22T01:41:13Z) - Learning from Naturalistic Driving Data for Human-like Autonomous
Highway Driving [11.764518510841235]
自然な運転データから移動プランナのコストパラメータを学習する。
この学習は、選択された軌跡に対して、同一の交通状況下での人間の運転軌跡を近似させることにより達成される。
レーン変更決定と運動計画の両方について実験を行い、有望な結果を得る。
論文 参考訳(メタデータ) (2020-05-23T04:39:39Z) - Human Preference-Based Learning for High-dimensional Optimization of
Exoskeleton Walking Gaits [55.59198568303196]
この研究は、LineCoSparという、高次元でユーザの好みを学習するヒューマン・イン・ザ・ループの好みベースのフレームワークを提示する。
シミュレーションと人為的試行において,LineCoSparは高次元の選好最適化のためのサンプル効率のよい手法であることを実証的に検証した。
この結果はエキソ骨格の歩行合成に影響を及ぼし,臨床応用と患者のリハビリテーションに有効である。
論文 参考訳(メタデータ) (2020-03-13T22:02:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。