論文の概要: Multi-Objective Reinforcement Learning for Adaptive Personalized Autonomous Driving
- arxiv url: http://arxiv.org/abs/2505.05223v1
- Date: Thu, 08 May 2025 13:16:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-09 21:43:49.89275
- Title: Multi-Objective Reinforcement Learning for Adaptive Personalized Autonomous Driving
- Title(参考訳): 適応型パーソナライズされた自律運転のための多目的強化学習
- Authors: Hendrik Surmann, Jorge de Heuvel, Maren Bennewitz,
- Abstract要約: 既存のエンドツーエンドの運転アプローチは、事前に定義された運転スタイルに依存したり、適応のために継続的なユーザーフィードバックを必要としたりすることが多い。
本稿では,動的・文脈依存的嗜好をサポートする自律運転のための新しい学習手法を提案する。
- 参考スコア(独自算出の注目度): 9.637200409973804
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human drivers exhibit individual preferences regarding driving style. Adapting autonomous vehicles to these preferences is essential for user trust and satisfaction. However, existing end-to-end driving approaches often rely on predefined driving styles or require continuous user feedback for adaptation, limiting their ability to support dynamic, context-dependent preferences. We propose a novel approach using multi-objective reinforcement learning (MORL) with preference-driven optimization for end-to-end autonomous driving that enables runtime adaptation to driving style preferences. Preferences are encoded as continuous weight vectors to modulate behavior along interpretable style objectives$\unicode{x2013}$including efficiency, comfort, speed, and aggressiveness$\unicode{x2013}$without requiring policy retraining. Our single-policy agent integrates vision-based perception in complex mixed-traffic scenarios and is evaluated in diverse urban environments using the CARLA simulator. Experimental results demonstrate that the agent dynamically adapts its driving behavior according to changing preferences while maintaining performance in terms of collision avoidance and route completion.
- Abstract(参考訳): 人間のドライバーは運転スタイルに関する個人の好みを示す。
自動運転車をこれらの好みに適応させることは、ユーザの信頼と満足度に不可欠である。
しかし、既存のエンドツーエンドの運転アプローチは、しばしば事前に定義された運転スタイルに依存したり、適応のために継続的なユーザーフィードバックを必要とし、動的でコンテキストに依存した好みをサポートする能力を制限する。
本稿では,多目的強化学習(MORL)を用いて,運転スタイルの嗜好へのランタイム適応を可能にする,エンドツーエンド自律運転の優先駆動最適化を提案する。
予測は、解釈可能なスタイルの目的に沿った振る舞いを変調する連続重みベクトルとしてエンコードされる。$\unicode{x2013}$ 効率、快適性、スピード、攻撃性を含む。
我々の単一政治エージェントは複雑な混合交通シナリオにおいて視覚に基づく認識を統合し、CARLAシミュレータを用いて様々な都市環境において評価される。
実験の結果,衝突回避と経路完了の両面で性能を維持しつつ,好みの変化に応じてエージェントが動的に運転行動に適応することが確認された。
関連論文リスト
- Few-shot Steerable Alignment: Adapting Rewards and LLM Policies with Neural Processes [50.544186914115045]
大きな言語モデル(LLM)は、日々のアプリケーションにますます組み込まれています。
個人ユーザの多様な嗜好との整合性を確保することは、重要な課題となっている。
数発のステアライメントのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-18T16:14:59Z) - On-Board Vision-Language Models for Personalized Autonomous Vehicle Motion Control: System Design and Real-World Validation [17.085548386025412]
VLM(Vision-Language Models)は、パーソナライズドライビングのための有望なソリューションを提供する。
本稿では,低レイテンシなパーソナライズドライビング性能を実現する軽量で効果的なVLMフレームワークを提案する。
我々のシステムは、様々なシナリオで安全で快適でパーソナライズされた運転体験を提供する能力を示した。
論文 参考訳(メタデータ) (2024-11-17T23:20:37Z) - DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving [55.53171248839489]
我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesとBench2Driveデータセットで実施された実験は、DiFSDの優れた計画性能と優れた効率を実証している。
論文 参考訳(メタデータ) (2024-09-15T15:55:24Z) - MetaFollower: Adaptable Personalized Autonomous Car Following [63.90050686330677]
適応型パーソナライズされた自動車追従フレームワークであるMetaFollowerを提案する。
まず,モデルに依存しないメタラーニング(MAML)を用いて,様々なCFイベントから共通運転知識を抽出する。
さらに、Long Short-Term Memory (LSTM) と Intelligent Driver Model (IDM) を組み合わせて、時間的不均一性を高い解釈性で反映する。
論文 参考訳(メタデータ) (2024-06-23T15:30:40Z) - Looking for a better fit? An Incremental Learning Multimodal Object
Referencing Framework adapting to Individual Drivers [0.0]
自動車産業の急速な進歩により、タッチベースや音声コマンドシステムといった従来の車両のインタラクション方法は、車両外の物体を参照するなど、幅広い非運転関連のタスクには不十分である。
textitIcRegressは、オブジェクトの駆動と参照という2つのタスクに携わるドライバーの振る舞いや特徴に適応する、新しい回帰に基づく漸進的学習手法である。
論文 参考訳(メタデータ) (2024-01-29T12:48:56Z) - Bi-Level Optimization Augmented with Conditional Variational Autoencoder
for Autonomous Driving in Dense Traffic [0.9281671380673306]
本稿では、最適行動決定と結果の軌跡を共同で計算するパラメータ化バイレベル最適化を提案する。
当社のアプローチは,GPUアクセラレーションバッチを使用してリアルタイムに動作し,変分オートエンコーダがウォームスタート戦略を学習する。
本手法は, 運転効率の競争力に優れながら, 衝突速度の観点から, 最先端モデル予測制御とRLアプローチより優れる。
論文 参考訳(メタデータ) (2022-12-05T12:56:42Z) - Calibration of Human Driving Behavior and Preference Using Naturalistic
Traffic Data [5.926030548326619]
自然トラフィックデータからドライバの好みを推定するためにモデルをどのように反転させることができるかを示す。
我々のアプローチの際立った利点は、計算負担を大幅に削減することである。
論文 参考訳(メタデータ) (2021-05-05T01:20:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。