Fugu-MT 論文翻訳(概要): Drive My Way: Preference Alignment of Vision-Language-Action Model for Personalized Driving

論文の概要: Drive My Way: Preference Alignment of Vision-Language-Action Model for Personalized Driving

arxiv url: http://arxiv.org/abs/2603.25740v1
Date: Thu, 26 Mar 2026 17:59:54 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-27 20:52:48.433192
Title: Drive My Way: Preference Alignment of Vision-Language-Action Model for Personalized Driving
Title（参考訳）: ドライブ・マイ・ウェイ:パーソナライズドライビングのためのビジョン・ランゲージ・アクション・モデルの設定
Authors: Zehao Wang, Huaide Jiang, Shuaiwu Dong, Yuping Wang, Hang Qiu, Jiachen Li,
Abstract要約: Drive My Way(DMW)は、ユーザの長期的な運転習慣に合わせて、リアルタイムなユーザ指示に適応するパーソナライズされた運転フレームワークである。 DMWは、複数の現実のドライバーから収集したパーソナライズされた運転データセットからユーザ埋め込みを学び、計画中にこの埋め込みに関するポリシーを条件にします。私たちのデータとコードはhttps://dmw-cvpr.io/.com/で公開されています。
参考スコア（独自算出の注目度）: 18.914134572789703
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Human driving behavior is inherently personal, which is shaped by long-term habits and influenced by short-term intentions. Individuals differ in how they accelerate, brake, merge, yield, and overtake across diverse situations. However, existing end-to-end autonomous driving systems either optimize for generic objectives or rely on fixed driving modes, lacking the ability to adapt to individual preferences or interpret natural language intent. To address this gap, we propose Drive My Way (DMW), a personalized Vision-Language-Action (VLA) driving framework that aligns with users' long-term driving habits and adapts to real-time user instructions. DMW learns a user embedding from our personalized driving dataset collected across multiple real drivers and conditions the policy on this embedding during planning, while natural language instructions provide additional short-term guidance. Closed-loop evaluation on the Bench2Drive benchmark demonstrates that DMW improves style instruction adaptation, and user studies show that its generated behaviors are recognizable as each driver's own style, highlighting personalization as a key capability for human-centered autonomous driving. Our data and code are available at https://dmw-cvpr.github.io/.
Abstract（参考訳）: 人間の運転行動は本質的に個人的であり、長期の習慣によって形作られ、短期的な意図に影響される。個人は、その加速、ブレーキ、マージ、収量、そして様々な状況におけるオーバーテイクの仕方が異なる。しかし、既存のエンドツーエンドの自動運転システムは、汎用目的のために最適化するか、固定運転モードに依存し、個々の好みに適応したり、自然言語の意図を解釈する能力に欠ける。このギャップに対処するため、我々は、ユーザの長期運転習慣に適合し、リアルタイムのユーザ指示に適応するパーソナライズされたビジョン・ランゲージ・アクション(VLA)駆動フレームワークであるDrive My Way(DMW)を提案する。 DMWは、パーソナライズされた運転データセットから、複数の現実のドライバーから収集されたユーザ埋め込みと、計画中にこの埋め込みに関するポリシーを学習する一方、自然言語命令は短期的なガイダンスを提供する。 Bench2Driveベンチマークのクローズループ評価は、DMWがスタイル命令適応を改善することを示し、ユーザスタディでは、生成された振る舞いが各ドライバ独自のスタイルとして認識可能であることを示し、人間中心の自動運転の重要な能力としてパーソナライゼーションを強調している。私たちのデータとコードはhttps://dmw-cvpr.github.io/.com/で公開されています。

関連論文リスト

Vega: Learning to Drive with Natural Language Instructions [93.49357278917223]
本稿では,命令ベースの生成と計画のための統合型ビジョン・ランゲージ・ワールド・アクションモデルであるVegaを提案する。視覚入力(ビジョン)と言語指示(言語)の処理には自己回帰パラダイムを使用し、将来の予測を生成するには拡散パラダイムを用いる。提案手法は優れた計画性能を達成し,強い指示追従能力を示す。
論文参考訳（メタデータ） (2026-03-26T17:59:56Z)
Driving with A Thousand Faces: A Benchmark for Closed-Loop Personalized End-to-End Autonomous Driving [39.31712441721641]
Person2Driveは、包括的なパーソナライズされたE2E-ADプラットフォームとベンチマークである。オープンソースのフレキシブルなデータ収集システムで、現実的なシナリオをシミュレートして、パーソナライズされた運転データセットを生成する。私たちのデータセットとコードは、受け入れられてからリリースされます。
論文参考訳（メタデータ） (2026-02-21T08:42:32Z)
Vision-Language-Action Models for Autonomous Driving: Past, Present, and Future [125.92052530850425]
VLA(Vision-Language-Action)フレームワークは、認識と言語に基づく意思決定を統合する。 VLAフレームワークは、より解釈可能で、一般化可能で、人間に準拠した運転ポリシーへの道筋を提供する。この研究は、人間と互換性のある自動運転システムを構築するための一貫性のある基盤を確立することを目的としている。
論文参考訳（メタデータ） (2025-12-18T16:57:44Z)
MindDrive: A Vision-Language-Action Model for Autonomous Driving via Online Reinforcement Learning [51.20229133553804]
自律運転における現在のビジョン・ランゲージ・アクション(VLA)パラダイムは主に模倣学習(IL)に依存しているオンライン強化学習は、トライアル・アンド・エラー学習を通じてこれらの問題に対処するための有望な経路を提供する。大規模言語モデル(LLM)と2つの異なるLoRAパラメータからなるVLAフレームワークであるMindDriveを提案する。軌道レベルの報酬を推論空間に戻すことで、MindDriveは、限定的な言語駆動決定の有限セットに対する試行錯誤学習を可能にする。
論文参考訳（メタデータ） (2025-12-15T18:31:32Z)
StyleDrive: Towards Driving-Style Aware Benchmarking of End-To-End Autonomous Driving [7.525510086747996]
エンドツーエンド自動運転(E2EAD)の文脈では、パーソナライゼーションはほとんど見過ごされている。パーソナライズされたE2EAD用に明示的にキュレートされた,最初の大規模実世界のデータセットを紹介する。パーソナライズされたE2EADモデルを体系的に評価するための最初の標準ベンチマークを紹介する。
論文参考訳（メタデータ） (2025-06-30T15:48:38Z)
ReCogDrive: A Reinforced Cognitive Framework for End-to-End Autonomous Driving [49.07731497951963]
ReCogDriveは、エンドツーエンドの自動運転のための新しい強化認知フレームワークである。我々は、人間のドライバーのシーケンシャルな認知過程を模倣する階層的なデータパイプラインを導入する。次に、VLMの学習した運転先を拡散プランナーに注入することで、言語行動ミスマッチに対処する。
論文参考訳（メタデータ） (2025-06-09T03:14:04Z)
Multi-Objective Reinforcement Learning for Adaptable Personalized Autonomous Driving [9.637200409973804]
既存のエンドツーエンドの運転アプローチは、事前に定義された運転スタイルに依存したり、適応のために継続的なユーザーフィードバックを必要としたりすることが多い。本稿では,動的・文脈依存的嗜好をサポートする自律運転のための新しい学習手法を提案する。
論文参考訳（メタデータ） (2025-05-08T13:16:37Z)
On-Board Vision-Language Models for Personalized Autonomous Vehicle Motion Control: System Design and Real-World Validation [17.085548386025412]
VLM(Vision-Language Models)は、パーソナライズドライビングのための有望なソリューションを提供する。本稿では,低レイテンシなパーソナライズドライビング性能を実現する軽量で効果的なVLMフレームワークを提案する。我々のシステムは、様々なシナリオで安全で快適でパーソナライズされた運転体験を提供する能力を示した。
論文参考訳（メタデータ） (2024-11-17T23:20:37Z)
Learning Accurate and Human-Like Driving using Semantic Maps and Attention [152.48143666881418]
本稿では,より正確かつ人間らしく運転できるエンド・ツー・エンド駆動モデルについて検討する。 HERE Technologiesのセマンティックマップとビジュアルマップを活用し、既存のDrive360データセットを拡張します。私たちのモデルは、実世界の運転データ60時間3000kmのDrive360+HEREデータセットでトレーニングされ、評価されています。
論文参考訳（メタデータ） (2020-07-10T22:25:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。