論文の概要: PADriver: Towards Personalized Autonomous Driving
- arxiv url: http://arxiv.org/abs/2505.05240v1
- Date: Thu, 08 May 2025 13:36:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-09 21:43:49.902877
- Title: PADriver: Towards Personalized Autonomous Driving
- Title(参考訳): PADriver: パーソナライズされた自律運転を目指して
- Authors: Genghua Kou, Fan Jia, Weixin Mao, Yingfei Liu, Yucheng Zhao, Ziheng Zhang, Osamu Yoshie, Tiancai Wang, Ying Li, Xiangyu Zhang,
- Abstract要約: パーソナライズされた自律運転のための新しいクローズドループフレームワークPADriverを提案する。
マルチモーダル大言語モデル(MLLM)に基づいて構築されたPADriverは、ストリーミングフレームとパーソナライズされたテキストプロンプトを入力として取り込む。
本研究では,ハイウェイ-Envシミュレータに基づくPAD-Highwayというベンチマークを構築し,交通ルールの下での判定性能を総合的に評価する。
- 参考スコア(独自算出の注目度): 27.96579880234604
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose PADriver, a novel closed-loop framework for personalized autonomous driving (PAD). Built upon Multi-modal Large Language Model (MLLM), PADriver takes streaming frames and personalized textual prompts as inputs. It autoaggressively performs scene understanding, danger level estimation and action decision. The predicted danger level reflects the risk of the potential action and provides an explicit reference for the final action, which corresponds to the preset personalized prompt. Moreover, we construct a closed-loop benchmark named PAD-Highway based on Highway-Env simulator to comprehensively evaluate the decision performance under traffic rules. The dataset contains 250 hours videos with high-quality annotation to facilitate the development of PAD behavior analysis. Experimental results on the constructed benchmark show that PADriver outperforms state-of-the-art approaches on different evaluation metrics, and enables various driving modes.
- Abstract(参考訳): 本稿では、パーソナライズされた自律運転(PAD)のための新しいクローズドループフレームワークPADriverを提案する。
マルチモーダル大言語モデル(MLLM)に基づいて構築されたPADriverは、ストリーミングフレームとパーソナライズされたテキストプロンプトを入力として取り込む。
シーン理解、危険レベル推定、行動決定を自己攻撃的に行う。
予測される危険レベルは、潜在的なアクションのリスクを反映し、予め設定されたパーソナライズされたプロンプトに対応する最終アクションの明示的な参照を提供する。
さらに,ハイウェイ-Envシミュレータに基づくPAD-Highwayというクローズドループベンチマークを構築し,交通ルールの下での判定性能を総合的に評価する。
データセットには、高品質なアノテーションを備えた250時間のビデオが含まれており、PADの振る舞い分析の開発を容易にする。
構築されたベンチマーク実験の結果、PADriverは様々な評価指標における最先端のアプローチよりも優れており、様々な駆動モードが可能であることが示された。
関連論文リスト
- X-Driver: Explainable Autonomous Driving with Vision-Language Models [6.053632514335829]
エンドツーエンドの自動運転は大幅に進歩し、システムの単純さや運転性能の向上といったメリットを提供している。
既存のフレームワークはまだクローズドループ評価の成功率の低下に悩まされており、実際のデプロイメントにおける制限を強調している。
我々は,クローズドループ自律運転用に設計された,マルチモーダルな大規模言語モデルフレームワークであるX-Driverを紹介する。
論文 参考訳(メタデータ) (2025-05-08T09:52:55Z) - DriveCoT: Integrating Chain-of-Thought Reasoning with End-to-End Driving [81.04174379726251]
本稿では,DriveCoTというエンド・ツー・エンドの運転データセットを総合的に収集する。
センサーデータ、制御決定、および推論プロセスを示すチェーン・オブ・シークレット・ラベルが含まれている。
我々は,私たちのデータセットに基づいてトレーニングされたDriveCoT-Agentと呼ばれるベースラインモデルを提案し,連鎖予測と最終決定を生成する。
論文 参考訳(メタデータ) (2024-03-25T17:59:01Z) - DeepAccident: A Motion and Accident Prediction Benchmark for V2X
Autonomous Driving [76.29141888408265]
本研究では,現実の運転において頻繁に発生する多様な事故シナリオを含む大規模データセットを提案する。
提案したDeepAccidentデータセットには57Kの注釈付きフレームと285Kの注釈付きサンプルが含まれており、これは大規模なnuScenesデータセットの約7倍である。
論文 参考訳(メタデータ) (2023-04-03T17:37:00Z) - Multimodal Manoeuvre and Trajectory Prediction for Automated Driving on
Highways Using Transformer Networks [5.571793666361683]
本稿では,複数の動作モードとその可能性を予測するための,新しいマルチモーダル予測フレームワークを提案する。
提案フレームワークは,マルチモーダルな操作および軌道予測のための調整されたトレーニング手法と,新しいトランスフォーマーに基づく予測モデルを含む。
その結果,我々のフレームワークは予測誤差の観点から,最先端のマルチモーダル手法よりも優れていた。
論文 参考訳(メタデータ) (2023-03-28T16:25:16Z) - Fully End-to-end Autonomous Driving with Semantic Depth Cloud Mapping
and Multi-Agent [2.512827436728378]
本稿では,エンド・ツー・エンドとマルチタスクの学習方法を用いて学習した新しいディープラーニングモデルを提案する。
このモデルは,CARLAシミュレータ上で,現実の環境を模倣するために,通常の状況と異なる天候のシナリオを用いて評価する。
論文 参考訳(メタデータ) (2022-04-12T03:57:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。