Fugu-MT 論文翻訳(概要): Benchmarking Autonomous Vehicles: A Driver Foundation Model Framework

論文の概要: Benchmarking Autonomous Vehicles: A Driver Foundation Model Framework

arxiv url: http://arxiv.org/abs/2602.08298v1
Date: Mon, 09 Feb 2026 06:07:48 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-23 08:17:41.271722
Title: Benchmarking Autonomous Vehicles: A Driver Foundation Model Framework
Title（参考訳）: 自動走行車のベンチマーク - ドライバファウンデーションモデルフレームワーク
Authors: Yuxin Zhang, Cheng Wang, Hubert P. H. Shum,
Abstract要約: 自動運転車(AV)をベンチマークするドライバ基盤モデル(DFM)を確立するためのフレームワークを提案する。具体的には、DFMをトレーニングするための大規模なデータセット収集戦略を説明し、そのようなモデルが持つべきコア機能について議論し、潜在的な技術的解決策を探究する。我々はDFMの概念を形式化し、AVの体系的仕様、検証、検証のための新しいパラダイムを導入することを目指している。
参考スコア（独自算出の注目度）: 29.70356862780417
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Autonomous vehicles (AVs) are poised to revolutionize global transportation systems. However, its widespread acceptance and market penetration remain significantly below expectations. This gap is primarily driven by persistent challenges in safety, comfort, commuting efficiency and energy economy when compared to the performance of experienced human drivers. We hypothesize that these challenges can be addressed through the development of a driver foundation model (DFM). Accordingly, we propose a framework for establishing DFMs to comprehensively benchmark AVs. Specifically, we describe a large-scale dataset collection strategy for training a DFM, discuss the core functionalities such a model should possess, and explore potential technical solutions to realize these functionalities. We further present the utility of the DFM across the operational spectrum, from defining human-centric safety envelopes to establishing benchmarks for energy economy. Overall, We aim to formalize the DFM concept and introduce a new paradigm for the systematic specification, verification and validation of AVs.
Abstract（参考訳）: 自動運転車(AV)は、グローバル交通システムに革命をもたらす可能性がある。しかし、広く受け入れられ、市場への浸透は期待を大きく下回っている。このギャップは主に、経験豊富なドライバーのパフォーマンスと比較して安全性、快適さ、通勤効率、エネルギー経済の持続的な課題によって引き起こされる。我々は,ドライバ基礎モデル(DFM)の開発を通じて,これらの課題に対処できると仮定する。そこで我々は,AVの総合的なベンチマークを行うための DFM の確立のためのフレームワークを提案する。具体的には、DFMをトレーニングするための大規模データセット収集戦略を説明し、そのようなモデルが持つべきコア機能について議論し、これらの機能を実現するための潜在的な技術的ソリューションを探究する。さらに、人中心の安全封筒の定義からエネルギー経済のベンチマークの確立に至るまで、運用スペクトル全体にわたるDFMの有用性について述べる。本研究の目的は,DFMの概念を形式化し,AVの体系的仕様,検証,検証のための新しいパラダイムを導入することである。

関連論文リスト

Large Multimodal Models for Embodied Intelligent Driving: The Next Frontier in Self-Driving? [68.82027978227008]
この記事では、この課題に取り組むために、新しいセマンティクスとポリシーの二重駆動型ハイブリッド決定フレームワークを紹介します。このフレームワークは、意味理解と認知表現のためのLMMと、リアルタイムポリシー最適化のための深層強化学習(DRL)を統合している。本研究は,車線変更計画作業におけるフレームワークの性能優位性を検証するための事例研究である。
論文参考訳（メタデータ） (2026-01-13T11:05:12Z)
Foundation Models for Trajectory Planning in Autonomous Driving: A Review of Progress and Open Challenges [53.47232506143113]
マルチモーダル・ファンデーション・モデルは自動運転技術に変化をもたらした。我々はこのような手法を統一分類学を通して総合的に検討する。ソースコードとデータセットのオープン性に関して,これらのアプローチを評価する。
論文参考訳（メタデータ） (2025-10-31T18:05:02Z)
Less is More: Lean yet Powerful Vision-Language Model for Autonomous Driving [7.921556303360947]
我々は,一段階のエンドツーエンド自動運転のための新しいフレームワークであるMax-V1を紹介する。我々のフレームワークは、運転の本質的にの順序性と整合した単一パス生成パラダイムを提供する。実験により,本手法はnuScenesデータセット上での最先端性能を実現する。
論文参考訳（メタデータ） (2025-09-29T05:14:18Z)
ReCogDrive: A Reinforced Cognitive Framework for End-to-End Autonomous Driving [49.07731497951963]
ReCogDriveは、エンドツーエンドの自動運転のための新しい強化認知フレームワークである。我々は、人間のドライバーのシーケンシャルな認知過程を模倣する階層的なデータパイプラインを導入する。次に、VLMの学習した運転先を拡散プランナーに注入することで、言語行動ミスマッチに対処する。
論文参考訳（メタデータ） (2025-06-09T03:14:04Z)
Foundation Models for Autonomous Driving System: An Initial Roadmap [17.198146951189635]
ファンデーションモデル(FM)の最近の進歩は、自律運転システム(ADS)を著しく強化した。 ADSは、信頼性と安全性を確保するために厳格なソフトウェアエンジニアリングプラクティスを必要とする、非常に複雑なサイバー物理システムである。我々は、FMのインフラ、その自律運転システムへの応用、そして実際の応用の3つの重要な側面を網羅して、FMを自律運転に統合するための構造化されたロードマップを提示する。
論文参考訳（メタデータ） (2025-04-01T15:45:31Z)
VLM-AD: End-to-End Autonomous Driving through Vision-Language Model Supervision [17.36342349850825]
教師としての視覚言語モデル(VLM)は、追加の監督を提供することで訓練を強化する。 VLM-ADは、nuScenesデータセットの計画精度と衝突率の大幅な改善を実現している。
論文参考訳（メタデータ） (2024-12-19T01:53:36Z)
MMA-DFER: MultiModal Adaptation of unimodal models for Dynamic Facial Expression Recognition in-the-wild [81.32127423981426]
実世界のアプリケーションでは,音声およびビデオデータに基づくマルチモーダル感情認識が重要である。近年の手法は、強力なマルチモーダルエンコーダの事前学習に自己教師付き学習(SSL)の進歩を活用することに重点を置いている。 SSL-pre-trained disimodal encoders を用いて,この問題に対する異なる視点とマルチモーダル DFER の性能向上について検討する。
論文参考訳（メタデータ） (2024-04-13T13:39:26Z)
Forging Vision Foundation Models for Autonomous Driving: Challenges, Methodologies, and Opportunities [59.02391344178202]
ビジョンファウンデーションモデル(VFM)は、幅広いAIアプリケーションのための強力なビルディングブロックとして機能する。総合的なトレーニングデータの不足、マルチセンサー統合の必要性、多様なタスク固有のアーキテクチャは、VFMの開発に重大な障害をもたらす。本稿では、自動運転に特化したVFMを鍛造する上で重要な課題について述べるとともに、今後の方向性を概説する。
論文参考訳（メタデータ） (2024-01-16T01:57:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。