論文の概要: Do LLM Modules Generalize? A Study on Motion Generation for Autonomous Driving
- arxiv url: http://arxiv.org/abs/2509.02754v1
- Date: Tue, 02 Sep 2025 19:02:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 21:40:46.313336
- Title: Do LLM Modules Generalize? A Study on Motion Generation for Autonomous Driving
- Title(参考訳): LLMモジュールは一般化されるか? : 自律走行のための運動生成に関する研究
- Authors: Mingyi Wang, Jingke Wang, Tengju Ye, Junbo Chen, Kaicheng Yu,
- Abstract要約: 本稿では,5つのLLMモジュールの総合評価を行う。
適切な適応を行うと、これらのモジュールは自律走行運動生成の性能を大幅に向上させることができることを示す。
さらに、どの技術が効果的に移行できるかを特定し、他人の失敗の潜在的な原因を分析し、自律運転シナリオに必要な具体的な適応について議論する。
- 参考スコア(独自算出の注目度): 15.903491909277745
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent breakthroughs in large language models (LLMs) have not only advanced natural language processing but also inspired their application in domains with structurally similar problems--most notably, autonomous driving motion generation. Both domains involve autoregressive sequence modeling, token-based representations, and context-aware decision making, making the transfer of LLM components a natural and increasingly common practice. However, despite promising early attempts, a systematic understanding of which LLM modules are truly transferable remains lacking. In this paper, we present a comprehensive evaluation of five key LLM modules--tokenizer design, positional embedding, pre-training paradigms, post-training strategies, and test-time computation--within the context of motion generation for autonomous driving. Through extensive experiments on the Waymo Sim Agents benchmark, we demonstrate that, when appropriately adapted, these modules can significantly improve performance for autonomous driving motion generation. In addition, we identify which techniques can be effectively transferred, analyze the potential reasons for the failure of others, and discuss the specific adaptations needed for autonomous driving scenarios. We evaluate our method on the Sim Agents task and achieve competitive results.
- Abstract(参考訳): 大規模言語モデル(LLM)の最近のブレークスルーは、高度な自然言語処理だけでなく、構造的に類似した問題(特に自律走行運動生成)を持つ領域での応用にも影響を与えている。
どちらのドメインも自己回帰的なシーケンスモデリング、トークンベースの表現、文脈認識による意思決定を含んでおり、LLMコンポーネントの転送は自然でますます一般的になっている。
しかし、有望な初期の試みにもかかわらず、どのLLMモジュールが本当に転送可能であるのかという体系的な理解はいまだに欠けている。
本稿では,自動走行における動作生成の文脈を考慮した5つのLLMモジュール(トケナイザー設計,位置埋め込み,事前学習パラダイム,ポストトレーニング戦略,テスト時間計算)の総合評価を行う。
Waymo Sim Agentsベンチマークの広範な実験を通じて、適切な適応を行うと、これらのモジュールは自律走行運動生成の性能を大幅に向上させることができることを示した。
さらに、どの技術が効果的に移行できるかを特定し、他人の失敗の潜在的な原因を分析し、自律運転シナリオに必要な具体的な適応について議論する。
提案手法をSim Agentsタスクで評価し,競争力のある結果を得る。
関連論文リスト
- Self-Improving Model Steering [13.424901485601994]
SIMSは,外部の監督に頼らずに動作する最初の自己改善型モデルステアリングフレームワークである。
その中心となるSIMSは、反復的な自己改善サイクルを通じて、対照的なサンプルを自動生成し、精製する。
SIMSは, ステアリングの有効性と適応性において, 既存の手法を著しく上回っていることを示す。
論文 参考訳(メタデータ) (2025-07-11T18:52:32Z) - ADRD: LLM-Driven Autonomous Driving Based on Rule-based Decision Systems [6.950569256149267]
我々は、情報モジュール、エージェントモジュール、テストモジュールの3つのコアモジュールを統合するADRDフレームワークを紹介します。
このフレームワークは、自律運転決定タスクにおいて優れたパフォーマンスを示す。
これは、大規模な言語モデルとルールベースのシステムを統合して、自律的な運転意思決定を行う最初の作業である。
論文 参考訳(メタデータ) (2025-06-17T08:18:20Z) - LightEMMA: Lightweight End-to-End Multimodal Model for Autonomous Driving [9.447298958886265]
VLM(Vision-Language Models)は、エンドツーエンドの自動運転において大きな可能性を実証している。
光EMMA(Lightweight End-to-End Multimodal Model for autonomous driving)を紹介する。
様々なVLMを用いて12個の自律運転エージェントを構築し,その性能をnuScenes予測タスクで評価する。
論文 参考訳(メタデータ) (2025-05-01T04:12:41Z) - Large Language Models for Autonomous Driving (LLM4AD): Concept, Benchmark, Experiments, and Challenges [15.52530518623987]
大規模言語モデル(LLM)は、自律運転システムの様々な側面を強化する可能性を秘めている。
本稿では,自動走行(LLM4AD)のためのLLMの設計概念について紹介する。
LLM4ADシステムの性能とポテンシャルを徹底的に評価し、実世界の車両プラットフォーム上で一連の実験を行う。
論文 参考訳(メタデータ) (2024-10-20T04:36:19Z) - Probing Multimodal LLMs as World Models for Driving [72.18727651074563]
自律運転におけるMLLM(Multimodal Large Language Models)の適用について検討する。
GPT-4oのようなモデルの開発は進んでいるが、複雑な運転環境における性能は未解明のままである。
論文 参考訳(メタデータ) (2024-05-09T17:52:42Z) - LLM4Drive: A Survey of Large Language Models for Autonomous Driving [62.10344445241105]
大規模言語モデル(LLM)は、文脈理解、論理的推論、回答生成などの能力を示した。
本稿では,自動走行のための大規模言語モデル (LLM4AD) に関する研究ラインを体系的にレビューする。
論文 参考訳(メタデータ) (2023-11-02T07:23:33Z) - LanguageMPC: Large Language Models as Decision Makers for Autonomous Driving [84.31119464141631]
この作業では、複雑な自律運転シナリオの意思決定コンポーネントとして、Large Language Models(LLM)を採用している。
大規模実験により,提案手法は単車載タスクのベースラインアプローチを一貫して超えるだけでなく,複数車載コーディネートにおいても複雑な運転動作の処理にも有効であることが示された。
論文 参考訳(メタデータ) (2023-10-04T17:59:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。