論文の概要: A Survey on Large Language Model-empowered Autonomous Driving
- arxiv url: http://arxiv.org/abs/2409.14165v3
- Date: Sat, 30 Nov 2024 22:21:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-03 16:56:48.548457
- Title: A Survey on Large Language Model-empowered Autonomous Driving
- Title(参考訳): 大規模言語モデルを用いた自律運転に関する調査研究
- Authors: Yuxuan Zhu, Shiyi Wang, Wenqing Zhong, Nianchen Shen, Yunqi Li, Siqi Wang, Zhiheng Li, Cathy Wu, Zhengbing He, Li Li,
- Abstract要約: 自律運転(AD)技術の開発は、モジュール化とエンドツーエンドの2つの主要な技術的パスに従っている。
本稿では,ADシステムにおける大規模言語モデル(LLM)の適用可能性について,詳細な分析を行う。
LLMベースの人工知能(AGI)がハイレベルADを実現する鍵となるのか?
- 参考スコア(独自算出の注目度): 25.963195890376646
- License:
- Abstract: Artificial intelligence (AI) plays a crucial role in autonomous driving (AD) research, propelling its development towards intelligence and efficiency. Currently, the development of AD technology follows two main technical paths: modularization and end-to-end. Modularization decompose the driving task into modules such as perception, prediction, planning, and control, and train them separately. Due to the inconsistency of training objectives between modules, the integrated effect suffers from bias. End-to-end attempts to address this issue by utilizing a single model that directly maps from sensor data to control signals. This path has limited learning capabilities in a comprehensive set of features and struggles to handle unpredictable long-tail events and complex urban traffic scenarios. In the face of challenges encountered in both paths, many researchers believe that large language models (LLMs) with powerful reasoning capabilities and extensive knowledge understanding may be the solution, expecting LLMs to provide AD systems with deeper levels of understanding and decision-making capabilities. In light of the challenges faced by both paths, many researchers believe that LLMs, with their powerful reasoning abilities and extensive knowledge, could offer a solution. To understand if LLMs could enhance AD, this paper conducts a thorough analysis of the potential applications of LLMs in AD systems, including exploring their optimization strategies in both modular and end-to-end approaches, with a particular focus on how LLMs can tackle the problems and challenges present in current solutions. Furthermore, we discuss an important question: Can LLM-based artificial general intelligence (AGI) be a key to achieve high-level AD? We further analyze the potential limitations and challenges that LLMs may encounter in promoting the development of AD technology.
- Abstract(参考訳): 人工知能(AI)は自律運転(AD)研究において重要な役割を担い、知性と効率性に向けた開発を推進している。
現在、AD技術の開発は、モジュール化とエンドツーエンドの2つの主要な技術パスに従っている。
モジュール化は、駆動タスクを知覚、予測、計画、制御といったモジュールに分解し、個別に訓練する。
モジュール間のトレーニング目標の不整合のため、統合効果はバイアスに悩まされる。
エンドツーエンドでは、センサデータから制御信号に直接マップする単一のモデルを使用することで、この問題に対処しようとする。
このパスは、予測不可能なロングテールイベントや複雑な都市交通シナリオを扱うために、包括的な機能セットでの学習能力に制限がある。
両方の経路で遭遇する課題に直面して、多くの研究者は、強力な推論能力と広範な知識理解を備えた大規模言語モデル(LLM)が解決策であり、LLMがより深いレベルの理解と意思決定能力を持つADシステムを提供することを期待している。
両方の経路が直面する課題に照らして、LLMは強力な推論能力と豊富な知識を持ち、解決策をもたらすと多くの研究者が信じている。
LLMがADを向上できるかどうかを理解するため,本論文では,ADシステムにおけるLLMの潜在的な応用を徹底的に分析し,モジュールとエンドツーエンドの両方のアプローチにおける最適化戦略を探求するとともに,現在のソリューションにおける問題や課題にLLMがどう対処できるかに焦点をあてる。
LLMベースの人工知能(AGI)がハイレベルADを実現する鍵となるのか?
我々はさらに,LLMがAD技術の発展を促進する上で直面する可能性の限界と課題について分析する。
関連論文リスト
- BloomWise: Enhancing Problem-Solving capabilities of Large Language Models using Bloom's-Taxonomy-Inspired Prompts [59.83547898874152]
我々は,Bloomの分類にインスパイアされた新しいプロンプト技術であるBloomWiseを導入し,Large Language Models(LLMs)の性能を向上させる。
より洗練された認知スキルを身につける必要性に関する決定は、LLMによる自己評価に基づいている。
4つの一般的な算数推論データセットの広範な実験において,提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2024-10-05T09:27:52Z) - Cognitive LLMs: Towards Integrating Cognitive Architectures and Large Language Models for Manufacturing Decision-making [51.737762570776006]
LLM-ACTRは、ヒトに適応し、多目的な意思決定を提供する新しいニューロシンボリックアーキテクチャである。
我々のフレームワークは、ACT-Rの内部決定過程の知識を潜在神経表現として抽出し、組み込む。
デザイン・フォー・マニュファクチャリング・タスクに関する我々の実験は、タスク性能の向上と基礎的意思決定能力の向上を両立させたものである。
論文 参考訳(メタデータ) (2024-08-17T11:49:53Z) - MoExtend: Tuning New Experts for Modality and Task Extension [61.29100693866109]
MoExtendは、Mixture-of-Experts (MoE)モデルのモダリティ適応と拡張を効率化する効果的なフレームワークである。
MoExtendは、新しいエキスパートをトレーニング済みのMoEモデルにシームレスに統合し、トレーニング済みのモデルをチューニングすることなく、新しい知識を提供する。
論文 参考訳(メタデータ) (2024-08-07T02:28:37Z) - Large Language Models for Human-like Autonomous Driving: A Survey [7.125039718268125]
大規模言語モデル(LLMs)は、言語理解と生成機能を備えた巨大なテキストコーパスでトレーニングされたAIモデルである。
この調査は、LLMを自律運転に活用する進捗状況についてレビューする。
モジュール型のADパイプラインとエンドツーエンドのADシステムにおける彼らのアプリケーションに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-27T15:24:11Z) - Solution-oriented Agent-based Models Generation with Verifier-assisted
Iterative In-context Learning [10.67134969207797]
エージェントベースのモデル(ABM)は、仮説的な解決策やポリシーの提案と検証に不可欠なパラダイムである。
大きな言語モデル(LLM)は、ドメイン間の知識とプログラミング能力をカプセル化することで、このプロセスの難しさを軽減できる可能性がある。
SAGEは、ターゲット問題に対する自動モデリングおよびソリューション生成のために設計された、汎用的なソリューション指向のABM生成フレームワークである。
論文 参考訳(メタデータ) (2024-02-04T07:59:06Z) - Empowering Autonomous Driving with Large Language Models: A Safety Perspective [82.90376711290808]
本稿では,Large Language Models (LLM) の自律運転システムへの統合について検討する。
LLMは行動計画におけるインテリジェントな意思決定者であり、文脈的安全学習のための安全検証シールドを備えている。
適応型LLM条件モデル予測制御(MPC)と状態機械を用いたLLM対応対話型行動計画スキームという,シミュレーション環境における2つの重要な研究について述べる。
論文 参考訳(メタデータ) (2023-11-28T03:13:09Z) - LLM4Drive: A Survey of Large Language Models for Autonomous Driving [62.10344445241105]
大規模言語モデル(LLM)は、文脈理解、論理的推論、回答生成などの能力を示した。
本稿では,自動走行のための大規模言語モデル (LLM4AD) に関する研究ラインを体系的にレビューする。
論文 参考訳(メタデータ) (2023-11-02T07:23:33Z) - LanguageMPC: Large Language Models as Decision Makers for Autonomous
Driving [87.1164964709168]
この作業では、複雑な自律運転シナリオの意思決定コンポーネントとして、Large Language Models(LLM)を採用している。
大規模実験により,提案手法は単車載タスクのベースラインアプローチを一貫して超えるだけでなく,複数車載コーディネートにおいても複雑な運転動作の処理にも有効であることが示された。
論文 参考訳(メタデータ) (2023-10-04T17:59:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。