論文の概要: Drive Like a Human: Rethinking Autonomous Driving with Large Language
Models
- arxiv url: http://arxiv.org/abs/2307.07162v1
- Date: Fri, 14 Jul 2023 05:18:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-17 14:50:21.651834
- Title: Drive Like a Human: Rethinking Autonomous Driving with Large Language
Models
- Title(参考訳): 人間のように運転する:大きな言語モデルで自動運転を再考する
- Authors: Daocheng Fu, Xin Li, Licheng Wen, Min Dou, Pinlong Cai, Botian Shi, Yu
Qiao
- Abstract要約: 本研究では,大規模言語モデル(LLM)を用いた運転環境の人間的理解の可能性を探る。
実験の結果,LLMは長い尾の症例を推論し,解決する優れた能力を示すことがわかった。
- 参考スコア(独自算出の注目度): 28.957124302293966
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we explore the potential of using a large language model (LLM)
to understand the driving environment in a human-like manner and analyze its
ability to reason, interpret, and memorize when facing complex scenarios. We
argue that traditional optimization-based and modular autonomous driving (AD)
systems face inherent performance limitations when dealing with long-tail
corner cases. To address this problem, we propose that an ideal AD system
should drive like a human, accumulating experience through continuous driving
and using common sense to solve problems. To achieve this goal, we identify
three key abilities necessary for an AD system: reasoning, interpretation, and
memorization. We demonstrate the feasibility of employing an LLM in driving
scenarios by building a closed-loop system to showcase its comprehension and
environment-interaction abilities. Our extensive experiments show that the LLM
exhibits the impressive ability to reason and solve long-tailed cases,
providing valuable insights for the development of human-like autonomous
driving. The related code are available at
https://github.com/PJLab-ADG/DriveLikeAHuman .
- Abstract(参考訳): 本稿では,大規模言語モデル(llm)を用いて運転環境を人間のような方法で理解し,複雑なシナリオに対して推論,解釈,記憶する能力を分析する。
従来の最適化ベースおよびモジュール型自律運転(AD)システムは、長いコーナーケースを扱う際に固有の性能制限に直面している、と我々は主張する。
この問題に対処するために、理想的なADシステムは人間のように運転し、連続運転を通じて経験を蓄積し、共通の感覚を用いて問題を解決するべきである。
この目的を達成するために、我々はADシステムに必要な3つの重要な能力、すなわち推論、解釈、記憶を識別する。
閉ループシステムの構築により, LLMを用いた運転シナリオの実現可能性を示し, その理解と環境相互作用能力を示す。
我々の広範な実験は、LLMが長い尾のケースを推論し解決する素晴らしい能力を示しており、人間のような自動運転の開発に貴重な洞察を与えていることを示している。
関連コードはhttps://github.com/PJLab-ADG/DriveLikeAHuman で公開されている。
関連論文リスト
- Work-in-Progress: Crash Course: Can (Under Attack) Autonomous Driving Beat Human Drivers? [60.51287814584477]
本稿では,現在のAVの状況を調べることによって,自律運転における本質的なリスクを評価する。
AVの利点と、現実のシナリオにおける潜在的なセキュリティ課題との微妙なバランスを強調した、特定のクレームを開発する。
論文 参考訳(メタデータ) (2024-05-14T09:42:21Z) - Hybrid Reasoning Based on Large Language Models for Autonomous Car Driving [14.64475022650084]
大規模言語モデル(LLM)は、テキストや画像を理解し、人間に似たテキストを生成し、複雑な推論タスクを実行する能力において、大きな注目を集めている。
算術的推論と常識的推論の組み合わせ,特に自律運転シナリオにおけるLLMの適応性について検討する。
論文 参考訳(メタデータ) (2024-02-21T08:09:05Z) - DriveMLM: Aligning Multi-Modal Large Language Models with Behavioral
Planning States for Autonomous Driving [69.82743399946371]
DriveMLMは、現実的なシミュレータでクローズループの自律運転を実行するためのフレームワークである。
モジュールADシステムの動作計画モジュールをモデル化するために,MLLM (Multi-modal LLM) を用いる。
このモデルは、Apolloのような既存のADシステムでプラグイン・アンド・プレイすることで、クローズループ運転を行うことができる。
論文 参考訳(メタデータ) (2023-12-14T18:59:05Z) - Empowering Autonomous Driving with Large Language Models: A Safety Perspective [82.90376711290808]
本稿では,Large Language Models (LLM) の自律運転システムへの統合について検討する。
LLMは行動計画におけるインテリジェントな意思決定者であり、文脈的安全学習のための安全検証シールドを備えている。
適応型LLM条件モデル予測制御(MPC)と状態機械を用いたLLM対応対話型行動計画スキームという,シミュレーション環境における2つの重要な研究について述べる。
論文 参考訳(メタデータ) (2023-11-28T03:13:09Z) - A Language Agent for Autonomous Driving [31.359413767191608]
本稿では,人間のような知性を自律運転システムに統合するためのパラダイムシフトを提案する。
当社のアプローチはAgent-Driverと呼ばれ,汎用ツールライブラリを導入して,従来の自律走行パイプラインを変革する。
LLM(Large Language Models)によって駆動されるエージェントドライブには直感的な常識と堅牢な推論能力が備わっています。
論文 参考訳(メタデータ) (2023-11-17T18:59:56Z) - Enabling High-Level Machine Reasoning with Cognitive Neuro-Symbolic
Systems [67.01132165581667]
本稿では,認知アーキテクチャを外部のニューロシンボリックコンポーネントと統合することにより,AIシステムにおける高レベル推論を実現することを提案する。
本稿では,ACT-Rを中心としたハイブリッドフレームワークについて紹介し,最近の応用における生成モデルの役割について論じる。
論文 参考訳(メタデータ) (2023-11-13T21:20:17Z) - On the Road with GPT-4V(ision): Early Explorations of Visual-Language
Model on Autonomous Driving [37.617793990547625]
本報告では,最新のVLMであるGPT-4Vの徹底的な評価を行う。
我々は、シーンを駆動し、決定を下し、最終的にはドライバーの能力で行動する、モデルを理解する能力について探求する。
GPT-4Vは,既存の自律システムと比較して,シーン理解や因果推論において優れた性能を示した。
論文 参考訳(メタデータ) (2023-11-09T12:58:37Z) - LLM4Drive: A Survey of Large Language Models for Autonomous Driving [62.10344445241105]
大規模言語モデル(LLM)は、文脈理解、論理的推論、回答生成などの能力を示した。
本稿では,自動走行のための大規模言語モデル (LLM4AD) に関する研究ラインを体系的にレビューする。
論文 参考訳(メタデータ) (2023-11-02T07:23:33Z) - LanguageMPC: Large Language Models as Decision Makers for Autonomous
Driving [87.1164964709168]
この作業では、複雑な自律運転シナリオの意思決定コンポーネントとして、Large Language Models(LLM)を採用している。
大規模実験により,提案手法は単車載タスクのベースラインアプローチを一貫して超えるだけでなく,複数車載コーディネートにおいても複雑な運転動作の処理にも有効であることが示された。
論文 参考訳(メタデータ) (2023-10-04T17:59:49Z) - DiLu: A Knowledge-Driven Approach to Autonomous Driving with Large
Language Models [30.23228092898916]
本稿では,ReasoningとReflectionモジュールを組み合わせたDiLuフレームワークを提案する。
大規模な実験は、ダイリューが経験を蓄積し、一般化能力において大きな優位性を示す能力を証明する。
私たちの知識を最大限に活用するために、自動運転車の意思決定において知識駆動能力を活用するのは、私たちは初めてです。
論文 参考訳(メタデータ) (2023-09-28T09:41:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。