Fugu-MT 論文翻訳(概要): Driving Everywhere with Large Language Model Policy Adaptation

論文の概要: Driving Everywhere with Large Language Model Policy Adaptation

arxiv url: http://arxiv.org/abs/2402.05932v2
Date: Wed, 10 Apr 2024 23:29:18 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-12 18:35:56.670698
Title: Driving Everywhere with Large Language Model Policy Adaptation
Title（参考訳）: 大規模言語モデルポリシー適応による至る所での運転
Authors: Boyi Li, Yue Wang, Jiageng Mao, Boris Ivanovic, Sushant Veer, Karen Leung, Marco Pavone,
Abstract要約: 新しい環境、習慣、法律に運転行動を適用することは、自動運転における長年の問題である。 LLaDAは、人間のドライバーや自動運転車が、新しい場所での交通ルールにタスクや運動計画を適用することによって、どこにでも運転できるようにするツールです。
参考スコア（独自算出の注目度）: 37.341045364001474
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Adapting driving behavior to new environments, customs, and laws is a long-standing problem in autonomous driving, precluding the widespread deployment of autonomous vehicles (AVs). In this paper, we present LLaDA, a simple yet powerful tool that enables human drivers and autonomous vehicles alike to drive everywhere by adapting their tasks and motion plans to traffic rules in new locations. LLaDA achieves this by leveraging the impressive zero-shot generalizability of large language models (LLMs) in interpreting the traffic rules in the local driver handbook. Through an extensive user study, we show that LLaDA's instructions are useful in disambiguating in-the-wild unexpected situations. We also demonstrate LLaDA's ability to adapt AV motion planning policies in real-world datasets; LLaDA outperforms baseline planning approaches on all our metrics. Please check our website for more details: https://boyiliee.github.io/llada.
Abstract（参考訳）: 新しい環境、習慣、法律に運転行動を適用することは、自動運転車(AV)の広範な展開を前にして、自動運転における長年の問題である。本稿では、人間ドライバーや自動運転車が、新しい場所での交通ルールにタスクや移動計画を適用することで、どこにでも運転できるように、シンプルながら強力なツールであるLLaDAを提案する。 LLaDAは、ローカルドライバハンドブックにおけるトラフィックルールの解釈において、大きな言語モデル(LLM)の印象的なゼロショット一般化性を活用することで、これを実現する。広範にわたるユーザスタディを通じて、LLaDAの指示は、夢中の予期せぬ状況の明確化に有用であることを示す。また、実世界のデータセットにAV動作計画ポリシーを適用するLLaDAの能力も示しています。詳細はWebサイトをご覧ください。

関連論文リスト

Learning to Drive in New Cities Without Human Demonstrations [66.37858021482741]
自己学習型マルチエージェント強化学習は,地図とメタ情報のみを用いて,運転方針をほぼ異なる目標都市に適応させることができることを示す。本研究では,NOデータマップをベースとした自律運転用セルフプレイ(NOMAD)を導入し,目標都市マップに基づいて構築されたシミュレータにおけるポリシー適応を実現する。
論文参考訳（メタデータ） (2026-02-09T00:31:20Z)
LLaViDA: A Large Language Vision Driving Assistant for Explicit Reasoning and Enhanced Trajectory Planning [28.59507336524504]
軌道計画は、自律運転の基本的かつ挑戦的な要素である。物体の動き予測に視覚言語モデル(VLM)を利用するLLaViDAを提案する。 NuScenesベンチマークでは、LLaViDAは最先端のエンドツーエンドおよび最近のVLM/LLMベースのベースラインを超越して、オープンループ軌道計画タスクを実行している。
論文参考訳（メタデータ） (2025-12-20T04:38:35Z)
MindDrive: A Vision-Language-Action Model for Autonomous Driving via Online Reinforcement Learning [51.20229133553804]
自律運転における現在のビジョン・ランゲージ・アクション(VLA)パラダイムは主に模倣学習(IL)に依存しているオンライン強化学習は、トライアル・アンド・エラー学習を通じてこれらの問題に対処するための有望な経路を提供する。大規模言語モデル(LLM)と2つの異なるLoRAパラメータからなるVLAフレームワークであるMindDriveを提案する。軌道レベルの報酬を推論空間に戻すことで、MindDriveは、限定的な言語駆動決定の有限セットに対する試行錯誤学習を可能にする。
論文参考訳（メタデータ） (2025-12-15T18:31:32Z)
A Survey on Vision-Language-Action Models for Autonomous Driving [26.407082158880204]
VLA(Vision-Language-Action)パラダイムは、視覚知覚、自然言語理解、制御を単一のポリシーに統合する。自動運転車の研究者たちは、これらの方法を車の領域に積極的に適応させている。この調査は、VLA for Autonomous Drivingの最初の包括的な概要を提供する。
論文参考訳（メタデータ） (2025-06-30T16:50:02Z)
LiloDriver: A Lifelong Learning Framework for Closed-loop Motion Planning in Long-tail Autonomous Driving Scenarios [23.913788819453796]
LiloDriverは、ロングテール自動運転シナリオにおけるクローズドループモーションプランニングのための生涯学習フレームワークである。知覚、シーンエンコーディング、メモリベースの戦略改善、LLM誘導推論を含む4段階アーキテクチャを備えている。本研究は、構造化メモリとLCM推論を組み合わせることで、現実の自律運転において、スケーラブルで人間ライクな動作計画を可能にすることの有効性を強調した。
論文参考訳（メタデータ） (2025-05-22T18:33:08Z)
The Role of World Models in Shaping Autonomous Driving: A Comprehensive Survey [50.62538723793247]
ドライビング・ワールド・モデル(DWM)は、ドライビング・プロセス中のシーンの進化を予測することに焦点を当てている。 DWM法は、自律運転システムが動的運転環境をよりよく知覚し、理解し、相互作用することを可能にする。
論文参考訳（メタデータ） (2025-02-14T18:43:15Z)
Can LVLMs Obtain a Driver's License? A Benchmark Towards Reliable AGI for Autonomous Driving [24.485164073626674]
各国から収集された100万件以上のデータを含む大規模データセットであるIDKBを提案する。運転免許取得のプロセスと同様に、IDKBは理論から実践への運転に必要な知識のほとんど全てを包含している。
論文参考訳（メタデータ） (2024-09-04T17:52:43Z)
CoVLA: Comprehensive Vision-Language-Action Dataset for Autonomous Driving [1.727597257312416]
CoVLA(Comprehensive Vision-Language-Action)データセットは、80時間以上にわたる現実世界の運転ビデオで構成されている。このデータセットは、堅牢で解釈可能で、データ駆動の自動運転システムのためのフレームワークを確立する。
論文参考訳（メタデータ） (2024-08-19T09:53:49Z)
Enhancing End-to-End Autonomous Driving with Latent World Model [78.22157677787239]
本稿では,LAW(Latent World Model)を用いたエンドツーエンド運転のための自己教師型学習手法を提案する。 LAWは、現在の特徴とエゴ軌道に基づいて将来のシーン機能を予測する。この自己監督タスクは、知覚のない、知覚に基づくフレームワークにシームレスに統合することができる。
論文参考訳（メタデータ） (2024-06-12T17:59:21Z)
GenAD: Generalized Predictive Model for Autonomous Driving [75.39517472462089]
本稿では,自動運転分野における最初の大規模ビデオ予測モデルを紹介する。我々のモデルはGenADと呼ばれ、新しい時間的推論ブロックでシーンを駆動する際の挑戦的なダイナミクスを扱う。アクション条件付き予測モデルやモーションプランナーに適応することができ、現実世界の運転アプリケーションに大きな可能性を秘めている。
論文参考訳（メタデータ） (2024-03-14T17:58:33Z)
DriveMLM: Aligning Multi-Modal Large Language Models with Behavioral Planning States for Autonomous Driving [69.82743399946371]
DriveMLMは、現実的なシミュレータでクローズループの自律運転を実行するためのフレームワークである。モジュールADシステムの動作計画モジュールをモデル化するために,MLLM (Multi-modal LLM) を用いる。このモデルは、Apolloのような既存のADシステムでプラグイン・アンド・プレイすることで、クローズループ運転を行うことができる。
論文参考訳（メタデータ） (2023-12-14T18:59:05Z)
LMDrive: Closed-Loop End-to-End Driving with Large Language Models [37.910449013471656]
大規模言語モデル(LLM)は、"Artificial General Intelligence"にアプローチする印象的な推論能力を示している。本稿では,新しい言語誘導,エンドツーエンド,クローズドループ自動運転フレームワークLMDriveを紹介する。
論文参考訳（メタデータ） (2023-12-12T18:24:15Z)
On the Road with GPT-4V(ision): Early Explorations of Visual-Language Model on Autonomous Driving [37.617793990547625]
本報告では,最新のVLMであるGPT-4Vの徹底的な評価を行う。我々は、シーンを駆動し、決定を下し、最終的にはドライバーの能力で行動する、モデルを理解する能力について探求する。 GPT-4Vは,既存の自律システムと比較して,シーン理解や因果推論において優れた性能を示した。
論文参考訳（メタデータ） (2023-11-09T12:58:37Z)
LLM4Drive: A Survey of Large Language Models for Autonomous Driving [62.10344445241105]
大規模言語モデル(LLM)は、文脈理解、論理的推論、回答生成などの能力を示した。本稿では,自動走行のための大規模言語モデル (LLM4AD) に関する研究ラインを体系的にレビューする。
論文参考訳（メタデータ） (2023-11-02T07:23:33Z)
Predicting Physical World Destinations for Commands Given to Self-Driving Cars [19.71691537605694]
本稿では,与えられた命令を実行した後,車が到達する必要がある3D宛先を注釈付けする拡張を提案する。我々は、この特定の設定に適合した以前の作品より優れたモデルを導入する。
論文参考訳（メタデータ） (2021-12-10T09:51:16Z)
Learning to drive from a world on rails [78.28647825246472]
モデルベースアプローチによって,事前記録された運転ログからインタラクティブな視覚ベースの運転方針を学習する。世界の前方モデルは、あらゆる潜在的な運転経路の結果を予測する運転政策を監督する。提案手法は,carla リーダボードにまずランク付けし,40 倍少ないデータを用いて25%高い運転スコアを得た。
論文参考訳（メタデータ） (2021-05-03T05:55:30Z)
Intelligent Roundabout Insertion using Deep Reinforcement Learning [68.8204255655161]
本稿では,多忙なラウンドアバウンドの入場を交渉できる演習計画モジュールを提案する。提案されたモジュールは、トレーニングされたニューラルネットワークに基づいて、操作の全期間にわたって、ラウンドアバウンドに入るタイミングと方法を予測する。
論文参考訳（メタデータ） (2020-01-03T11:16:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。