論文の概要: Instruct Large Language Models to Drive like Humans
- arxiv url: http://arxiv.org/abs/2406.07296v1
- Date: Tue, 11 Jun 2024 14:24:45 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-12 15:34:38.971392
- Title: Instruct Large Language Models to Drive like Humans
- Title(参考訳): 大規模言語モデルに人間のように運転するように指示する
- Authors: Ruijun Zhang, Xianda Guo, Wenzhao Zheng, Chenming Zhang, Kurt Keutzer, Long Chen,
- Abstract要約: 本研究では,大規模言語モデルを運動プランナに変換するインストラクトドライブ手法を提案する。
人間の論理に基づく運転指導データを導出する。
次に、最終計画をさらに推論するために解釈可能なInstructChainモジュールを使用します。
- 参考スコア(独自算出の注目度): 33.219883052634614
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Motion planning in complex scenarios is the core challenge in autonomous driving. Conventional methods apply predefined rules or learn from driving data to plan the future trajectory. Recent methods seek the knowledge preserved in large language models (LLMs) and apply them in the driving scenarios. Despite the promising results, it is still unclear whether the LLM learns the underlying human logic to drive. In this paper, we propose an InstructDriver method to transform LLM into a motion planner with explicit instruction tuning to align its behavior with humans. We derive driving instruction data based on human logic (e.g., do not cause collisions) and traffic rules (e.g., proceed only when green lights). We then employ an interpretable InstructChain module to further reason the final planning reflecting the instructions. Our InstructDriver allows the injection of human rules and learning from driving data, enabling both interpretability and data scalability. Different from existing methods that experimented on closed-loop or simulated settings, we adopt the real-world closed-loop motion planning nuPlan benchmark for better evaluation. InstructDriver demonstrates the effectiveness of the LLM planner in a real-world closed-loop setting. Our code is publicly available at https://github.com/bonbon-rj/InstructDriver.
- Abstract(参考訳): 複雑なシナリオにおけるモーションプランニングは、自動運転における中核的な課題である。
従来の方法では、事前定義されたルールを適用したり、データを駆動して将来の軌跡を計画することを学ぶ。
最近の手法では、大きな言語モデル(LLM)に保存された知識を求め、それらを駆動シナリオに適用する。
有望な結果にもかかわらず、LLMが基礎となる人間の論理を学習するかどうかはまだ不明である。
本論文では,ILMを動作プランナに変換するインストラクトドライブ手法を提案する。
我々は、人間の論理(例えば、衝突を起こさない)と交通規則(例えば、グリーンライトの時だけ進行する)に基づく指示データを導出する。
次に、解釈可能なInstructChainモジュールを使用して、命令を反映する最終的な計画をさらに推論します。
私たちのInstructDriverは、人間のルールを注入し、データの駆動から学び、解釈可能性とデータのスケーラビリティの両方を可能にします。
クローズドループやシミュレートされた設定で実験した既存の方法とは異なり、実世界のクローズドループ動作計画 nuPlan ベンチマークを採用し、より良い評価を行う。
InstructDriver は実世界のクローズドループ設定における LLM プランナの有効性を示す。
私たちのコードはhttps://github.com/bonbon-rj/InstructDriver.comで公開されています。
関連論文リスト
- LLM-Assist: Enhancing Closed-Loop Planning with Language-Based Reasoning [65.86754998249224]
従来のルールベースプランナとLCMベースのプランナを併用した,新しいハイブリッドプランナを開発した。
当社のアプローチでは,既存のプランナが苦労する複雑なシナリオをナビゲートし,合理的なアウトプットを生成すると同時に,ルールベースのアプローチと連携して作業する。
論文 参考訳(メタデータ) (2023-12-30T02:53:45Z) - Personalized Autonomous Driving with Large Language Models: Field Experiments [11.429053835807697]
LLMベースのフレームワークであるTalk2Driveを導入し、自然言語コマンドを実行可能なコントロールに翻訳する。
これは、LLMを現実世界の自動運転車にデプロイする、最初の種類のマルチシナリオフィールド実験である。
提案するメモリモジュールは、パーソナライズされた好みを考慮し、さらに65.2%のテイクオーバ率を低下させる。
論文 参考訳(メタデータ) (2023-12-14T23:23:37Z) - DriveMLM: Aligning Multi-Modal Large Language Models with Behavioral
Planning States for Autonomous Driving [69.82743399946371]
DriveMLMは、現実的なシミュレータでクローズループの自律運転を実行するためのフレームワークである。
モジュールADシステムの動作計画モジュールをモデル化するために,MLLM (Multi-modal LLM) を用いる。
このモデルは、Apolloのような既存のADシステムでプラグイン・アンド・プレイすることで、クローズループ運転を行うことができる。
論文 参考訳(メタデータ) (2023-12-14T18:59:05Z) - LMDrive: Closed-Loop End-to-End Driving with Large Language Models [37.910449013471656]
大規模言語モデル(LLM)は、"Artificial General Intelligence"にアプローチする印象的な推論能力を示している。
本稿では,新しい言語誘導,エンドツーエンド,クローズドループ自動運転フレームワークLMDriveを紹介する。
論文 参考訳(メタデータ) (2023-12-12T18:24:15Z) - Learning Realistic Traffic Agents in Closed-loop [36.38063449192355]
強化学習(RL)は、違反を避けるために交通エージェントを訓練することができるが、RLのみを使用することで非人間的な運転行動をもたらす。
本稿では,交通規制制約の下で,専門家による実演と一致させるためにRTR(Reinforce Traffic Rules)を提案する。
実験の結果,RTRはより現実的で一般化可能な交通シミュレーションポリシーを学習することがわかった。
論文 参考訳(メタデータ) (2023-11-02T16:55:23Z) - AutoPlan: Automatic Planning of Interactive Decision-Making Tasks With
Large Language Models [11.895111124804503]
AutoPlanは、LCMベースのエージェントをガイドして、対話的な意思決定タスクを実現するアプローチである。
実験の結果,AutoPlanはベースラインと同等の成功率を達成した。
論文 参考訳(メタデータ) (2023-05-24T11:52:23Z) - Learning to drive from a world on rails [78.28647825246472]
モデルベースアプローチによって,事前記録された運転ログからインタラクティブな視覚ベースの運転方針を学習する。
世界の前方モデルは、あらゆる潜在的な運転経路の結果を予測する運転政策を監督する。
提案手法は,carla リーダボードにまずランク付けし,40 倍少ないデータを用いて25%高い運転スコアを得た。
論文 参考訳(メタデータ) (2021-05-03T05:55:30Z) - Contingencies from Observations: Tractable Contingency Planning with
Learned Behavior Models [82.34305824719101]
人間は未来の出来事を正確に推論することで決定を下す素晴らしい能力を持っている。
本研究では,高次元のシーン観察からエンドツーエンドに学習する汎用コンテンシビリティプランナを開発する。
このモデルが行動観察から忍耐強くコンティンジェンシーを学習できることを示す。
論文 参考訳(メタデータ) (2021-04-21T14:30:20Z) - Testing the Safety of Self-driving Vehicles by Simulating Perception and
Prediction [88.0416857308144]
センサシミュレーションは高価であり,領域ギャップが大きいため,センサシミュレーションに代わる方法を提案する。
我々は、自動運転車の知覚と予測システムの出力を直接シミュレートし、現実的な動き計画テストを可能にする。
論文 参考訳(メタデータ) (2020-08-13T17:20:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。