論文の概要: Open-Ended Instruction Realization with LLM-Enabled Multi-Planner Scheduling in Autonomous Vehicles
- arxiv url: http://arxiv.org/abs/2604.08031v1
- Date: Thu, 09 Apr 2026 09:32:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.842128
- Title: Open-Ended Instruction Realization with LLM-Enabled Multi-Planner Scheduling in Autonomous Vehicles
- Title(参考訳): 自律走行車におけるLLM対応マルチプランナスケジューリングによるオープンエンドインストラクションの実現
- Authors: Jiawei Liu, Xun Gong, Fen Fang, Muli Yang, Bohao Qu, Yunfeng Hu, Hong Chen, Xulei Yang, Qing Guo,
- Abstract要約: 本研究では,大規模言語モデル(LLM)を利用して命令を解釈する命令実現フレームワークを提案する。
リアルタイムフィードバックに基づいて、複数のモデル予測制御(MPC)ベースのモーションプランナをスケジュールする実行可能なスクリプトを生成し、計画されたトラジェクトリを制御信号に変換する。
- 参考スコア(独自算出の注目度): 40.195332742819865
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most Human-Machine Interaction (HMI) research overlooks the maneuvering needs of passengers in autonomous driving (AD). Natural language offers an intuitive interface, yet translating passenger open-ended instructions into control signals, without sacrificing interpretability and traceability, remains a challenge. This study proposes an instruction-realization framework that leverages a large language model (LLM) to interpret instructions, generates executable scripts that schedule multiple model predictive control (MPC)-based motion planners based on real-time feedback, and converts planned trajectories into control signals. This scheduling-centric design decouples semantic reasoning from vehicle control at different timescales, establishing a transparent, traceable decision-making chain from high-level instructions to low-level actions. Due to the absence of high-fidelity evaluation tools, this study introduces a benchmark for open-ended instruction realization in a closed-loop setting. Comprehensive experiments reveal that the framework significantly improves task-completion rates over instruction-realization baselines, reduces LLM query costs, achieves safety and compliance on par with specialized AD approaches, and exhibits considerable tolerance to LLM inference latency. For more qualitative illustrations and a clearer understanding.
- Abstract(参考訳): ほとんどのHMI(Human-Machine Interaction)研究は、自動走行(AD)における乗客の操作的ニーズを概観している。
自然言語は直感的なインタフェースを提供するが、解釈性とトレーサビリティを犠牲にすることなく、乗客のオープンエンド命令を制御信号に翻訳することは依然として困難である。
本研究では,大規模言語モデル(LLM)を利用して命令を解釈し,実時間フィードバックに基づいて複数のモデル予測制御(MPC)ベースの動作プランナをスケジュールする実行可能なスクリプトを生成し,計画された軌跡を制御信号に変換する命令実現フレームワークを提案する。
このスケジューリング中心の設計は、異なる時間スケールでの車両制御からのセマンティック推論を分離し、高レベルの命令から低レベルのアクションに至るまで、透明でトレース可能な意思決定チェーンを確立する。
高忠実度評価ツールがないため、閉ループ環境下でのオープンエンド命令実現のためのベンチマークを導入する。
総合的な実験により、このフレームワークは命令実現ベースラインよりもタスク補完率を大幅に改善し、LLMクエリコストを低減し、特別なADアプローチと同等の安全性とコンプライアンスを実現し、LLM推論遅延に対するかなりの耐性を示すことが明らかとなった。
より質的なイラストとより明確な理解について。
関連論文リスト
- PILOT: Planning via Internalized Latent Optimization Trajectories for Large Language Models [51.43746425777865]
大規模言語モデル(LLM)は、しばしばグローバル戦略を定式化する能力に欠けており、長い水平タスクにおけるエラーの伝播につながる。
PILOTは,大規模モデルの戦略的監視を本質的な潜伏誘導に内部化するためのフレームワークである。
論文 参考訳(メタデータ) (2026-01-07T12:38:56Z) - COVLM-RL: Critical Object-Oriented Reasoning for Autonomous Driving Using VLM-Guided Reinforcement Learning [55.83415345423854]
批判的オブジェクト指向(CO)推論と強化学習(RL)を統合した新しいエンドツーエンド駆動フレームワークCOVLM-RLを提案する。
CARLAシミュレータで行った実験により、COVLM-RLはトレーニング運転環境における成功率を30%向上することが示された。
論文 参考訳(メタデータ) (2025-12-10T06:18:16Z) - TeLL-Drive: Enhancing Autonomous Driving with Teacher LLM-Guided Deep Reinforcement Learning [61.33599727106222]
TeLL-Driveは、Teacher LLMを統合して、注意に基づく学生DRLポリシーをガイドするハイブリッドフレームワークである。
自己維持機構はDRLエージェントの探索とこれらの戦略を融合させ、政策収束を加速し、堅牢性を高める。
論文 参考訳(メタデータ) (2025-02-03T14:22:03Z) - SenseRAG: Constructing Environmental Knowledge Bases with Proactive Querying for LLM-Based Autonomous Driving [10.041702058108482]
本研究では,大規模言語モデル(LLM)の文脈推論機能を活用することにより,自律運転(AD)における状況認識の高度化の必要性に対処する。
厳密なラベルベースのアノテーションに依存する従来の認識システムとは異なり、リアルタイムのマルチモーダルセンサーデータを統一されたLLM対応の知識ベースに統合する。
実世界のV2Xデータセットを用いた実験結果は、知覚と予測性能の大幅な改善を示す。
論文 参考訳(メタデータ) (2025-01-07T05:15:46Z) - Asynchronous Large Language Model Enhanced Planner for Autonomous Driving [26.72215912937613]
AsyncDriverは、リアルタイムプランナーが正確に制御可能な軌道予測を行うための新しいフレームワークである。
推論周波数の非同期性に乗じて,LLMが導入した計算コストの削減に成功している。
実験により,本手法はnuPlanの難解なシナリオに対して,より優れたクローズドループ評価性能が得られることが示された。
論文 参考訳(メタデータ) (2024-06-20T17:59:03Z) - LanguageMPC: Large Language Models as Decision Makers for Autonomous Driving [84.31119464141631]
この作業では、複雑な自律運転シナリオの意思決定コンポーネントとして、Large Language Models(LLM)を採用している。
大規模実験により,提案手法は単車載タスクのベースラインアプローチを一貫して超えるだけでなく,複数車載コーディネートにおいても複雑な運転動作の処理にも有効であることが示された。
論文 参考訳(メタデータ) (2023-10-04T17:59:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。