論文の概要: Modular Autonomy with Conversational Interaction: An LLM-driven Framework for Decision Making in Autonomous Driving
- arxiv url: http://arxiv.org/abs/2601.05806v1
- Date: Fri, 09 Jan 2026 14:23:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.71752
- Title: Modular Autonomy with Conversational Interaction: An LLM-driven Framework for Decision Making in Autonomous Driving
- Title(参考訳): 対話型対話を伴うモジュール型自律:自律運転における意思決定のためのLLM駆動型フレームワーク
- Authors: Marvin Seegert, Korbinian Moller, Johannes Betz,
- Abstract要約: 大規模言語モデル(LLM)は、自律運転システム(ADS)のための自然言語インタフェースを作成する新しい機会を提供する
本稿では,モジュール型ADSソフトウェアにおいて,人間の言語の複雑さを構造化されたアクション空間にマッピングするという課題に対処する。
本稿では,LLMベースのインタラクション層と,広く使用されているオープンソースソフトウェアであるAutowareを統合するフレームワークを提案する。
- 参考スコア(独自算出の注目度): 1.7300690315775575
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recent advancements in Large Language Models (LLMs) offer new opportunities to create natural language interfaces for Autonomous Driving Systems (ADSs), moving beyond rigid inputs. This paper addresses the challenge of mapping the complexity of human language to the structured action space of modular ADS software. We propose a framework that integrates an LLM-based interaction layer with Autoware, a widely used open-source software. This system enables passengers to issue high-level commands, from querying status information to modifying driving behavior. Our methodology is grounded in three key components: a taxonomization of interaction categories, an application-centric Domain Specific Language (DSL) for command translation, and a safety-preserving validation layer. A two-stage LLM architecture ensures high transparency by providing feedback based on the definitive execution status. Evaluation confirms the system's timing efficiency and translation robustness. Simulation successfully validated command execution across all five interaction categories. This work provides a foundation for extensible, DSL-assisted interaction in modular and safety-conscious autonomy stacks.
- Abstract(参考訳): 近年のLLM(Large Language Models)の進歩は、ADS(Autonomous Driving Systems)のための自然言語インターフェースを作成する新たな機会を提供する。
本稿では,モジュール型ADSソフトウェアにおいて,人間の言語の複雑さを構造化されたアクション空間にマッピングするという課題に対処する。
本稿では,LLMベースのインタラクション層と,広く使用されているオープンソースソフトウェアであるAutowareを統合するフレームワークを提案する。
このシステムにより、利用者は状況情報への問い合わせから運転行動の変更に至るまで、高レベルのコマンドを発行できる。
インタラクションカテゴリの分類、コマンド翻訳のためのアプリケーション中心のドメイン特化言語(DSL)、安全保持バリデーション層である。
2段階のLLMアーキテクチャは、決定的な実行状態に基づいたフィードバックを提供することにより、高い透明性を保証する。
評価はシステムのタイミング効率と翻訳の堅牢性を確認する。
シミュレーションは5つの相互作用カテゴリすべてにわたるコマンド実行の検証に成功した。
この作業は、モジュラーおよび安全に配慮した自律スタックにおける拡張性、DSL支援インタラクションの基礎を提供する。
関連論文リスト
- Rethinking Testing for LLM Applications: Characteristics, Challenges, and a Lightweight Interaction Protocol [83.83217247686402]
大言語モデル(LLM)は、単純なテキストジェネレータから、検索強化、ツール呼び出し、マルチターンインタラクションを統合する複雑なソフトウェアシステムへと進化してきた。
その固有の非決定主義、ダイナミズム、文脈依存は品質保証に根本的な課題をもたらす。
本稿では,LLMアプリケーションを3層アーキテクチャに分解する: textbftextitSystem Shell Layer, textbftextitPrompt Orchestration Layer, textbftextitLLM Inference Core。
論文 参考訳(メタデータ) (2025-08-28T13:00:28Z) - A Concurrent Modular Agent: Framework for Autonomous LLM Agents [0.995321385692873]
LLM(Large-Language-Model)ベースの複数のモジュールをオーケストレーションするフレームワークであるCMA(Concurrent Modular Agent)を紹介した。
我々はこのアプローチをミンスキーの心の理論の実践的実現とみなす。
我々のシステムで観察された創発的特性は、自己認識のような複雑な認知現象が、単純なプロセスの組織的な相互作用によってもたらされることを示唆している。
論文 参考訳(メタデータ) (2025-08-26T13:58:31Z) - ADRD: LLM-Driven Autonomous Driving Based on Rule-based Decision Systems [6.950569256149267]
我々は、情報モジュール、エージェントモジュール、テストモジュールの3つのコアモジュールを統合するADRDフレームワークを紹介します。
このフレームワークは、自律運転決定タスクにおいて優れたパフォーマンスを示す。
これは、大規模な言語モデルとルールベースのシステムを統合して、自律的な運転意思決定を行う最初の作業である。
論文 参考訳(メタデータ) (2025-06-17T08:18:20Z) - LANGTRAJ: Diffusion Model and Dataset for Language-Conditioned Trajectory Simulation [102.1527101235251]
LangTrajは、トラフィックシナリオにおけるすべてのエージェントの共同動作をシミュレートする、言語条件のシーン拡散モデルである。
自然言語入力を条件付けすることで、LangTrajはインタラクティブな振る舞いを柔軟かつ直感的に制御できる。
LangTraj氏は、リアリズム、言語制御性、言語条件の安全クリティカルなシミュレーションにおいて、強力なパフォーマンスを示している。
論文 参考訳(メタデータ) (2025-04-15T17:14:06Z) - Personalized Autonomous Driving with Large Language Models: Field Experiments [11.429053835807697]
LLMベースのフレームワークであるTalk2Driveを導入し、自然言語コマンドを実行可能なコントロールに翻訳する。
これは、LLMを現実世界の自動運転車にデプロイする、最初の種類のマルチシナリオフィールド実験である。
提案するメモリモジュールは、パーソナライズされた好みを考慮し、さらに65.2%のテイクオーバ率を低下させる。
論文 参考訳(メタデータ) (2023-12-14T23:23:37Z) - DriveMLM: Aligning Multi-Modal Large Language Models with Behavioral
Planning States for Autonomous Driving [69.82743399946371]
DriveMLMは、現実的なシミュレータでクローズループの自律運転を実行するためのフレームワークである。
モジュールADシステムの動作計画モジュールをモデル化するために,MLLM (Multi-modal LLM) を用いる。
このモデルは、Apolloのような既存のADシステムでプラグイン・アンド・プレイすることで、クローズループ運転を行うことができる。
論文 参考訳(メタデータ) (2023-12-14T18:59:05Z) - Language Agent Tree Search Unifies Reasoning Acting and Planning in Language Models [31.509994889286183]
我々はLanguage Agent Tree Search (LATS)を紹介した。Language Agent Tree Search (LATS)は、推論、行動、計画において言語モデル(LM)の能力を相乗化する最初の一般的なフレームワークである。
当社のアプローチの重要な特徴は、より意図的で適応的な問題解決メカニズムを提供する外部フィードバック環境の導入である。
LATSは、GPT-4でHumanEval上でプログラミングするための最先端パス@1精度(92.7%)を達成し、GPTによるWebShop上のWebナビゲーションの勾配ベースの微調整に匹敵する勾配なし性能(平均スコア75.9)を示す。
論文 参考訳(メタデータ) (2023-10-06T17:55:11Z) - LanguageMPC: Large Language Models as Decision Makers for Autonomous Driving [84.31119464141631]
この作業では、複雑な自律運転シナリオの意思決定コンポーネントとして、Large Language Models(LLM)を採用している。
大規模実験により,提案手法は単車載タスクのベースラインアプローチを一貫して超えるだけでなく,複数車載コーディネートにおいても複雑な運転動作の処理にも有効であることが示された。
論文 参考訳(メタデータ) (2023-10-04T17:59:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。