論文の概要: From Prompts to Pavement: LMMs-based Agentic Behavior-Tree Generation Framework for Autonomous Vehicles
- arxiv url: http://arxiv.org/abs/2601.12358v1
- Date: Sun, 18 Jan 2026 11:32:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.59394
- Title: From Prompts to Pavement: LMMs-based Agentic Behavior-Tree Generation Framework for Autonomous Vehicles
- Title(参考訳): プロンプトから舗装へ:LMMに基づく自律走行車のためのエージェント行動トレー生成フレームワーク
- Authors: Omar Y. Goba, Ahmed Y. Gado, Catherine M. Elias, Ahmed Hussein,
- Abstract要約: 従来の行動木(BT)は構造化された決定論理を提供するが、本質的に静的であり、労働集約的なマニュアルチューニングを必要とする。
本稿では,大規模言語モデル (LLM) とマルチモーダル視覚モデル (LVM) を利用して,BTの生成と適応を行うエージェントフレームワークを提案する。
- 参考スコア(独自算出の注目度): 1.3707825707652799
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Autonomous vehicles (AVs) require adaptive behavior planners to navigate unpredictable, real-world environments safely. Traditional behavior trees (BTs) offer structured decision logic but are inherently static and demand labor-intensive manual tuning, limiting their applicability at SAE Level 5 autonomy. This paper presents an agentic framework that leverages large language models (LLMs) and multi-modal vision models (LVMs) to generate and adapt BTs on the fly. A specialized Descriptor agent applies chain-of-symbols prompting to assess scene criticality, a Planner agent constructs high-level sub-goals via in-context learning, and a Generator agent synthesizes executable BT sub-trees in XML format. Integrated into a CARLA+Nav2 simulation, our system triggers only upon baseline BT failure, demonstrating successful navigation around unexpected obstacles (e.g., street blockage) with no human intervention. Compared to a static BT baseline, this approach is a proof-of-concept that extends to diverse driving scenarios.
- Abstract(参考訳): 自律走行車(AV)は、予測不能で現実世界の環境を安全にナビゲートするために適応的な行動プランナーを必要とする。
従来の行動木(BT)は構造化された決定論理を提供するが、本質的に静的で労働集約的なマニュアルチューニングであり、SAEレベル5の自律性において適用性を制限する。
本稿では,大規模言語モデル (LLM) とマルチモーダル視覚モデル (LVM) を利用して,BTの生成と適応を行うエージェントフレームワークを提案する。
特別なディスクリプタエージェントは、シーンクリティカル性を評価するために、シンボリック・オブ・シンボルを適用し、プランナーエージェントは、コンテキスト内学習を介して高レベルのサブゴールを構築し、ジェネレータエージェントは、実行可能なBTサブツリーをXML形式で合成する。
CARLA+Nav2シミュレーションに統合されたシステムでは,ベースラインBT故障時にのみトリガーを行い,人間の介入なしに予期せぬ障害物(道路封鎖など)の周囲のナビゲーションに成功した。
静的BTベースラインと比較して、このアプローチはさまざまな駆動シナリオに拡張された概念実証である。
関連論文リスト
- SPACeR: Self-Play Anchoring with Centralized Reference Models [50.55045557371374]
Simエージェントポリシーは、現実的で、人間らしく、高速で、マルチエージェント設定でスケーラブルである。
大規模な拡散モデルやトークン化モデルを用いた模倣学習の最近の進歩は、人間の運転データから直接行動を把握することができることを示している。
本研究では,事前訓練されたトークン化自己回帰運動モデルを利用したSPACeRを提案する。
論文 参考訳(メタデータ) (2025-10-20T19:53:02Z) - Discrete Diffusion for Reflective Vision-Language-Action Models in Autonomous Driving [55.13109926181247]
離散拡散による安全な軌道生成のためのリフレクション機構を統合した学習ベースのフレームワークであるReflectDriveを紹介する。
我々のアプローチの中心は、勾配のない反復的な自己補正を行う、安全を意識した反射機構である。
本手法は目標条件付き軌道生成から始まり,マルチモーダル運転動作をモデル化する。
論文 参考訳(メタデータ) (2025-09-24T13:35:15Z) - FlowDrive: Energy Flow Field for End-to-End Autonomous Driving [50.89871153094958]
FlowDriveは、物理的に解釈可能なエネルギーベースのフローフィールドを導入し、セマンティックな前提と安全性をBEV空間にエンコードする新しいフレームワークである。
NAVSIM v2ベンチマークの実験では、FlowDriveが最先端のパフォーマンスを86.3で達成し、安全性と計画品質の両方において以前のベースラインを超えたことが示されている。
論文 参考訳(メタデータ) (2025-09-17T13:51:33Z) - AirTrafficGen: Configurable Air Traffic Scenario Generation with Large Language Models [0.004807514276707785]
本稿では,複雑な航空交通制御シナリオを生成するための,新しいエンドツーエンドアプローチを提案する。
本手法では,セクタートポロジを符号化するためにグラフベースの目的表現を用いる。
Gemini 2.5 Proのような最先端モデルでは、運用リアリズムを維持しながら高トラフィックのシナリオを生成可能であることを示す。
論文 参考訳(メタデータ) (2025-08-04T10:21:47Z) - ManeuverGPT Agentic Control for Safe Autonomous Stunt Maneuvers [0.0]
本稿では,自律走行車における高ダイナミックなスタント動作の生成と実行のための新しいフレームワークManeuverGPTを提案する。
3つの特殊エージェントからなるエージェントアーキテクチャを提案する。
実験により、複数の車両モデル間でのJターン実行が成功した。
論文 参考訳(メタデータ) (2025-03-12T03:51:41Z) - SafeAuto: Knowledge-Enhanced Safe Autonomous Driving with Multimodal Foundation Models [63.71984266104757]
我々は、構造化されていない知識と構造化されていない知識の両方を取り入れることで、MLLMベースの自動運転を強化するフレームワークであるSafeAutoを提案する。
安全知識を明示的に統合するため,交通ルールを一階述語論理に変換する推論コンポーネントを開発した。
我々のマルチモーダル検索・拡張生成モデルは、過去の運転経験から学ぶために、ビデオ、制御信号、環境特性を活用する。
論文 参考訳(メタデータ) (2025-02-28T21:53:47Z) - Integrating Intent Understanding and Optimal Behavior Planning for Behavior Tree Generation from Human Instructions [5.31484618181979]
動作木(BT)は、人間の指示に従ってタスクを実行するロボットのための適切な制御アーキテクチャである。
本稿では,BT生成のための2段階のフレームワークを提案する。
我々は、一階述語論理における目的と十分に整形された公式を表現し、意図の理解と最適な行動計画を効果的にブリッジする。
論文 参考訳(メタデータ) (2024-05-13T05:23:48Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。