論文の概要: Pedestrian-Aware LLM-Driven Behavioral Planning for Autonomous Vehicles
- arxiv url: http://arxiv.org/abs/2605.16858v1
- Date: Sat, 16 May 2026 07:41:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:47.203543
- Title: Pedestrian-Aware LLM-Driven Behavioral Planning for Autonomous Vehicles
- Title(参考訳): 歩行者対応LLM駆動型自動運転車の行動計画
- Authors: Aidana Baimbetova, Haruki Yonekura, Hamada Rizk, Hirozumi Yamaguchi,
- Abstract要約: 歩行者対応行動計画のための大規模言語モデル(LLM)に基づく意思決定フレームワーク。
システムは、構造化されたシーンの観察を自然言語による推論のプロンプトに変換し、LLMは歩行者の意図を推測し、リスクを予測し、慎重な戦術的な運転決定を生成する。
本研究では, 予期せぬ歩行, ターンバック・クロス, ためらい, 双方向横断など, 複数の歩行者行動シナリオにおけるSUMOの枠組みを評価した。
- 参考スコア(独自算出の注目度): 5.343135467323389
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous Vehicles (AVs) must make reliable decisions in dense urban environments where pedestrian behavior is variable, sometimes abnormal, and often unseen during training. Reinforcement learning (RL)-based AV control systems perform well in structured traffic but struggle to generalize to unpredictable pedestrian interactions and out-of-distribution scenarios. Their reliance on handcrafted rewards and opaque decisions further limits their suitability for safety-critical, pedestrian-rich environments. To address these limitations, we introduce a Large Language Model (LLM)-based decision-making framework for pedestrian-aware behavioral planning. The system converts structured scene observations into natural-language reasoning prompts, enabling the LLM to infer pedestrian intent, anticipate risk, and generate cautious tactical driving decisions. These decisions are executed by a motion planner that ensures smooth, kinematically feasible control. We evaluate the framework in SUMO across multiple pedestrian-interaction scenarios, including unexpected jaywalking, turn-back crossing, hesitation, and bidirectional crossing. In zero-shot evaluation, the LLM-based agent achieves a 68% collision-free success rate, substantially outperforming deep RL baselines (17.7%). With few-shot episodic memory in a single-pedestrian scenario, performance increases to 96.0%, exceeding a custom DQN controller (82.0%). Cross-behavior evaluation further shows that memory derived from turn-back interactions transfers to unseen hesitation and bidirectional crossing scenarios, achieving 82.0% and 90.0% success, respectively. The system consistently initiates earlier responses, maintains wider safety buffers, and produces interpretable, human-aligned decisions.
- Abstract(参考訳): 自律走行車(AV)は、歩行者の行動が変動し、時には異常であり、訓練中にしばしば見つからない密集した都市環境において、信頼できる判断をしなければならない。
強化学習(Reinforcement Learning, RL)に基づくAV制御システムは, 構造的トラフィックにおいて良好に機能するが, 予測不能な歩行者インタラクションやアウト・オブ・ディストリビューションシナリオへの一般化に苦慮する。
手作りの報酬への依存と不透明な決定により、安全で歩行者に富んだ環境への適合性がさらに制限される。
これらの制約に対処するため,歩行者対応行動計画のためのLarge Language Model (LLM)に基づく意思決定フレームワークを導入する。
このシステムは、構造化されたシーンの観察を自然言語による推論のプロンプトに変換し、LLMは歩行者の意図を推測し、リスクを予測し、慎重な戦術的な運転決定を生成する。
これらの決定は、スムーズでキネマティックに実行可能な制御を保証するモーションプランナーによって実行される。
本研究では, 予期せぬ歩行, ターンバック・クロス, ためらい, 双方向横断など, 複数の歩行者行動シナリオにおけるSUMOの枠組みを評価した。
ゼロショット評価では、LSMベースのエージェントは68%の衝突のない成功率を達成し、RLベースラインをかなり上回っている(17.7%)。
単ペデストリアンのシナリオでは数ショットのエピソードメモリを使用すると、パフォーマンスは96.0%に向上し、カスタムDQNコントローラ(82.0%)を超える。
クロスビヘイビア評価により、ターンバック相互作用から得られるメモリは、それぞれ82.0%と90.0%の成功を収める、見知らぬためらうシナリオと双方向の交差シナリオに転送されることが示された。
このシステムは、常に早期の応答を開始し、より広範な安全バッファを保持し、解釈可能で人間に整合した決定を生成する。
関連論文リスト
- C-CoT: Counterfactual Chain-of-Thought with Vision-Language Models for Safe Autonomous Driving [5.963051368087439]
本稿では,運転決定を5段階に分解する反ファクト・チェーン・オブ・シント(C-CoT)フレームワークを提案する。
本稿では, 代替アクションの組み合わせによる潜在的影響を明確に評価するために, メタアクション評価ツリーを構築した。
この自己回帰推論は、行動選択と安全結果の因果関係を確立し、長い尾とアウト・オブ・ディストリビューションのシナリオにおける堅牢性を改善する。
論文 参考訳(メタデータ) (2026-05-11T15:45:00Z) - CoReVLA: A Dual-Stage End-to-End Autonomous Driving Framework for Long-Tail Scenarios via Collect-and-Refine [73.74077186298523]
CoReVLAは、自動運転のための継続的学習フレームワークである。
データコレクションとビヘイビアリファインメントの2段階プロセスを通じて、ロングテールシナリオのパフォーマンスを改善する。
CoReVLAは72.18のドライビングスコア(DS)と50%の成功率(SR)を達成し、7.96DSの最先端手法と15%SRの長期的安全クリティカルシナリオで性能を向上する。
論文 参考訳(メタデータ) (2025-09-19T13:25:56Z) - LeAD: The LLM Enhanced Planning System Converged with End-to-end Autonomous Driving [48.607991747956255]
本稿では,大規模な言語モデル(LLM)拡張と模倣学習に基づくエンドツーエンド(E2E)フレームワークを統合した,二段階自動運転アーキテクチャLeADを提案する。
CARLAシミュレータでの実験的な評価は、LeADが従来と異なるシナリオをうまく扱えることを示し、Leadboard V1ベンチマークで71点、ルート完了率は93%である。
論文 参考訳(メタデータ) (2025-07-08T07:58:29Z) - Plan-R1: Safe and Feasible Trajectory Planning as Language Modeling [74.41886258801209]
本稿では,行動学習から原理的アライメントを分離する2段階の軌道計画フレームワークを提案する。
Plan-R1は計画の安全性と実現可能性を大幅に改善し、最先端の性能を達成する。
論文 参考訳(メタデータ) (2025-05-23T09:22:19Z) - Minds on the Move: Decoding Trajectory Prediction in Autonomous Driving with Cognitive Insights [18.92479778025183]
運転シナリオでは、車両の軌道は人間の運転者の意思決定プロセスによって決定される。
従来のモデルは人間のドライバーの真の意図を捉えることができず、長期の軌道予測において最適以下の性能をもたらす。
ドライバーの意思決定メカニズムを解釈するために,認知的概念である知覚安全を取り入れた認知情報変換器(CITF)を導入する。
論文 参考訳(メタデータ) (2025-02-27T13:43:17Z) - iPLAN: Intent-Aware Planning in Heterogeneous Traffic via Distributed
Multi-Agent Reinforcement Learning [57.24340061741223]
本稿では,高密度および不均一な交通シナリオにおける軌跡や意図を予測できる分散マルチエージェント強化学習(MARL)アルゴリズムを提案する。
インテント対応プランニングのアプローチであるiPLANにより、エージェントは近くのドライバーの意図をローカルな観察からのみ推測できる。
論文 参考訳(メタデータ) (2023-06-09T20:12:02Z) - Motion Planning for Autonomous Vehicles in the Presence of Uncertainty
Using Reinforcement Learning [0.0]
不確実性の下での運動計画は、自動運転車の開発における主要な課題の1つである。
最悪の事例を最適化して不確実性を管理するための強化学習に基づくソリューションを提案する。
提案手法は従来のRLアルゴリズムよりもはるかに優れた動作計画行動を示し,人間の運転スタイルと相容れない動作を示す。
論文 参考訳(メタデータ) (2021-10-01T20:32:25Z) - Modeling Interactions of Autonomous Vehicles and Pedestrians with Deep
Multi-Agent Reinforcement Learning for Collision Avoidance [20.542143534865154]
本研究では,対話系列をマルコフ決定過程 (MDP) としてモデル化し,深部強化学習 (DRL) アルゴリズムを用いて解析する。
知的歩行者行動の異なるPCAMシステムは,エージェントの衝突速度と結果の交通流効率に応じてベンチマークを行う。
その結果, AV は実験条件の大部分で完全に衝突を緩和できることがわかった。
論文 参考訳(メタデータ) (2021-09-30T17:06:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。