論文の概要: Planning Safety Trajectories with Dual-Phase, Physics-Informed, and Transportation Knowledge-Driven Large Language Models
- arxiv url: http://arxiv.org/abs/2504.04562v1
- Date: Sun, 06 Apr 2025 17:34:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-16 00:58:02.980693
- Title: Planning Safety Trajectories with Dual-Phase, Physics-Informed, and Transportation Knowledge-Driven Large Language Models
- Title(参考訳): 2相・物理インフォームド・交通知識駆動型大言語モデルによる安全軌道の計画
- Authors: Rui Gan, Pei Li, Keke Long, Bocheng An, Junwei You, Keshu Wu, Bin Ran,
- Abstract要約: LetsPiは、安全で人間らしい軌道計画のための、物理インフォームドで二相的、知識駆動のフレームワークである。
幻覚を防ぎ、不確実性を最小化するために、このハイブリッドフレームワークは、物理学的インフォームド・ソーシャル・フォース・ダイナミクスによるLarge Language Model (LLM)推論を統合している。
- 参考スコア(独自算出の注目度): 14.047684122511706
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Foundation models have demonstrated strong reasoning and generalization capabilities in driving-related tasks, including scene understanding, planning, and control. However, they still face challenges in hallucinations, uncertainty, and long inference latency. While existing foundation models have general knowledge of avoiding collisions, they often lack transportation-specific safety knowledge. To overcome these limitations, we introduce LetsPi, a physics-informed, dual-phase, knowledge-driven framework for safe, human-like trajectory planning. To prevent hallucinations and minimize uncertainty, this hybrid framework integrates Large Language Model (LLM) reasoning with physics-informed social force dynamics. LetsPi leverages the LLM to analyze driving scenes and historical information, providing appropriate parameters and target destinations (goals) for the social force model, which then generates the future trajectory. Moreover, the dual-phase architecture balances reasoning and computational efficiency through its Memory Collection phase and Fast Inference phase. The Memory Collection phase leverages the physics-informed LLM to process and refine planning results through reasoning, reflection, and memory modules, storing safe, high-quality driving experiences in a memory bank. Surrogate safety measures and physics-informed prompt techniques are introduced to enhance the LLM's knowledge of transportation safety and physical force, respectively. The Fast Inference phase extracts similar driving experiences as few-shot examples for new scenarios, while simplifying input-output requirements to enable rapid trajectory planning without compromising safety. Extensive experiments using the HighD dataset demonstrate that LetsPi outperforms baseline models across five safety metrics.See PDF for project Github link.
- Abstract(参考訳): ファウンデーションモデルは、シーン理解、計画、制御を含む運転関連のタスクにおいて、強力な推論と一般化能力を示してきた。
しかし、幻覚、不確実性、長期間の推論遅延といった課題に直面している。
既存の基礎モデルは衝突を避けるという一般的な知識を持っているが、交通機関固有の安全知識を欠いていることが多い。
これらの制限を克服するために、安全で人間らしい軌道計画のための物理インフォームドで二相的、知識駆動型フレームワークであるLetsPiを紹介した。
幻覚を防ぎ、不確実性を最小化するために、このハイブリッドフレームワークは、物理学的インフォームド・ソーシャル・フォース・ダイナミクスによるLarge Language Model (LLM)推論を統合している。
LetsPiはLDMを利用して運転シーンと過去の情報を分析し、社会力モデルに適切なパラメータと目標目的地(ゴール)を提供し、将来の軌道を生成する。
さらに、二相アーキテクチャは、メモリコレクションフェーズと高速推論フェーズを通じて、推論と計算効率のバランスをとる。
メモリコレクションフェーズは物理インフォームされたLCMを利用して、推論、リフレクション、メモリモジュールを通じて計画結果を処理し、洗練し、安全な高品質な運転体験をメモリバンクに保存する。
補助安全対策と物理インフォームドプロンプト技術を導入し、輸送安全に関するLLMの知識と物理的な力を高める。
Fast Inferenceフェーズは、新しいシナリオのごく一部の例として、同様の運転経験を抽出すると同時に、インプット・アウトプット要件を簡素化して、安全を損なうことなく、高速な軌道計画を可能にする。
HighDデータセットを使用した大規模な実験により、LetsPiは5つの安全指標でベースラインモデルを上回り、GithubプロジェクトのPDFを参照してください。
関連論文リスト
- Fundamental Safety-Capability Trade-offs in Fine-tuning Large Language Models [92.38300626647342]
タスク固有のデータセット上でのLLM(Fun-tuning Large Language Model)は、LLMの第一の用途である。
本稿では,LLMファインチューニング戦略の安全性と能力の相互作用を理解するための理論的枠組みを提案する。
論文 参考訳(メタデータ) (2025-03-24T20:41:57Z) - Enhancing Autonomous Driving Safety with Collision Scenario Integration [36.83682052117178]
衝突データから学習するためのトレーニングフレームワークであるSafeFusionを提案する。
SafeFusionは、模倣学習を過度に検討する代わりに、トレーニング中に安全指向のメトリクスを統合して、衝突回避学習を可能にする。
また、多様な高品質なシナリオを生成するスケーラブルなデータ生成パイプラインであるCollisionGenを提案する。
論文 参考訳(メタデータ) (2025-03-05T23:08:43Z) - SafeAuto: Knowledge-Enhanced Safe Autonomous Driving with Multimodal Foundation Models [63.71984266104757]
MLLM(Multimodal Large Language Models)は、視覚データとテキストデータの両方を処理する。
構造化されていない知識と構造化されていない知識の両方を取り入れることでMLLMベースの自動運転システムを強化する新しいフレームワークであるSafeAutoを提案する。
論文 参考訳(メタデータ) (2025-02-28T21:53:47Z) - Minds on the Move: Decoding Trajectory Prediction in Autonomous Driving with Cognitive Insights [18.92479778025183]
運転シナリオでは、車両の軌道は人間の運転者の意思決定プロセスによって決定される。
従来のモデルは人間のドライバーの真の意図を捉えることができず、長期の軌道予測において最適以下の性能をもたらす。
ドライバーの意思決定メカニズムを解釈するために,認知的概念である知覚安全を取り入れた認知情報変換器(CITF)を導入する。
論文 参考訳(メタデータ) (2025-02-27T13:43:17Z) - SafeDrive: Knowledge- and Data-Driven Risk-Sensitive Decision-Making for Autonomous Vehicles with Large Language Models [14.790308656087316]
SafeDriveは、自律運転の安全性と適応性を高めるための、知識とデータ駆動型リスクに敏感な意思決定フレームワークである。
知識駆動型洞察と適応学習機構を統合することにより、不確実な条件下での堅牢な意思決定を保証する。
論文 参考訳(メタデータ) (2024-12-17T16:45:27Z) - Learning Soft Driving Constraints from Vectorized Scene Embeddings while Imitating Expert Trajectories [16.666811573117613]
運動計画の第一の目的は、車両の安全で効率的な軌道を生成することである。
伝統的に、運動計画モデルは、人間の専門家の行動を模倣するために模倣学習を用いて訓練される。
本研究では,制約学習を模倣学習に統合する手法を提案する。
論文 参考訳(メタデータ) (2024-12-07T18:29:28Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Empowering Autonomous Driving with Large Language Models: A Safety Perspective [82.90376711290808]
本稿では,Large Language Models (LLM) の自律運転システムへの統合について検討する。
LLMは行動計画におけるインテリジェントな意思決定者であり、文脈的安全学習のための安全検証シールドを備えている。
適応型LLM条件モデル予測制御(MPC)と状態機械を用いたLLM対応対話型行動計画スキームという,シミュレーション環境における2つの重要な研究について述べる。
論文 参考訳(メタデータ) (2023-11-28T03:13:09Z) - Reason for Future, Act for Now: A Principled Framework for Autonomous
LLM Agents with Provable Sample Efficiency [53.8779374188643]
本稿では,推論と行動のオーケストレーションを行うための,証明可能な後悔の保証を備えた原則的枠組みを提案する。
具体的には、メモリバッファから学習する推論のためのプロンプトテンプレートを設計し、長い水平線上で将来の軌道を計画する。
各ステップにおいて、LLMエージェントは計画された軌跡の初期動作("act for now")を受け取り、収集したフィードバックをメモリバッファに格納し、推論ルーチンを再起動して、将来の軌跡を新しい状態から再設計する。
論文 参考訳(メタデータ) (2023-09-29T16:36:39Z) - Congestion-aware Multi-agent Trajectory Prediction for Collision
Avoidance [110.63037190641414]
渋滞パターンを明示的に学習し、新しい「センス--学習--Reason--予測」フレームワークを考案する。
学習段階を2段階に分解することで、「学生」は「教師」から文脈的手がかりを学習し、衝突のない軌跡を生成する。
実験では,提案モデルが合成データセットにおいて衝突のない軌道予測を生成できることを実証する。
論文 参考訳(メタデータ) (2021-03-26T02:42:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。