論文の概要: Frozen LLMs as Map-Aware Spatio-Temporal Reasoners for Vehicle Trajectory Prediction
- arxiv url: http://arxiv.org/abs/2604.21479v2
- Date: Fri, 24 Apr 2026 03:30:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-27 13:34:22.044663
- Title: Frozen LLMs as Map-Aware Spatio-Temporal Reasoners for Vehicle Trajectory Prediction
- Title(参考訳): 車両軌道予測のためのマップ対応時空間共振器としての冷凍LLM
- Authors: Yanjiao Liu, Jiawei Liu, Xun Gong, Zifei Nie,
- Abstract要約: 大規模言語モデル(LLM)は近年,強力な推論能力を示し,自律運転(AD)分野における研究の注目を集めている。
本研究では,動的な交通エージェントの挙動と道路ネットワークのトポロジを理解する上でのLLMの能力を評価する枠組みを提案する。
- 参考スコア(独自算出の注目度): 10.94749346369199
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) have recently demonstrated strong reasoning capabilities and attracted increasing research attention in the field of autonomous driving (AD). However, safe application of LLMs on AD perception and prediction still requires a thorough understanding of both the dynamic traffic agents and the static road infrastructure. To this end, this study introduces a framework to evaluate the capability of LLMs in understanding the behaviors of dynamic traffic agents and the topology of road networks. The framework leverages frozen LLMs as the reasoning engine, employing a traffic encoder to extract spatial-level scene features from observed trajectories of agents, while a lightweight Convolutional Neural Network (CNN) encodes the local high-definition (HD) maps. To assess the intrinsic reasoning ability of LLMs, the extracted scene features are then transformed into LLM-compatible tokens via a reprogramming adapter. By residing the prediction burden with the LLMs, a simpler linear decoder is applied to output future trajectories. The framework enables a quantitative analysis of the influence of multi-modal information, especially the impact of map semantics on trajectory prediction accuracy, and allows seamless integration of frozen LLMs with minimal adaptation, thereby demonstrating strong generalizability across diverse LLM architectures and providing a unified platform for model evaluation.
- Abstract(参考訳): 大規模言語モデル(LLM)は近年,強力な推論能力を示し,自律運転(AD)分野における研究の注目を集めている。
しかし、LLMのAD知覚と予測への安全な適用には、動的トラフィックエージェントと静的道路インフラの両方を十分に理解する必要がある。
そこで本研究では,動的な交通エージェントの挙動と道路ネットワークのトポロジを理解する上で,LCMの能力を評価する枠組みを提案する。
このフレームワークは、凍結LDMを推論エンジンとして利用し、トラフィックエンコーダを使用して、観測されたエージェントの軌跡から空間レベルのシーン特徴を抽出し、軽量な畳み込みニューラルネットワーク(CNN)は局所的な高精細(HD)マップを符号化する。
LLMの固有の推論能力を評価するために、抽出されたシーン特徴を再プログラミングアダプタを介してLLM互換トークンに変換する。
予測負荷をLSMで埋め込むことで、より単純な線形デコーダを将来の軌跡の出力に適用する。
本フレームワークは,マルチモーダル情報,特に地図セマンティクスが軌跡予測精度に与える影響を定量的に解析し,凍結LDMを最小限の適応でシームレスに統合することにより,多様なLCMアーキテクチャにまたがる強力な一般化可能性を示し,モデル評価のための統一プラットフォームを提供する。
関連論文リスト
- Robustness of LLM-enabled vehicle trajectory prediction under data security threats [6.812902306426757]
大型言語モデル(LLM)は、周囲の車両からデータを収集・変換することで、車両軌跡や車線変更意図を正確に予測することができる。
本研究では,LLM対応車両軌道予測の系統的脆弱性解析を行うことにより,このギャップを解消する。
高Dデータセットの実験では、小さな、物理的に妥当な摂動でさえ、モデル出力を著しく破壊する可能性があることが明らかになった。
論文 参考訳(メタデータ) (2025-11-14T03:26:51Z) - Understanding the Geospatial Reasoning Capabilities of LLMs: A Trajectory Recovery Perspective [31.228269455751363]
本稿では,Large Language Models (LLMs) が道路網地図を読み取ってナビゲーションを行うことができるかどうかを考察する。
トラジェクトリ・リカバリは,マスク付きGPSトレースを復元するモデルを必要とするプロキシ・タスクである。
我々のプロンプトフレームワークは,道路ネットワークをコンテキストとして使用することにより,外部ナビゲーションツールにアクセスすることなく,有効な経路を生成することができる。
論文 参考訳(メタデータ) (2025-10-02T03:37:41Z) - Traffic-MLLM: A Spatio-Temporal MLLM with Retrieval-Augmented Generation for Causal Inference in Traffic [8.754321713184483]
本稿では,詳細なトラフィック解析に適した多モーダル大規模言語モデルであるTraffic-LMを提案する。
我々のモデルは、高品質な交通特化マルチモーダルデータセットを活用し、軽量な微調整にLowRanktemporal Adaptation (LoRA) を用いる。
また、検索ロッドジェネレーション(LoRAG)による最先端推論を融合した革新的な知識モジュールも導入する。
論文 参考訳(メタデータ) (2025-09-14T08:53:06Z) - Exploring the Roles of Large Language Models in Reshaping Transportation Systems: A Survey, Framework, and Roadmap [51.198001060683296]
大型言語モデル(LLM)は、輸送上の課題に対処するための変革的な可能性を提供する。
LLM4TRは,交通におけるLSMの役割を体系的に分類する概念的枠組みである。
それぞれの役割について,交通予測や自律運転,安全分析,都市移動最適化など,さまざまな応用について検討した。
論文 参考訳(メタデータ) (2025-03-27T11:56:27Z) - Navigating Motion Agents in Dynamic and Cluttered Environments through LLM Reasoning [69.5875073447454]
本稿では,大規模言語モデル(LLM)によって強化された動作エージェントを,動的・乱雑な環境における自律的なナビゲーションに向けて前進させる。
トレーニング不要なフレームワークは、マルチエージェント調整、クローズドループ計画、動的障害物回避を、リトレーニングや微調整なしでサポートしています。
論文 参考訳(メタデータ) (2025-03-10T13:39:09Z) - CoT-Drive: Efficient Motion Forecasting for Autonomous Driving with LLMs and Chain-of-Thought Prompting [14.567180355849501]
CoT-Driveは,大規模言語モデル(LLM)とチェーン・オブ・シークレット(CoT)プロンプト手法を活用することで,動き予測を強化する新しい手法である。
我々は,LLMの高度なシーン理解能力を軽量言語モデル(LM)に効果的に伝達する,教師による知識蒸留戦略を導入する。
本稿では,文脈固有の意味アノテーションを生成するための軽量なLMを微調整するための2つのシーン記述データセットであるHighway-TextとUrban-Textを提案する。
論文 参考訳(メタデータ) (2025-03-10T12:17:38Z) - LLM-Lasso: A Robust Framework for Domain-Informed Feature Selection and Regularization [59.75242204923353]
LLM-Lassoは大規模言語モデル(LLM)を利用してラッソ回帰における特徴選択を導くフレームワークである。
LLMは各特徴に対してペナルティ因子を生成し、単純でチューニング可能なモデルを用いてラスソペナルティの重みに変換される。
LLMによりより関連づけられた特徴は、より低い罰を受け、最終モデルに保持される可能性を高める。
論文 参考訳(メタデータ) (2025-02-15T02:55:22Z) - Strada-LLM: Graph LLM for traffic prediction [62.2015839597764]
交通予測における大きな課題は、非常に異なる交通条件によって引き起こされる多様なデータ分散を扱うことである。
近位交通情報を考慮した交通予測のためのグラフ対応LLMを提案する。
我々は、新しいデータ分散に直面する際に、ドメイン適応を効率的にするための軽量なアプローチを採用する。
論文 参考訳(メタデータ) (2024-10-28T09:19:29Z) - Traj-LLM: A New Exploration for Empowering Trajectory Prediction with Pre-trained Large Language Models [12.687494201105066]
本稿では,Traj-LLMを提案する。Large Language Models (LLMs) を用いて,エージェントの過去の/観測された軌跡やシーンセマンティクスから将来の動きを生成する可能性について検討する。
LLMの強力な理解能力は、ハイレベルなシーン知識とインタラクティブな情報のスペクトルを捉えている。
人為的な車線焦点認知機能を模倣し,先駆的なMambaモジュールを用いた車線認識確率論的学習を導入する。
論文 参考訳(メタデータ) (2024-05-08T09:28:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。