論文の概要: Large Foundation Models for Trajectory Prediction in Autonomous Driving: A Comprehensive Survey
- arxiv url: http://arxiv.org/abs/2509.10570v1
- Date: Thu, 11 Sep 2025 10:30:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 17:26:22.674256
- Title: Large Foundation Models for Trajectory Prediction in Autonomous Driving: A Comprehensive Survey
- Title(参考訳): 自律走行における軌道予測のための大規模基礎モデル:総合的調査
- Authors: Wei Dai, Shengen Wu, Wei Wu, Zhenhao Wang, Sisuo Lyu, Haicheng Liao, Limin Yu, Weiping Ding, Runwei Guan, Yutao Yue,
- Abstract要約: 軌道予測は自動運転において重要な機能である。
LFM(Large Foundation Models)の台頭は、軌道予測の研究パラダイムを変えつつある。
本稿では、トラジェクティブ言語マッピング、マルチモーダル融合、制約ベースの推論の3つの中核となる方法論を取り上げる。
- 参考スコア(独自算出の注目度): 26.44322475984292
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Trajectory prediction serves as a critical functionality in autonomous driving, enabling the anticipation of future motion paths for traffic participants such as vehicles and pedestrians, which is essential for driving safety. Although conventional deep learning methods have improved accuracy, they remain hindered by inherent limitations, including lack of interpretability, heavy reliance on large-scale annotated data, and weak generalization in long-tail scenarios. The rise of Large Foundation Models (LFMs) is transforming the research paradigm of trajectory prediction. This survey offers a systematic review of recent advances in LFMs, particularly Large Language Models (LLMs) and Multimodal Large Language Models (MLLMs) for trajectory prediction. By integrating linguistic and scene semantics, LFMs facilitate interpretable contextual reasoning, significantly enhancing prediction safety and generalization in complex environments. The article highlights three core methodologies: trajectory-language mapping, multimodal fusion, and constraint-based reasoning. It covers prediction tasks for both vehicles and pedestrians, evaluation metrics, and dataset analyses. Key challenges such as computational latency, data scarcity, and real-world robustness are discussed, along with future research directions including low-latency inference, causality-aware modeling, and motion foundation models.
- Abstract(参考訳): 軌道予測は自動運転において重要な機能であり、自動車や歩行者などの交通参加者の将来の移動経路を予測できる。
従来のディープラーニング手法では精度は向上しているが、解釈可能性の欠如、大規模な注釈付きデータへの重度依存、ロングテールシナリオでの弱い一般化など、固有の制限によって妨げられている。
LFM(Large Foundation Models)の台頭は、軌道予測の研究パラダイムを変えつつある。
本調査は, LFM, 特にLarge Language Models (LLMs) とMultimodal Large Language Models (MLLMs) の軌跡予測における最近の進歩を体系的に概観するものである。
言語とシーンのセマンティクスを統合することで、LFMは解釈可能な文脈推論を促進し、複雑な環境での予測安全性と一般化を著しく向上する。
この記事では、トラジェクティブ言語マッピング、マルチモーダル融合、制約ベースの推論という、3つの中核的な方法論を強調します。
車両と歩行者の両方の予測タスク、評価指標、データセット分析をカバーしている。
計算遅延、データ不足、実世界のロバスト性などの主要な課題と、低レイテンシ推論、因果性認識モデリング、運動基礎モデルなどの今後の研究方向性について論じる。
関連論文リスト
- ImagiDrive: A Unified Imagination-and-Planning Framework for Autonomous Driving [64.12414815634847]
ビジョン・ランゲージ・モデル(VLM)とドライビング・ワールド・モデル(DWM)は、この課題のさまざまな側面に対処する強力なレシピとして独立して登場した。
我々は、VLMベースの運転エージェントとDWMベースのシーン想像装置を統合した、新しいエンドツーエンドの自動運転フレームワークであるImagiDriveを提案する。
論文 参考訳(メタデータ) (2025-08-15T12:06:55Z) - A Survey of World Models for Autonomous Driving [55.520179689933904]
自律運転の最近の進歩は、堅牢な世界モデリングの進歩によって推進されている。
世界モデルは、マルチセンサーデータ、セマンティックキュー、時間ダイナミクスを統合する駆動環境の高忠実度表現を提供する。
今後の研究は、自己指導型表現学習、マルチモーダル融合、高度なシミュレーションにおける重要な課題に対処する必要がある。
論文 参考訳(メタデータ) (2025-01-20T04:00:02Z) - Scene-Aware Explainable Multimodal Trajectory Prediction [15.58042746234974]
説明可能な条件拡散に基づくマルチモーダル軌道予測(DMTP)モデルを提案する。
本モデルでは,マルチモーダルな軌道パターンを捉えるために条件拡散法を改良し,大域的特徴とシナリオ固有の特徴の意義を評価するためにシェープ値モデルを改良した。
実験により,本モデルが重要な入力の同定に優れ,精度でベースラインモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2024-10-22T08:17:33Z) - Towards Explainable Traffic Flow Prediction with Large Language Models [36.86937188565623]
本稿では,Large Language Models (LLMs) に基づく交通流予測モデルを提案する。
マルチモーダルなトラフィックデータを自然言語記述に転送することで、xTP-LLMは複雑な時系列パターンと外部要因を包括的なトラフィックデータからキャプチャする。
経験的に、xTP-LLMは、ディープラーニングのベースラインと比較して、競争の正確さを示すと同時に、予測の直感的で信頼性の高い説明を提供する。
論文 参考訳(メタデータ) (2024-04-03T07:14:15Z) - LC-LLM: Explainable Lane-Change Intention and Trajectory Predictions with Large Language Models [8.624969693477448]
既存の動き予測手法は、特に長期予測精度と解釈可能性の観点から、改善の余地が十分にある。
本稿では,大規模言語モデルの強い推論能力と自己説明能力を活用する,説明可能なレーン変更予測モデルLC-LLMを提案する。
論文 参考訳(メタデータ) (2024-03-27T08:34:55Z) - Certified Human Trajectory Prediction [66.1736456453465]
本稿では,ロバスト性を保証する軌道予測に適した認証手法を提案する。
そこで本研究では, 拡散型トラジェクトリデノイザを提案し, 本手法に組み込むことにより, 性能低下を緩和する。
認定された予測器の精度と堅牢性を実証し、認定されていない予測器に対するそれらの優位性を強調する。
論文 参考訳(メタデータ) (2024-03-20T17:41:35Z) - JRDB-Traj: A Dataset and Benchmark for Trajectory Forecasting in Crowds [79.00975648564483]
ロボット工学、自動運転車、ナビゲーションなどの分野で使用される軌道予測モデルは、現実のシナリオにおいて課題に直面している。
このデータセットは、ロボットの観点から、すべてのエージェント、シーンイメージ、ポイントクラウドの位置を含む包括的なデータを提供する。
本研究の目的は,ロボットに対するエージェントの将来の位置を,生の感覚入力データを用いて予測することである。
論文 参考訳(メタデータ) (2023-11-05T18:59:31Z) - The Importance of Prior Knowledge in Precise Multimodal Prediction [71.74884391209955]
道路にはよく定義された地形、地形、交通規則がある。
本稿では,構造的事前を損失関数として組み込むことを提案する。
実世界の自動運転データセットにおけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2020-06-04T03:56:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。