論文の概要: Foundation Models for Trajectory Planning in Autonomous Driving: A Review of Progress and Open Challenges
- arxiv url: http://arxiv.org/abs/2512.00021v1
- Date: Fri, 31 Oct 2025 18:05:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-07 19:06:32.39051
- Title: Foundation Models for Trajectory Planning in Autonomous Driving: A Review of Progress and Open Challenges
- Title(参考訳): 自律走行における軌道計画の基礎モデル:進歩とオープンチャレンジの概観
- Authors: Kemal Oksuz, Alexandru Buburuzan, Anthony Knittel, Yuhan Yao, Puneet K. Dokania,
- Abstract要約: マルチモーダル・ファンデーション・モデルは自動運転技術に変化をもたらした。
我々はこのような手法を統一分類学を通して総合的に検討する。
ソースコードとデータセットのオープン性に関して,これらのアプローチを評価する。
- 参考スコア(独自算出の注目度): 53.47232506143113
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The emergence of multi-modal foundation models has markedly transformed the technology for autonomous driving, shifting away from conventional and mostly hand-crafted design choices towards unified, foundation-model-based approaches, capable of directly inferring motion trajectories from raw sensory inputs. This new class of methods can also incorporate natural language as an additional modality, with Vision-Language-Action (VLA) models serving as a representative example. In this review, we provide a comprehensive examination of such methods through a unifying taxonomy to critically evaluate their architectural design choices, methodological strengths, and their inherent capabilities and limitations. Our survey covers 37 recently proposed approaches that span the landscape of trajectory planning with foundation models. Furthermore, we assess these approaches with respect to the openness of their source code and datasets, offering valuable information to practitioners and researchers. We provide an accompanying webpage that catalogs the methods based on our taxonomy, available at: https://github.com/fiveai/FMs-for-driving-trajectories
- Abstract(参考訳): マルチモーダル・ファンデーション・モデルの出現は、従来の手作りデザインの選択肢から、原感覚入力から直接運動軌跡を推測できる統一されたファンデーション・モデル・ベースのアプローチへと、自律運転技術を大きく変えた。
この新たな手法のクラスは、ヴィジュアル・ランゲージ・アクション(VLA)モデルが代表的な例として、自然言語を追加のモダリティとして組み込むこともできる。
本稿では,これらの手法を総合的に検証し,アーキテクチャ設計の選択,方法論的強み,本質的な能力と限界を批判的に評価する。
本調査は, 軌道計画と基礎モデルにまたがる37の手法を最近提案した。
さらに、ソースコードとデータセットのオープン性に関してこれらのアプローチを評価し、実践者や研究者に貴重な情報を提供する。
私たちは、我々の分類に基づく手法をカタログ化する付随するWebページを、https://github.com/fiveai/FMs-for-driving-trajectoriesで公開しています。
関連論文リスト
- A Concise Survey on Lane Topology Reasoning for HD Mapping [30.73664953504888]
レーントポロジ推論技術はハイデフィニション(HD)マッピングや自律運転アプリケーションにおいて重要な役割を担っている。
近年、この分野で重要な進歩が見られたが、これらを包括的にまとめる努力は限られている。
本研究は,レーントポロジー推論手法の進化と現状を体系的にレビューする。
論文 参考訳(メタデータ) (2025-03-31T11:30:40Z) - A Survey of Model Architectures in Information Retrieval [59.61734783818073]
2019年から現在までの期間は、情報検索(IR)と自然言語処理(NLP)における最大のパラダイムシフトの1つとなっている。
従来の用語ベースの手法から現代のニューラルアプローチまで,特にトランスフォーマーベースのモデルとそれに続く大規模言語モデル(LLM)の影響が注目されている。
今後の課題と今後の方向性について、先見的な議論で締めくくります。
論文 参考訳(メタデータ) (2025-02-20T18:42:58Z) - A Survey for Foundation Models in Autonomous Driving [10.315409708116865]
大規模言語モデルは、自動運転における計画とシミュレーションに寄与する。
ビジョンファウンデーションモデルは、3Dオブジェクトの検出やトラッキングといった重要なタスクに適応している。
多様な入力を統合するマルチモーダル基礎モデルは、例外的な視覚的理解と空間的推論を示す。
論文 参考訳(メタデータ) (2024-02-02T02:44:59Z) - Towards Efficient Task-Driven Model Reprogramming with Foundation Models [52.411508216448716]
ビジョンファウンデーションモデルは、非常に大きなモデルキャパシティと幅広いトレーニングデータから恩恵を受け、印象的なパワーを示す。
しかし、実際には、下流のシナリオは限られた計算資源や効率上の考慮のため、小さなモデルしかサポートできない。
これは、ファンデーションモデルの現実的な応用に重要な課題をもたらします。
論文 参考訳(メタデータ) (2023-04-05T07:28:33Z) - Deep Inverse Reinforcement Learning for Route Choice Modeling [0.6853165736531939]
経路選択モデリングは交通計画と需要予測の基本的な課題である。
本研究では,リンクベース経路選択モデルのための一般的な逆強化学習(IRL)フレームワークを提案する。
中国上海のタクシーGPSデータに基づく実験結果から,提案モデルの性能改善を検証した。
論文 参考訳(メタデータ) (2022-06-18T06:33:06Z) - Hub-Pathway: Transfer Learning from A Hub of Pre-trained Models [89.44031286278347]
本稿では,モデルハブからの知識伝達を可能にするハブパスウェイフレームワークを提案する。
提案するフレームワークは、目的のタスク固有の損失でエンドツーエンドにトレーニングすることができる。
コンピュータビジョンおよび強化学習タスクの実験結果は、このフレームワークが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2022-06-08T08:00:12Z) - Planning with Diffusion for Flexible Behavior Synthesis [125.24438991142573]
我々は、できるだけ多くの軌道最適化パイプラインをモデリング問題に折り畳むことがどう見えるか検討する。
我々の技術的アプローチの核心は、軌道を反復的にデノベーションすることで計画する拡散確率モデルにある。
論文 参考訳(メタデータ) (2022-05-20T07:02:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。