論文の概要: A Review of Learning-Based Motion Planning: Toward a Data-Driven Optimal Control Approach
- arxiv url: http://arxiv.org/abs/2512.11944v1
- Date: Fri, 12 Dec 2025 14:01:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.045875
- Title: A Review of Learning-Based Motion Planning: Toward a Data-Driven Optimal Control Approach
- Title(参考訳): 学習型運動計画のレビュー:データ駆動型最適制御アプローチに向けて
- Authors: Jia Hu, Yang Chang, Haoran Wang,
- Abstract要約: 高レベルの自律運転のための運動プランニングは、透明で不安定なパイプライン方式と、現代の学習ベースシステムの適応的で不透明な「ブラックボックス」特性とのトレードオフによって制約される。
本稿では,古典的制御と機械学習の適応能力を統合する統一フレームワークとして,データ駆動型最適制御パラダイムを提案する。
本稿では,「Human-Centric」のカスタマイズ,「Platform-Adaptive」の動的適応,自己学習による「System Self-Optimization」の3つの重要な次世代機能を実現するためのフレームワークの可能性を検討する。
- 参考スコア(独自算出の注目度): 9.141034088788233
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Motion planning for high-level autonomous driving is constrained by a fundamental trade-off between the transparent, yet brittle, nature of pipeline methods and the adaptive, yet opaque, "black-box" characteristics of modern learning-based systems. This paper critically synthesizes the evolution of the field -- from pipeline methods through imitation learning, reinforcement learning, and generative AI -- to demonstrate how this persistent dilemma has hindered the development of truly trustworthy systems. To resolve this impasse, we conduct a comprehensive review of learning-based motion planning methods. Based on this review, we outline a data-driven optimal control paradigm as a unifying framework that synergistically integrates the verifiable structure of classical control with the adaptive capacity of machine learning, leveraging real-world data to continuously refine key components such as system dynamics, cost functions, and safety constraints. We explore this framework's potential to enable three critical next-generation capabilities: "Human-Centric" customization, "Platform-Adaptive" dynamics adaptation, and "System Self-Optimization" via self-tuning. We conclude by proposing future research directions based on this paradigm, aimed at developing intelligent transportation systems that are simultaneously safe, interpretable, and capable of human-like autonomy.
- Abstract(参考訳): 高レベルの自律運転のための運動プランニングは、透明で不安定なパイプライン方式と、現代の学習システムにおける適応的で不透明な「ブラックボックス」特性の基本的なトレードオフによって制約される。
本稿では、パイプライン手法から模倣学習、強化学習、生成AIに至るまでの分野の進化を批判的に合成し、この永続的なジレンマが真に信頼できるシステムの開発を妨げていることを実証する。
この課題を解決するために,我々は学習に基づく動き計画手法の総合的なレビューを行う。
本稿では,データ駆動型最適制御パラダイムを,古典的制御の検証可能な構造を機械学習の適応能力と相乗的に統合する統一フレームワークとして概説する。
本稿では,「Human-Centric」のカスタマイズ,「Platform-Adaptive」の動的適応,自己学習による「System Self-Optimization」の3つの重要な次世代機能を実現するためのフレームワークの可能性を検討する。
我々は、このパラダイムに基づく将来の研究の方向性を提案し、同時に安全で、解釈可能で、人間のような自律性を持つインテリジェントな輸送システムを開発することを目標にしている。
関連論文リスト
- From Physics to Machine Learning and Back: Part II - Learning and Observational Bias in PHM [52.64097278841485]
物理インフォームドモデリングとデータストラテジーによる学習と観察バイアスの導入は、モデルを物理的に一貫した信頼性のある予測へと導くことができるかを検討する。
メタラーニングや少数ショットラーニングなどの高速適応手法をドメイン一般化手法とともに検討する。
論文 参考訳(メタデータ) (2025-09-25T14:15:43Z) - Discrete Diffusion for Reflective Vision-Language-Action Models in Autonomous Driving [55.13109926181247]
離散拡散による安全な軌道生成のためのリフレクション機構を統合した学習ベースのフレームワークであるReflectDriveを紹介する。
我々のアプローチの中心は、勾配のない反復的な自己補正を行う、安全を意識した反射機構である。
本手法は目標条件付き軌道生成から始まり,マルチモーダル運転動作をモデル化する。
論文 参考訳(メタデータ) (2025-09-24T13:35:15Z) - AutoDrive-R$^2$: Incentivizing Reasoning and Self-Reflection Capacity for VLA Model in Autonomous Driving [37.260140808367716]
本稿では,自律運転システムの推論能力と自己回帰能力を両立させる新しいVLAフレームワークであるAutoDrive-R$2$を提案する。
まず,教師付き微調整のための新しいCoTデータセット nuScenesR$2$-6K を提案する。
次に, グループ相対政策最適化(GRPO)アルゴリズムを用いて, 信頼性の高い滑らかさと現実的な軌道計画を実現する。
論文 参考訳(メタデータ) (2025-09-02T04:32:24Z) - Chain-of-Thought for Autonomous Driving: A Comprehensive Survey and Future Prospects [13.655659915158633]
CoT推論(Chain-of-Thought reasoning)は、人間の思考過程をシミュレートする高度な認知手法である。
本稿では,CoT法が自律運転モデルの推論能力をどのように向上させるかを検討する。
論文 参考訳(メタデータ) (2025-05-26T17:06:00Z) - Interpretable Neural System Dynamics: Combining Deep Learning with System Dynamics Modeling to Support Critical Applications [0.0]
この提案は、解釈可能なニューラルネットワークダイナミクスフレームワークを開発することにより、ディープラーニング(DL)とシステムダイナミクス(SD)のギャップを埋めることを目的としている。
提案されたパイプラインの有効性は、EUが出資したAutoMoTIFプロジェクトの実際の応用を通じて検証される。
論文 参考訳(メタデータ) (2025-05-20T14:38:39Z) - LLM4Drive: A Survey of Large Language Models for Autonomous Driving [62.10344445241105]
大規模言語モデル(LLM)は、文脈理解、論理的推論、回答生成などの能力を示した。
本稿では,自動走行のための大規模言語モデル (LLM4AD) に関する研究ラインを体系的にレビューする。
論文 参考訳(メタデータ) (2023-11-02T07:23:33Z) - Model-Based Reinforcement Learning with Isolated Imaginations [61.67183143982074]
モデルに基づく強化学習手法であるIso-Dream++を提案する。
我々は、切り離された潜在的想像力に基づいて政策最適化を行う。
これにより、野生の混合力学源を孤立させることで、長い水平振動子制御タスクの恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-03-27T02:55:56Z) - Active Learning of Discrete-Time Dynamics for Uncertainty-Aware Model Predictive Control [46.81433026280051]
本稿では,非線形ロボットシステムの力学を積極的にモデル化する自己教師型学習手法を提案する。
我々のアプローチは、目に見えない飛行条件に一貫して適応することで、高いレジリエンスと一般化能力を示す。
論文 参考訳(メタデータ) (2022-10-23T00:45:05Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z) - UMBRELLA: Uncertainty-Aware Model-Based Offline Reinforcement Learning
Leveraging Planning [1.1339580074756188]
オフライン強化学習(RL)は、オフラインデータから意思決定を学ぶためのフレームワークを提供する。
自動運転車(SDV)は、おそらく準最適データセットの振る舞いよりも優れるポリシーを学ぶ。
これはモデルベースのオフラインRLアプローチの使用を動機付け、プランニングを活用する。
論文 参考訳(メタデータ) (2021-11-22T10:37:52Z) - Dream to Explore: Adaptive Simulations for Autonomous Systems [3.0664963196464448]
ベイズ的非パラメトリック法を適用し,力学系制御の学習に挑戦する。
ガウス過程を用いて潜在世界力学を探索することにより、強化学習で観測される一般的なデータ効率の問題を緩和する。
本アルゴリズムは,ログの変動的下界を最適化することにより,世界モデルと政策を共同で学習する。
論文 参考訳(メタデータ) (2021-10-27T04:27:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。