論文の概要: Align2Act: Instruction-Tuned Models for Human-Aligned Autonomous Driving
- arxiv url: http://arxiv.org/abs/2510.10503v1
- Date: Sun, 12 Oct 2025 08:50:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:29.979889
- Title: Align2Act: Instruction-Tuned Models for Human-Aligned Autonomous Driving
- Title(参考訳): Align2Act:人間に適応した自律運転のための指導調整モデル
- Authors: Kanishkha Jaisankar, Sunidhi Tandel,
- Abstract要約: そこで我々は,Align2Actを提案する。Align2Actは,命令付き言語モデルを人間の行動に合わせた解釈可能なプランナーに変換する動き計画フレームワークである。
nuPlanデータセットから100万のシナリオ上でLLaMA-2-7BをLoRAで微調整することにより,Test14-randomのオープンループスコア85.17,クローズループスコア70.31,66.96を達成できる。
合成またはオープンループ設定に重点を置いた以前の作業とは異なり、実際のnuPlanクローズドループベンチマークにおいて、計画品質と人間的類似性が改善された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Motion planning in complex scenarios is a core challenge in autonomous driving. Conventional methods apply predefined rules or learn from driving data to generate trajectories, while recent approaches leverage large language models (LLMs) for decision-making. However, it remains unclear whether LLMs truly capture human driving logic. We propose Align2Act, a motion planning framework that transforms instruction-tuned LLMs into interpretable planners aligned with human behavior. We derive structured driving instructions based on human reasoning patterns (e.g., anticipate hazards, yield at intersections) and traffic rules (e.g., stop at red lights, maintain lane boundaries). Our Align2ActChain module guides step-by-step reasoning to produce both an interpretable rationale and a safe trajectory. By fine-tuning LLaMA-2-7B with LoRA on one million scenarios from the nuPlan dataset, our method achieves an open-loop score of 85.17 and closed-loop scores of 70.31 (non-reactive) and 66.96 (reactive) on Test14-random. Unlike prior work focused on synthetic or open-loop settings, we demonstrate improved planning quality and human-likeness on the real-world nuPlan closed-loop benchmark. Ablation studies confirm that structured reasoning significantly improves performance over baseline LLM planners.
- Abstract(参考訳): 複雑なシナリオにおけるモーションプランニングは、自動運転における中核的な課題である。
従来の手法では、事前定義されたルールを適用したり、トラジェクトリを生成するためにデータ駆動から学習する一方で、最近のアプローチでは、意思決定に大規模な言語モデル(LLM)を利用している。
しかし、LLMが人間の運転ロジックを真に捉えているかどうかは不明である。
そこで我々は,Align2Actを提案する。Align2Actは,命令付きLDMを人間の行動に合わせた解釈可能なプランナーに変換する動き計画フレームワークである。
我々は、人間の推論パターン(例えば、危険予測、交差点での利得)と交通規則(例えば、赤信号停止、車線境界維持)に基づいて、構造化された運転指示を導出する。
私たちのAlign2ActChainモジュールは、解釈可能な理性と安全な軌道の両方を生成するためにステップバイステップの推論をガイドします。
nuPlanデータセットから100万のシナリオ上でLLaMA-2-7BをLoRAで微調整することにより,テスト14ランダム上でのオープンループスコア85.17,クローズループスコア70.31,66.96を達成できる。
合成またはオープンループ設定に重点を置いた以前の作業とは異なり、実際のnuPlanクローズドループベンチマークにおいて、計画品質と人間的類似性が改善された。
アブレーション研究は、構造化推論がベースラインLLMプランナよりも性能を著しく向上することを確認する。
関連論文リスト
- ReCogDrive: A Reinforced Cognitive Framework for End-to-End Autonomous Driving [49.07731497951963]
ReCogDriveは、エンドツーエンドの自動運転のための新しい強化認知フレームワークである。
我々は、人間のドライバーのシーケンシャルな認知過程を模倣する階層的なデータパイプラインを導入する。
次に、VLMの学習した運転先を拡散プランナーに注入することで、言語行動ミスマッチに対処する。
論文 参考訳(メタデータ) (2025-06-09T03:14:04Z) - Plan-R1: Safe and Feasible Trajectory Planning as Language Modeling [74.41886258801209]
本稿では,行動学習から原理的アライメントを分離する2段階の軌道計画フレームワークを提案する。
Plan-R1は計画の安全性と実現可能性を大幅に改善し、最先端の性能を達成する。
論文 参考訳(メタデータ) (2025-05-23T09:22:19Z) - LiloDriver: A Lifelong Learning Framework for Closed-loop Motion Planning in Long-tail Autonomous Driving Scenarios [23.913788819453796]
LiloDriverは、ロングテール自動運転シナリオにおけるクローズドループモーションプランニングのための生涯学習フレームワークである。
知覚、シーンエンコーディング、メモリベースの戦略改善、LLM誘導推論を含む4段階アーキテクチャを備えている。
本研究は、構造化メモリとLCM推論を組み合わせることで、現実の自律運転において、スケーラブルで人間ライクな動作計画を可能にすることの有効性を強調した。
論文 参考訳(メタデータ) (2025-05-22T18:33:08Z) - A Framework for Learning Scoring Rules in Autonomous Driving Planning Systems [2.4578723416255754]
FLoRAは、時間論理で表される解釈可能なスコアリングルールを学ぶフレームワークである。
本手法は,学習データに肯定的な例しか含まれていないにもかかわらず,運転行動の評価を効果的に学習する。
クローズドループ計画シミュレーションの評価は、学習したスコアリングルールが既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2025-02-17T02:06:57Z) - Diffusion-Based Planning for Autonomous Driving with Flexible Guidance [19.204115959760788]
閉ループ計画のための新しい変圧器ベース拡散プランナを提案する。
本モデルは,予測タスクと計画タスクの協調モデリングを支援する。
様々な運転スタイルで頑健な伝達性を持つ最先端の閉ループ性能を実現する。
論文 参考訳(メタデータ) (2025-01-26T15:49:50Z) - Instruct Large Language Models to Drive like Humans [33.219883052634614]
本研究では,大規模言語モデルを運動プランナに変換するインストラクトドライブ手法を提案する。
人間の論理に基づく運転指導データを導出する。
次に、最終計画をさらに推論するために解釈可能なInstructChainモジュールを使用します。
論文 参考訳(メタデータ) (2024-06-11T14:24:45Z) - LLM-Assist: Enhancing Closed-Loop Planning with Language-Based Reasoning [65.86754998249224]
従来のルールベースプランナとLCMベースのプランナを併用した,新しいハイブリッドプランナを開発した。
当社のアプローチでは,既存のプランナが苦労する複雑なシナリオをナビゲートし,合理的なアウトプットを生成すると同時に,ルールベースのアプローチと連携して作業する。
論文 参考訳(メタデータ) (2023-12-30T02:53:45Z) - How To Not Drive: Learning Driving Constraints from Demonstration [0.0]
本研究では,人間の運転軌跡から運動計画制約を学習するための新しい手法を提案する。
行動計画は、交通規則に従うために要求される高いレベルの意思決定に責任を負う。
運動プランナーの役割は、自動運転車が従うための実用的で安全な軌道を作り出すことである。
論文 参考訳(メタデータ) (2021-10-01T20:47:04Z) - Learning to drive from a world on rails [78.28647825246472]
モデルベースアプローチによって,事前記録された運転ログからインタラクティブな視覚ベースの運転方針を学習する。
世界の前方モデルは、あらゆる潜在的な運転経路の結果を予測する運転政策を監督する。
提案手法は,carla リーダボードにまずランク付けし,40 倍少ないデータを用いて25%高い運転スコアを得た。
論文 参考訳(メタデータ) (2021-05-03T05:55:30Z) - Deep Structured Reactive Planning [94.92994828905984]
自動運転のための新しいデータ駆動型リアクティブ計画目標を提案する。
本モデルは,非常に複雑な操作を成功させる上で,非反応性変種よりも優れることを示す。
論文 参考訳(メタデータ) (2021-01-18T01:43:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。