論文の概要: DAP: A Discrete-token Autoregressive Planner for Autonomous Driving
- arxiv url: http://arxiv.org/abs/2511.13306v1
- Date: Mon, 17 Nov 2025 12:31:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:25.206452
- Title: DAP: A Discrete-token Autoregressive Planner for Autonomous Driving
- Title(参考訳): DAP: 自律運転のための離散的な自律回帰プランナー
- Authors: Bowen Ye, Bin Zhang, Hang Zhao,
- Abstract要約: 本稿では,BEVのセマンティクスとエゴの軌跡を共同で予測する離散的な自己回帰プランナであるDAPを紹介する。
我々は、報酬誘導改善を注入しながら、教師付き行動クローンを保存できる強化学習に基づく微調整を取り入れた。
DAPは、オープンループメトリクスの最先端のパフォーマンスを達成し、NAVSIMベンチマークで競合するクローズループ結果を提供する。
- 参考スコア(独自算出の注目度): 34.32497598431514
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Gaining sustainable performance improvement with scaling data and model budget remains a pivotal yet unresolved challenge in autonomous driving. While autoregressive models exhibited promising data-scaling efficiency in planning tasks, predicting ego trajectories alone suffers sparse supervision and weakly constrains how scene evolution should shape ego motion. Therefore, we introduce DAP, a discrete-token autoregressive planner that jointly forecasts BEV semantics and ego trajectories, thereby enforcing comprehensive representation learning and allowing predicted dynamics to directly condition ego motion. In addition, we incorporate a reinforcement-learning-based fine-tuning, which preserves supervised behavior cloning priors while injecting reward-guided improvements. Despite a compact 160M parameter budget, DAP achieves state-of-the-art performance on open-loop metrics and delivers competitive closed-loop results on the NAVSIM benchmark. Overall, the fully discrete-token autoregressive formulation operating on both rasterized BEV and ego actions provides a compact yet scalable planning paradigm for autonomous driving.
- Abstract(参考訳): データのスケーリングとモデル予算による持続可能なパフォーマンス向上は、自動運転における重要な課題でありながら未解決の課題である。
自己回帰モデルは、計画作業において有望なデータスケーリング効率を示したが、エゴ軌道のみを予測することは、疎い監督と、シーンの進化がエゴ運動を形成するための弱い制約を課す。
そこで我々は,BEVのセマンティクスとエゴの軌跡を共同で予測し,包括的表現学習を行い,予測力学をエゴ運動に直接条件付ける離散的な自己回帰プランナであるDAPを紹介した。
さらに,強化学習に基づく微調整を取り入れて,報酬誘導型改善を注入しながら,指導行動のクローン化を前倒しに維持する。
コンパクトな160Mパラメータ予算にもかかわらず、DAPはオープンループメトリクスの最先端のパフォーマンスを達成し、NAVSIMベンチマークで競合するクローズループ結果を提供する。
全体として、ラスタライズされたBEVとegoアクションの両方で動作する完全に離散的な自己回帰式は、自動運転のためのコンパクトでスケーラブルな計画パラダイムを提供する。
関連論文リスト
- Self-Correcting VLA: Online Action Refinement via Sparse World Imagination [55.982504915794514]
本稿では, 自己補正VLA (SC-VLA) を提案する。
SC-VLAは最先端のパフォーマンスを達成し、最高タスクスループットを16%削減し、最高パフォーマンスのベースラインよりも9%高い成功率を得る。
論文 参考訳(メタデータ) (2026-02-25T06:58:06Z) - Sequence of Expert: Boosting Imitation Planners for Autonomous Driving through Temporal Alternation [12.450883696383878]
イミテーション・ラーニング (IL) は自動運転における中心的なパラダイムとして浮上している。
ILは、ステップごとの予測エラーを最小限にすることで、オープンループ設定で専門家の振る舞いにマッチする。
連続した計画サイクルでは、小さな、しばしば受け入れがたいエラーが複雑になり、深刻な失敗をもたらす可能性がある。
本稿では,モデルサイズやデータ要求を増大させることなくクローズドループ性能を向上させるために,エキスパートシーケンス(SoE)を提案する。
論文 参考訳(メタデータ) (2025-12-15T08:50:23Z) - AutoDrive-R$^2$: Incentivizing Reasoning and Self-Reflection Capacity for VLA Model in Autonomous Driving [37.260140808367716]
本稿では,自律運転システムの推論能力と自己回帰能力を両立させる新しいVLAフレームワークであるAutoDrive-R$2$を提案する。
まず,教師付き微調整のための新しいCoTデータセット nuScenesR$2$-6K を提案する。
次に, グループ相対政策最適化(GRPO)アルゴリズムを用いて, 信頼性の高い滑らかさと現実的な軌道計画を実現する。
論文 参考訳(メタデータ) (2025-09-02T04:32:24Z) - ImagiDrive: A Unified Imagination-and-Planning Framework for Autonomous Driving [64.12414815634847]
ビジョン・ランゲージ・モデル(VLM)とドライビング・ワールド・モデル(DWM)は、この課題のさまざまな側面に対処する強力なレシピとして独立して登場した。
我々は、VLMベースの運転エージェントとDWMベースのシーン想像装置を統合した、新しいエンドツーエンドの自動運転フレームワークであるImagiDriveを提案する。
論文 参考訳(メタデータ) (2025-08-15T12:06:55Z) - AutoVLA: A Vision-Language-Action Model for End-to-End Autonomous Driving with Adaptive Reasoning and Reinforcement Fine-Tuning [37.176428069948535]
Vision-Language-Action(VLA)モデルは、エンドツーエンドの自動運転を約束している。
現在のVLAモデルは、物理的に実現不可能なアクション出力、複雑なモデル構造、あるいは不要に長い推論に苦しむ。
本稿では,単一自己回帰生成モデル内での推論と行動生成を統一する新しいVLAモデルであるAutoVLAを提案する。
論文 参考訳(メタデータ) (2025-06-16T17:58:50Z) - ReCogDrive: A Reinforced Cognitive Framework for End-to-End Autonomous Driving [49.07731497951963]
ReCogDriveは、エンドツーエンドの自動運転のための新しい強化認知フレームワークである。
我々は、人間のドライバーのシーケンシャルな認知過程を模倣する階層的なデータパイプラインを導入する。
次に、VLMの学習した運転先を拡散プランナーに注入することで、言語行動ミスマッチに対処する。
論文 参考訳(メタデータ) (2025-06-09T03:14:04Z) - Predictive Planner for Autonomous Driving with Consistency Models [5.966385886363771]
軌道予測と計画は、自動運転車が動的環境下で安全かつ効率的に走行するために不可欠である。
近年の拡散型生成モデルはマルチエージェント軌道生成において有望であるが,その遅いサンプリングは高周波計画タスクには適さない。
我々は,エゴ車両の航法目標に基づいて,エゴと周辺エージェントの共同分布からサンプルを採取する予測プランナを構築するために,一貫性モデルを活用する。
論文 参考訳(メタデータ) (2025-02-12T00:26:01Z) - DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving [55.53171248839489]
我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesとBench2Driveデータセットで実施された実験は、DiFSDの優れた計画性能と優れた効率を実証している。
論文 参考訳(メタデータ) (2024-09-15T15:55:24Z) - Planning with Adaptive World Models for Autonomous Driving [50.4439896514353]
マルチエージェントインタラクションをキャプチャする実世界のモーションプランニングベンチマークであるnuPlanを提案する。
我々は、グラフ畳み込みニューラルネットワーク(GCNN)であるBehaviorNetを用いて、このようなユニークな振る舞いをモデル化することを学ぶ。
また、モデル予測制御(MPC)ベースのプランナであるAdaptiveDriverについても紹介する。
論文 参考訳(メタデータ) (2024-06-15T18:53:45Z) - PPAD: Iterative Interactions of Prediction and Planning for End-to-end Autonomous Driving [57.89801036693292]
PPAD(Iterative Interaction of Prediction and Planning Autonomous Driving)は、予測と計画のより良い統合を目的とした、タイムステップワイドなインタラクションである。
我々は,階層的動的キーオブジェクトに着目したego-to-agent,ego-to-map,ego-to-BEVインタラクション機構を設計し,インタラクションをモデル化する。
論文 参考訳(メタデータ) (2023-11-14T11:53:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。