論文の概要: WAM-Flow: Parallel Coarse-to-Fine Motion Planning via Discrete Flow Matching for Autonomous Driving
- arxiv url: http://arxiv.org/abs/2512.06112v2
- Date: Thu, 11 Dec 2025 16:06:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-12 14:11:15.096857
- Title: WAM-Flow: Parallel Coarse-to-Fine Motion Planning via Discrete Flow Matching for Autonomous Driving
- Title(参考訳): WAM-Flow:離散フローマッチングによる自律走行による並列粗動運動計画
- Authors: Yifang Xu, Jiahao Cui, Feipeng Cai, Zhihao Zhu, Hanlin Shang, Shan Luan, Mingwang Xu, Neng Zhang, Yaoyi Li, Jia Cai, Siyu Zhu,
- Abstract要約: 本稿では,VLAモデルであるWAM-Flowを紹介し,Ego-trajectory Planningをトークン空間上の離散フローマッチングとして利用する。
WAM-Flowは完全に並列で双方向のデノゲーションを実行し、調整可能な計算精度トレードオフによる粗い微細化を可能にする。
これらの結果は、エンド・ツー・エンド・エンドの自律運転に期待できる新しいパラダイムとして離散フローマッチングが確立される。
- 参考スコア(独自算出の注目度): 9.719456684859606
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce WAM-Flow, a vision-language-action (VLA) model that casts ego-trajectory planning as discrete flow matching over a structured token space. In contrast to autoregressive decoders, WAM-Flow performs fully parallel, bidirectional denoising, enabling coarse-to-fine refinement with a tunable compute-accuracy trade-off. Specifically, the approach combines a metric-aligned numerical tokenizer that preserves scalar geometry via triplet-margin learning, a geometry-aware flow objective and a simulator-guided GRPO alignment that integrates safety, ego progress, and comfort rewards while retaining parallel generation. A multi-stage adaptation converts a pre-trained auto-regressive backbone (Janus-1.5B) from causal decoding to non-causal flow model and strengthens road-scene competence through continued multimodal pretraining. Thanks to the inherent nature of consistency model training and parallel decoding inference, WAM-Flow achieves superior closed-loop performance against autoregressive and diffusion-based VLA baselines, with 1-step inference attaining 89.1 PDMS and 5-step inference reaching 90.3 PDMS on NAVSIM v1 benchmark. These results establish discrete flow matching as a new promising paradigm for end-to-end autonomous driving. The code will be publicly available soon.
- Abstract(参考訳): WAM-Flowは,Ego-trajectory Planningを,構造化トークン空間上の離散フローマッチングとして活用する,視覚言語アクション(VLA)モデルである。
自己回帰デコーダとは対照的に、WAM-Flowは完全に並列で双方向の復調を行い、調整可能な計算精度トレードオフによる粗い微細化を可能にする。
具体的には、三重対学習によるスカラー幾何を保存する計量整列式数値トークンーザ、幾何認識フロー目標と、並列生成を維持しながら安全性、エゴの進行、快適な報酬を統合するシミュレータ誘導GRPOアライメントを組み合わせる。
多段階適応は、事前学習された自己回帰バックボーン(Janus-1.5B)を因果デコードから非因果フローモデルに変換し、連続したマルチモーダル事前学習を通じて路面能力を強化する。
WAM-Flowは、一貫性モデルのトレーニングと並列デコード推論の性質により、自動回帰と拡散に基づくVLAベースラインに対して優れたクローズループ性能を実現し、1ステップの推論は89.1 PDMSに達し、5ステップの推論はNAVSIM v1ベンチマークで90.3 PDMSに達した。
これらの結果は、エンド・ツー・エンド・エンドの自律運転に期待できる新しいパラダイムとして離散フローマッチングが確立される。
コードはまもなく公開される予定だ。
関連論文リスト
- GuideFlow: Constraint-Guided Flow Matching for Planning in End-to-End Autonomous Driving [22.92109402334754]
運転計画は、エンドツーエンド(E2E)自動運転の重要な要素である。
textittextbfGuideFlowは、本質的にモード崩壊を緩和するフローマッチングプロセスを明示的にモデル化する。
textittextbfGuideFlowは、生成中の制御信号としてアグレッシブな動作をパラメータ化することで、トラジェクトリスタイルの正確な操作を可能にする。
論文 参考訳(メタデータ) (2025-11-24T03:45:32Z) - Optimal Control Meets Flow Matching: A Principled Route to Multi-Subject Fidelity [35.95129874095729]
テキスト・トゥ・イメージ(T2I)モデルは単一エンタリティ・プロンプトに優れるが、多目的記述に苦慮する。
マルチオブジェクト忠実度に向けてサンプリングダイナミクスを操るための原理的最適化可能な目的を持った最初の理論的枠組みを導入する。
論文 参考訳(メタデータ) (2025-10-02T17:59:58Z) - Rethinking Unsupervised Cross-modal Flow Estimation: Learning from Decoupled Optimization and Consistency Constraint [20.46870753632375]
DCFlowは、教師なしのクロスモーダルフロー推定フレームワークである。
本稿では,タスク固有の監督機能を備えた非結合最適化戦略を導入し,モダリティの相違と幾何学的相違を明確に解消する。
評価のために、パブリックデータセットを再取得することで、包括的なクロスモーダルフローベンチマークを構築する。
論文 参考訳(メタデータ) (2025-09-29T08:10:41Z) - Accelerating Diffusion LLMs via Adaptive Parallel Decoding [60.407727995313074]
並列にサンプリングされたトークンの数を動的に調整する新しい手法であるアダプティブ並列復号法(APD)を導入する。
APDは、ダウンストリームベンチマークで最小限の品質劣化を伴って、非常に高いスループットを提供する。
論文 参考訳(メタデータ) (2025-05-31T06:10:10Z) - Balancing Computation Load and Representation Expressivity in Parallel Hybrid Neural Networks [5.877451898618022]
FlowHNは、ロードバランシングのさまざまな戦略に対応する、新しい並列ハイブリッドネットワークアーキテクチャである。
FlowHNの2つの革新的な差別化要因は、注意とSSMブランチの間で分割されたFLOP認識動的トークンである。
論文 参考訳(メタデータ) (2025-05-26T03:52:22Z) - FlowTS: Time Series Generation via Rectified Flow [67.41208519939626]
FlowTSは、確率空間における直線輸送を伴う整流フローを利用するODEベースのモデルである。
非条件設定では、FlowTSは最先端のパフォーマンスを達成し、コンテキストFIDスコアはStockとETThデータセットで0.019と0.011である。
条件設定では、太陽予測において優れた性能を達成している。
論文 参考訳(メタデータ) (2024-11-12T03:03:23Z) - Manifold Interpolating Optimal-Transport Flows for Trajectory Inference [64.94020639760026]
最適輸送流(MIOFlow)を補間するマニフォールド補間法を提案する。
MIOFlowは、散発的なタイムポイントで撮影された静的スナップショットサンプルから、連続的な人口動態を学習する。
本手法は, 胚体分化および急性骨髄性白血病の治療から得られたscRNA-seqデータとともに, 分岐とマージによるシミュレーションデータについて検討した。
論文 参考訳(メタデータ) (2022-06-29T22:19:03Z) - Prediction of Traffic Flow via Connected Vehicles [77.11902188162458]
本稿では,交通機関が交通の流れを早期に制御し,渋滞を防止するための短期交通流予測フレームワークを提案する。
我々は,過去の流れデータと,コネクテッド・ビークル(CV)技術によって提供されるリアルタイムフィードや軌道データといった革新的な特徴に基づいて,将来の道路セグメントにおける流れを予測する。
本手法は, 流れの予測, CVが軌道に沿ったセグメントに現実的に遭遇する様々な事象の影響を組み込むことによって, 高度なモデリングを可能にすることを示す。
論文 参考訳(メタデータ) (2020-07-10T16:00:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。