論文の概要: Temporally Decoupled Diffusion Planning for Autonomous Driving
- arxiv url: http://arxiv.org/abs/2603.25462v1
- Date: Thu, 26 Mar 2026 14:04:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.320271
- Title: Temporally Decoupled Diffusion Planning for Autonomous Driving
- Title(参考訳): 自律運転のための時分割拡散計画
- Authors: Xiang Li, Bikun Wang, John Zhang, Jianjun Wang,
- Abstract要約: 動的都市環境における運動計画には、短期的目標と即時安全のバランスが必要である。
本稿では、ノイズ・アズ・マスクのパラダイムを用いて軌道生成を再構成する時間分解拡散モデル(TDDM)を提案する。
トラジェクトリを独立したノイズレベルを持つセグメントに分割することにより、高雑音を情報空白として、弱い雑音を文脈的手がかりとして暗黙的に扱う。
これにより、より保存状態の良い時間的文脈と内部相関を利用して、破損した短期状態にモデルを補うことができる。
- 参考スコア(独自算出の注目度): 6.701508758642954
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Motion planning in dynamic urban environments requires balancing immediate safety with long-term goals. While diffusion models effectively capture multi-modal decision-making, existing approaches treat trajectories as monolithic entities, overlooking heterogeneous temporal dependencies where near-term plans are constrained by instantaneous dynamics and far-term plans by navigational goals. To address this, we propose Temporally Decoupled Diffusion Model (TDDM), which reformulates trajectory generation via a noise-as-mask paradigm. By partitioning trajectories into segments with independent noise levels, we implicitly treat high noise as information voids and weak noise as contextual cues. This compels the model to reconstruct corrupted near-term states by leveraging internal correlations with better-preserved temporal contexts. Architecturally, we introduce a Temporally Decoupled Adaptive Layer Normalization (TD-AdaLN) to inject segment-specific timesteps. During inference, our Asymmetric Temporal Classifier-Free Guidance utilizes weakly noised far-term priors to guide immediate path generation. Evaluations on the nuPlan benchmark show TDDM approaches or exceeds state-of-the-art baselines, particularly excelling in the challenging Test14-hard subset.
- Abstract(参考訳): 動的都市環境における運動計画には、短期的目標と即時安全のバランスが必要である。
拡散モデルがマルチモーダルな意思決定を効果的に捉える一方で、既存のアプローチは軌道をモノリシックな実体として扱う。
これを解決するために,ノイズ・アズ・マスクのパラダイムを用いて軌道生成を再構成するTDDM(Temporally Decoupled Diffusion Model)を提案する。
トラジェクトリを独立したノイズレベルを持つセグメントに分割することにより、高雑音を情報空白として、弱い雑音を文脈的手がかりとして暗黙的に扱う。
これは、より保存状態の良い時間的文脈と内部相関を利用して、腐敗した短期状態を再構築するモデルを補完する。
アーキテクチャ的には、セグメント固有のタイムステップを注入するために、時間的に分離された適応層正規化(TD-AdaLN)を導入する。
推定において,非対称な時間的分類自由誘導法は,雑音の弱い遠方前処理を用いて即時経路生成を誘導する。
nuPlanベンチマークの評価によると、TDDMのアプローチは最先端のベースラインを超えている。
関連論文リスト
- Amortizing Trajectory Diffusion with Keyed Drift Fields [2.5352713493505785]
キード・ドリフト・ポリシーズ (Keyed Drifting Policies) は、ドリフトフィールドの目標で訓練された1ステップの軌道生成装置である。
生成されたトラジェクトリを条件マッチングされたデータセットウィンドウに反映する。
1ステップの推論で高い性能を達成し、拡散サンプリングよりも計画遅延を大幅に低減する。
論文 参考訳(メタデータ) (2026-03-14T17:56:15Z) - Agentic Spatio-Temporal Grounding via Collaborative Reasoning [80.83158605034465]
時間的ビデオグラウンド(Temporal Video Grounding)は、テキストクエリが与えられたビデオ内の対象物または人の時間的チューブを検索することを目的としている。
本稿では,STVGの課題に対して,オープンワールドおよびトレーニングフリーシナリオに向けたエージェント時空間グラウンド(ASTG)フレームワークを提案する。
具体的には、現代多言語モデル(MLLM)を活用した2つの特殊エージェントSRA(Spatial Reasoning Agent)とTRA(Temporal Reasoning Agent)である。
人気のあるベンチマークの実験は、既存の弱教師付きおよびゼロショットアプローチをマージンで上回る提案手法の優位性を実証している。
論文 参考訳(メタデータ) (2026-02-10T10:16:27Z) - Adaptive Linear Path Model-Based Diffusion [52.84663832658799]
リニアパスモデルベース拡散(LP-MBD)を導入し、分散保存スケジュールをフローマッチング線形確率パスに置き換える。
また,適応型LP-MBD(ALP-MBD)を提案し,タスクの複雑さや環境条件に応じて拡散ステップやノイズレベルを調整する。
論文 参考訳(メタデータ) (2026-02-02T21:33:03Z) - Learning Multi-Modal Mobility Dynamics for Generalized Next Location Recommendation [51.00494428978262]
位置推薦タスクの移動力学を特徴付けるために,マルチモーダルな時空間知識を利用する。
まず、マルチモーダル表現のための統合時空間関係グラフ(STRG)を構築する。
第二に、異なるモーダルの空間時間グラフ表現を融合するゲーティング機構を設計する。
論文 参考訳(メタデータ) (2025-12-27T14:23:04Z) - Towards Stable and Structured Time Series Generation with Perturbation-Aware Flow Matching [16.17115009663765]
安定かつ構造的に一貫した時系列生成を保証するために、摂動軌道をモデル化するフレームワークである textbfPAFM を導入する。
このフレームワークは摂動誘導訓練を取り入れ、局所的な乱れをシミュレートし、二経路速度場を利用して摂動下での軌道偏差を捉える。
非条件および条件生成タスクの両方の実験において、PAFMは強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2025-11-18T13:30:56Z) - RainDiff: End-to-end Precipitation Nowcasting Via Token-wise Attention Diffusion [64.49056527678606]
本稿では,U-Net拡散モデルだけでなく,レーダ時間エンコーダにも統合されたトークンワイドアテンションを提案する。
従来の手法とは異なり,本手法は,画素空間拡散の典型的な高資源コストを発生させることなく,アーキテクチャに注意を集中させる。
実験と評価により,提案手法は複雑な降水予測シナリオにおいて,最先端の手法,ロバストネスの局所的忠実度,一般化,優位性を著しく上回ることを示した。
論文 参考訳(メタデータ) (2025-10-16T17:59:13Z) - Predictive Planner for Autonomous Driving with Consistency Models [5.966385886363771]
軌道予測と計画は、自動運転車が動的環境下で安全かつ効率的に走行するために不可欠である。
近年の拡散型生成モデルはマルチエージェント軌道生成において有望であるが,その遅いサンプリングは高周波計画タスクには適さない。
我々は,エゴ車両の航法目標に基づいて,エゴと周辺エージェントの共同分布からサンプルを採取する予測プランナを構築するために,一貫性モデルを活用する。
論文 参考訳(メタデータ) (2025-02-12T00:26:01Z) - OED: Towards One-stage End-to-End Dynamic Scene Graph Generation [18.374354844446962]
ダイナミックシーングラフ生成(DSGG)は、ビデオの空間時間領域内の視覚的関係を特定することに焦点を当てている。
本稿では,DSGGパイプラインを合理化する一段階のエンドツーエンドフレームワークOEDを提案する。
このフレームワークは、設定された予測問題としてタスクを再構成し、ペアワイズ機能を活用してシーングラフ内の各対象物対を表現する。
論文 参考訳(メタデータ) (2024-05-27T08:18:41Z) - Supporting Optimal Phase Space Reconstructions Using Neural Network
Architecture for Time Series Modeling [68.8204255655161]
位相空間特性を暗黙的に学習する機構を持つ人工ニューラルネットワークを提案する。
私たちのアプローチは、ほとんどの最先端戦略と同じくらいの競争力があるか、あるいは優れているかのどちらかです。
論文 参考訳(メタデータ) (2020-06-19T21:04:47Z) - Spatial-Temporal Transformer Networks for Traffic Flow Forecasting [74.76852538940746]
本稿では,長期交通予測の精度を向上させるため,時空間変圧器ネットワーク(STTN)の新たなパラダイムを提案する。
具体的には、有向空間依存を動的にモデル化することにより、空間変換器と呼ばれる新しいグラフニューラルネットワークを提案する。
提案モデルにより,長期間にわたる空間的依存関係に対する高速かつスケーラブルなトレーニングが可能になる。
論文 参考訳(メタデータ) (2020-01-09T10:21:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。