論文の概要: Physics-informed Diffusion Mamba Transformer for Real-world Driving
- arxiv url: http://arxiv.org/abs/2602.00808v1
- Date: Sat, 31 Jan 2026 16:35:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 05:14:41.974731
- Title: Physics-informed Diffusion Mamba Transformer for Real-world Driving
- Title(参考訳): 物理インフォームド拡散型マンバ変圧器
- Authors: Hang Zhou, Qiang Zhang, Peiran Liu, Yihao Qin, Zhaoxu Yan, Yiding Ji,
- Abstract要約: 本研究では,拡散過程にマンバと注意を埋め込む拡散マンバ変換器アーキテクチャを提案する。
また、エネルギーベースの物理的制約を拡散モデルにシームレスに統合するポート・ハミルトンニューラルネットワークモジュールを設計する。
我々のフレームワークは、予測精度、物理的妥当性、堅牢性において最先端のベースラインを著しく上回る。
- 参考スコア(独自算出の注目度): 10.632911107573841
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous driving systems demand trajectory planners that not only model the inherent uncertainty of future motions but also respect complex temporal dependencies and underlying physical laws. While diffusion-based generative models excel at capturing multi-modal distributions, they often fail to incorporate long-term sequential contexts and domain-specific physical priors. In this work, we bridge these gaps with two key innovations. First, we introduce a Diffusion Mamba Transformer architecture that embeds mamba and attention into the diffusion process, enabling more effective aggregation of sequential input contexts from sensor streams and past motion histories. Second, we design a Port-Hamiltonian Neural Network module that seamlessly integrates energy-based physical constraints into the diffusion model, thereby enhancing trajectory predictions with both consistency and interpretability. Extensive evaluations on standard autonomous driving benchmarks demonstrate that our unified framework significantly outperforms state-of-the-art baselines in predictive accuracy, physical plausibility, and robustness, thereby advancing safe and reliable motion planning.
- Abstract(参考訳): 自律運転システムは、将来の運動の本質的な不確実性をモデル化するだけでなく、複雑な時間的依存や基礎となる物理法則を尊重する軌道プランナーを必要としている。
拡散に基づく生成モデルはマルチモーダル分布の取得に優れるが、長期の逐次的コンテキストとドメイン固有の物理的前提を組み込むことができないことが多い。
この作業では、これらのギャップを2つの重要なイノベーションで埋めます。
まず,マンバと注意を拡散プロセスに埋め込んだ拡散マンバトランスフォーマーアーキテクチャを導入し,センサストリームや過去の動作履歴からの逐次入力コンテキストのより効率的な集約を可能にする。
第2に、エネルギーベースの物理的制約を拡散モデルにシームレスに統合し、一貫性と解釈可能性の両方で軌道予測を向上するポート・ハミルトンニューラルネットワークモジュールを設計する。
標準の自律走行ベンチマークの大規模な評価により、我々の統合されたフレームワークは予測精度、物理的妥当性、堅牢性において最先端のベースラインを著しく上回り、安全かつ信頼性の高い運動計画を実現することが示されている。
関連論文リスト
- Flow marching for a generative PDE foundation model [0.0]
本稿では,物理力学系における誤り蓄積の解析によって動機付けられたフローマッチングを用いて,ニューラル演算子の学習をブリッジするアルゴリズムであるフローマーチングを提案する。
また,物理制約付き変分オートエンコーダ(P2E)を導入し,物理軌道をコンパクトな潜在空間に埋め込む。
異なる12種類のPDEファミリーおよびP2EとFMTのトレインスイートの2.5Mトラジェクトリを複数スケールでキュレートする。
論文 参考訳(メタデータ) (2025-09-23T04:00:41Z) - FlowMo: Variance-Based Flow Guidance for Coherent Motion in Video Generation [51.110607281391154]
FlowMoは、テキスト・ビデオ・モデルにおける動きコヒーレンスを高めるためのトレーニング不要のガイダンス手法である。
時間次元のパッチワイドな分散を測定して動きのコヒーレンスを推定し、サンプリング中にこの分散を動的に減少させるためにモデルを導く。
論文 参考訳(メタデータ) (2025-06-01T19:55:33Z) - Generative Pre-trained Autoregressive Diffusion Transformer [74.25668109048418]
GPDiT(GPDiT)は、自動回帰拡散変換器である。
長距離ビデオ合成における拡散と自己回帰モデリングの強みを統一する。
拡散損失を用いて将来の潜伏フレームを自動回帰予測し、運動力学の自然なモデリングを可能にする。
論文 参考訳(メタデータ) (2025-05-12T08:32:39Z) - Controllable Motion Generation via Diffusion Modal Coupling [19.534234002173314]
マルチモーダルな事前分布を利用して拡散モデルの制御性を向上する新しいフレームワークを提案する。
Maze2D環境におけるデータセットとマルチタスク制御を用いた動作予測手法の評価を行った。
論文 参考訳(メタデータ) (2025-03-04T07:22:34Z) - Characterized Diffusion Networks for Enhanced Autonomous Driving Trajectory Prediction [0.6202955567445396]
本稿では,自律走行のための新しい軌道予測モデルを提案する。
本モデルは,不確実性推定と複雑なエージェント相互作用を組み込むことにより,軌道予測の精度と信頼性を向上させる。
提案モデルでは,実環境における自律走行システムへの応用の可能性を示す。
論文 参考訳(メタデータ) (2024-11-25T15:03:44Z) - ADM: Accelerated Diffusion Model via Estimated Priors for Robust Motion Prediction under Uncertainties [6.865435680843742]
本稿では,騒音に対する抵抗性を高めたエージェントの将来の軌道を積極的に予測する,拡散型・加速可能な新しいフレームワークを提案する。
本手法は,自律走行車に必要な厳格なリアルタイム運転基準を満たす。
Argoverse 1のモーション予測データセット上でのマルチエージェント動作予測において,大幅な改善を実現している。
論文 参考訳(メタデータ) (2024-05-01T18:16:55Z) - CoMusion: Towards Consistent Stochastic Human Motion Prediction via Motion Diffusion [6.862357145175449]
本稿では,単一段階の終端拡散型HMPフレームワークであるCoMusionを提案する。
CoMusionは、スムーズな将来のポーズ予測性能が空間予測性能を改善するという洞察から着想を得ている。
提案手法はTransformer-GCNモジュール設計と分散スケジューラによって促進され,精度,現実性,一貫した動作を予測する。
論文 参考訳(メタデータ) (2023-05-21T19:31:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。