論文の概要: Flow Matching-Based Autonomous Driving Planning with Advanced Interactive Behavior Modeling
- arxiv url: http://arxiv.org/abs/2510.11083v1
- Date: Mon, 13 Oct 2025 07:25:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 20:23:38.952891
- Title: Flow Matching-Based Autonomous Driving Planning with Advanced Interactive Behavior Modeling
- Title(参考訳): 高度な対話行動モデリングを用いたフローマッチングに基づく自律走行計画
- Authors: Tianyi Tan, Yinan Zheng, Ruiming Liang, Zexu Wang, Kexin Zheng, Jinliang Zheng, Jianxiong Li, Xianyuan Zhan, Jingjing Liu,
- Abstract要約: 複雑なシナリオにおけるインタラクティブな運転行動のモデリングは、自動運転計画の根本的な課題である。
データモデリング、モデルアーキテクチャ、学習スキームの協調的な革新を通じて、これらの問題に対処するフロープランナを提案する。
Flow Plannerは、複雑な運転シナリオにおけるインタラクティブな振る舞いを効果的にモデル化しながら、学習ベースのアプローチ間で最先端のパフォーマンスを実現する。
- 参考スコア(独自算出の注目度): 26.71028572181775
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modeling interactive driving behaviors in complex scenarios remains a fundamental challenge for autonomous driving planning. Learning-based approaches attempt to address this challenge with advanced generative models, removing the dependency on over-engineered architectures for representation fusion. However, brute-force implementation by simply stacking transformer blocks lacks a dedicated mechanism for modeling interactive behaviors that are common in real driving scenarios. The scarcity of interactive driving data further exacerbates this problem, leaving conventional imitation learning methods ill-equipped to capture high-value interactive behaviors. We propose Flow Planner, which tackles these problems through coordinated innovations in data modeling, model architecture, and learning scheme. Specifically, we first introduce fine-grained trajectory tokenization, which decomposes the trajectory into overlapping segments to decrease the complexity of whole trajectory modeling. With a sophisticatedly designed architecture, we achieve efficient temporal and spatial fusion of planning and scene information, to better capture interactive behaviors. In addition, the framework incorporates flow matching with classifier-free guidance for multi-modal behavior generation, which dynamically reweights agent interactions during inference to maintain coherent response strategies, providing a critical boost for interactive scenario understanding. Experimental results on the large-scale nuPlan dataset and challenging interactive interPlan dataset demonstrate that Flow Planner achieves state-of-the-art performance among learning-based approaches while effectively modeling interactive behaviors in complex driving scenarios.
- Abstract(参考訳): 複雑なシナリオにおけるインタラクティブな運転行動のモデリングは、自動運転計画の根本的な課題である。
学習ベースのアプローチは、この課題に高度な生成モデルで対処し、表現融合のためのオーバーエンジニアリングアーキテクチャへの依存を取り除く。
しかし、変圧器ブロックを積み重ねることによるブルートフォースの実装には、実際の運転シナリオに共通するインタラクティブな振る舞いをモデリングするための専用のメカニズムが欠如している。
対話型駆動データの不足によりこの問題はさらに悪化し、従来の模倣学習手法は高価値な対話的行動を捉えるには不十分である。
データモデリング、モデルアーキテクチャ、学習スキームの協調的な革新を通じて、これらの問題に対処するフロープランナを提案する。
具体的には、まず、細粒度なトラジェクトリトークン化を導入し、トラジェクトリを重なり合うセグメントに分解することで、トラジェクトリモデリング全体の複雑さを低減する。
高度に設計されたアーキテクチャでは、効率的な時間的・空間的なプランニングとシーン情報の融合を実現し、対話的な振る舞いをよりよく捉えます。
さらに,マルチモーダルな振る舞い生成のためのフローマッチングと,フローマッチングを組み込んで,推論中のエージェントの相互作用を動的に重み付け,一貫性のある応答戦略を維持し,対話的なシナリオ理解のための重要な促進を提供する。
大規模なnuPlanデータセットと挑戦的な対話型InterPlanデータセットの実験結果は、Flow Plannerが複雑な運転シナリオにおけるインタラクティブな振る舞いを効果的にモデル化しながら、学習ベースのアプローチ間で最先端のパフォーマンスを達成することを実証している。
関連論文リスト
- Action-Dynamics Modeling and Cross-Temporal Interaction for Online Action Understanding [23.87664450145037]
行動検出と予測を含む行動理解は、多くの実践的応用において重要な役割を担っている。
本研究では,アクション検出と予測タスクの統合と強化を目的とした,ステート・スペクティフィック・モデル(SSM)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-12T16:10:40Z) - HeLoFusion: An Efficient and Scalable Encoder for Modeling Heterogeneous and Multi-Scale Interactions in Trajectory Prediction [11.30785902722196]
HeLoFusionは、異種およびマルチスケールエージェントインタラクションをモデリングするための効率的でスケーラブルなエンコーダである。
本研究は,マルチスケールおよび異種相互作用を明示的にモデル化した局所性グラウンドアーキテクチャが,動き予測を推し進めるための極めて効果的な戦略であることを実証する。
論文 参考訳(メタデータ) (2025-09-15T09:19:41Z) - ILNet: Trajectory Prediction with Inverse Learning Attention for Enhancing Intention Capture [4.190790144182306]
人間のドライバーは、車両を取り巻く意図に関する仮定に基づいて、初期運転決定を動的に調整することが認められている。
Inverse Learning (IL) attentionとDynamic Anchor SelectionDAS (DAS) moduleを用いたマルチエージェント軌道予測手法であるILNetを提案する。
実験の結果,ILNet はInterAction と Argoverse の動作予測データセット上で,最先端の性能を達成していることがわかった。
論文 参考訳(メタデータ) (2025-07-09T04:18:01Z) - Neural Network Reprogrammability: A Unified Theme on Model Reprogramming, Prompt Tuning, and Prompt Instruction [55.914891182214475]
モデル適応のための統一フレームワークとして,ニューラルネットワークの再プログラム可能性を導入する。
本稿では,4つの重要な側面にまたがる情報操作アプローチを分類する分類法を提案する。
残る技術的課題や倫理的考察も分析する。
論文 参考訳(メタデータ) (2025-06-05T05:42:27Z) - Learning Video Generation for Robotic Manipulation with Collaborative Trajectory Control [72.00655365269]
本稿では,協調的軌跡定式化を通じてオブジェクト間ダイナミクスをモデル化する新しいフレームワークであるRoboMasterを紹介する。
オブジェクトを分解する従来の方法とは異なり、我々のコアは、相互作用プロセスを3つのサブステージ(相互作用前、相互作用後、相互作用後)に分解することである。
提案手法は既存の手法よりも優れており,ロボット操作のための軌道制御ビデオ生成における最先端性能を確立している。
論文 参考訳(メタデータ) (2025-06-02T17:57:06Z) - Predictive Planner for Autonomous Driving with Consistency Models [5.966385886363771]
軌道予測と計画は、自動運転車が動的環境下で安全かつ効率的に走行するために不可欠である。
近年の拡散型生成モデルはマルチエージェント軌道生成において有望であるが,その遅いサンプリングは高周波計画タスクには適さない。
我々は,エゴ車両の航法目標に基づいて,エゴと周辺エージェントの共同分布からサンプルを採取する予測プランナを構築するために,一貫性モデルを活用する。
論文 参考訳(メタデータ) (2025-02-12T00:26:01Z) - InterDyn: Controllable Interactive Dynamics with Video Diffusion Models [50.38647583839384]
我々は、初期フレームと駆動対象またはアクターの動作を符号化する制御信号が与えられたインタラクティブな動画像を生成するフレームワークであるInterDynを提案する。
我々の重要な洞察は、大規模なビデオ生成モデルは、大規模ビデオデータからインタラクティブなダイナミクスを学習し、ニューラルと暗黙の物理シミュレーターの両方として機能できるということです。
論文 参考訳(メタデータ) (2024-12-16T13:57:02Z) - DeepInteraction++: Multi-Modality Interaction for Autonomous Driving [80.8837864849534]
我々は,モダリティごとの個別表現を学習し,維持することのできる,新しいモダリティインタラクション戦略を導入する。
DeepInteraction++はマルチモーダルなインタラクション・フレームワークであり、マルチモーダルな表現型インタラクション・エンコーダとマルチモーダルな予測型インタラクション・デコーダを特徴とする。
実験では,3次元物体検出とエンドツーエンドの自律走行の両方において,提案手法の優れた性能を示す。
論文 参考訳(メタデータ) (2024-08-09T14:04:21Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - Amortized Network Intervention to Steer the Excitatory Point Processes [8.15558505134853]
動的グラフ上に発生する励起点過程(すなわちイベントフロー)は、時間と空間を通じて離散事象がどのように広がるかを把握するためのきめ細かいモデルを提供する。
動的グラフ構造を変更してイベントフローを効果的に操縦する方法は、感染症の拡散を抑制する動機となる興味深い問題である。
我々はAmortized Network Interventionsフレームワークを設計し、履歴やその他のコンテキストから最適なポリシーをプールできるようにする。
論文 参考訳(メタデータ) (2023-10-06T11:17:28Z) - VIRT: Improving Representation-based Models for Text Matching through
Virtual Interaction [50.986371459817256]
本稿では,VIRT と呼ばれる新しいtextitVirtual InteRacTion 機構を提案する。
VIRTは、表現ベースのエンコーダに、対話ベースのモデルのように振舞いを模倣する仮想インタラクションを実行するよう要求する。
論文 参考訳(メタデータ) (2021-12-08T09:49:28Z) - Convolutions for Spatial Interaction Modeling [9.408751013132624]
自律走行車周辺におけるアクターの移動予測における空間相互作用モデリングの問題点について考察する。
我々は畳み込みを再検討し,低レイテンシで空間相互作用をモデル化する上で,グラフネットワークと同等のパフォーマンスを実証できることを示した。
論文 参考訳(メタデータ) (2021-04-15T00:41:30Z) - Multi-intersection Traffic Optimisation: A Benchmark Dataset and a
Strong Baseline [85.9210953301628]
交通信号の制御は、都市部の交通渋滞の緩和に必要不可欠である。
問題モデリングの複雑さが高いため、現在の作業の実験的な設定はしばしば矛盾する。
エンコーダ・デコーダ構造を用いた深層強化学習に基づく新規で強力なベースラインモデルを提案する。
論文 参考訳(メタデータ) (2021-01-24T03:55:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。