論文の概要: Amortizing Trajectory Diffusion with Keyed Drift Fields
- arxiv url: http://arxiv.org/abs/2603.14056v1
- Date: Sat, 14 Mar 2026 17:56:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-21 18:33:56.809587
- Title: Amortizing Trajectory Diffusion with Keyed Drift Fields
- Title(参考訳): キードリフト場による軌道拡散の補正
- Authors: Gokul Puthumanaillam, Melkior Ornik,
- Abstract要約: キード・ドリフト・ポリシーズ (Keyed Drifting Policies) は、ドリフトフィールドの目標で訓練された1ステップの軌道生成装置である。
生成されたトラジェクトリを条件マッチングされたデータセットウィンドウに反映する。
1ステップの推論で高い性能を達成し、拡散サンプリングよりも計画遅延を大幅に低減する。
- 参考スコア(独自算出の注目度): 2.5352713493505785
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion-based trajectory planners can synthesize rich, multimodal action sequences for offline reinforcement learning, but their iterative denoising incurs substantial inference-time cost, making closed-loop planning slow under tight compute budgets. We study the problem of achieving diffusion-like trajectory planning behavior with one-step inference, while retaining the ability to sample diverse candidate plans and condition on the current state in a receding-horizon control loop. Our key observation is that conditional trajectory generation fails under naïve distribution-matching objectives when the similarity measure used to align generated trajectories with the dataset is dominated by unconstrained future dimensions. In practice, this causes attraction toward average trajectories, collapses action diversity, and yields near-static behavior. Our key insight is that conditional generative planning requires a conditioning-aware notion of neighborhood: trajectory updates should be computed using distances in a compact key space that reflects the condition, while still applying updates in the full trajectory space. Building on this, we introduce Keyed Drifting Policies (KDP), a one-step trajectory generator trained with a drift-field objective that attracts generated trajectories toward condition-matched dataset windows and repels them from nearby generated samples, using a stop-gradient drifted target to amortize iterative refinement into training. At inference, the resulting policy produces a full trajectory window in a single forward pass. Across standard RL benchmarks and real-time hardware deployments, KDP achieves strong performance with one-step inference and substantially lower planning latency than diffusion sampling. Project website, code and videos: https://keyed-drifting.github.io/
- Abstract(参考訳): 拡散に基づく軌道プランナは、オフライン強化学習のためにリッチでマルチモーダルなアクションシーケンスを合成することができるが、反復的デノイングは、厳密な計算予算の下でクローズループ計画が遅くなるように、相当な推論時間コストを発生させる。
本研究では, 分岐水平制御ループにおける多種多様な計画や状態のサンプル化能力を維持しつつ, 1ステップの推論で拡散様軌道計画行動を実現することの課題について検討する。
我々のキーとなる観察は、データセットと生成された軌跡を整列するために使用される類似度尺度が制約のない将来の次元に支配されるとき、条件付き軌跡生成はナイーブ分布マッチングの目的の下で失敗するということである。
実際には、これは平均的な軌道へのアトラクションを引き起こし、行動の多様性を崩壊させ、ほぼ静的な振る舞いをもたらす。
我々の重要な洞察は、条件付き生成計画には、条件付き近傍の概念が必要であることである: 軌跡更新は、その条件を反映するコンパクトな鍵空間内の距離を用いて計算されるべきであり、それでも完全な軌跡空間における更新を適用すべきである。
そこで我々は,KDP (Keyed Drifting Policies) を導入した。KDP (Keyed Drifting Policies) は,条件マッチングされたデータセットウィンドウに対して生成したトラジェクトリを誘引し,近隣のサンプルからそれらを再現する1段階の軌道生成装置である。
推論において、結果として得られるポリシーは、単一の前方通過で完全な軌道ウィンドウを生成する。
標準のRLベンチマークとリアルタイムハードウェアデプロイメントの他、KDPは1ステップの推論で性能が向上し、拡散サンプリングよりもプランニングレイテンシが大幅に低い。
プロジェクトウェブサイト、コード、ビデオ:https://keyed-drifting.github.io/
関連論文リスト
- PC-Diffuser: Path-Consistent Capsule CBF Safety Filtering for Diffusion-Based Trajectory Planner [15.914164951048614]
PC-Diffuserは、拡散計画のデノイングループに直接パス一貫性のあるバリア関数構造を組み込む安全強化フレームワークである。
車両形状をよりよく反映するカプセル距離バリア関数を用いて衝突リスクを評価する。
自転車の車体モデルの下で、識別されたウェイポイントを動的に実現可能な運動に変換する。
論文 参考訳(メタデータ) (2026-03-11T01:52:56Z) - Streaming Real-Time Trajectory Prediction Using Endpoint-Aware Modeling [54.94692733670454]
近隣の交通機関の将来の軌道は、自動運転車の経路計画と意思決定に大きな影響を与えている。
本稿では,軽量かつ高精度なストリーミングベース軌道予測手法を提案する。
当社のアプローチは推論遅延を大幅に低減し、現実のデプロイメントに適しています。
論文 参考訳(メタデータ) (2026-03-02T13:44:23Z) - ASTRO: Adaptive Stitching via Dynamics-Guided Trajectory Rollouts [22.46606397400043]
本稿では,データ拡張フレームワークASTROを提案する。
ASTROはまず時間距離の表現を学習し、区別され、到達可能な縫合ターゲットを特定する。
次に、動的誘導型縫合プランナを用い、ロールアウト偏差フィードバックを介して接続動作シーケンスを適応的に生成する。
論文 参考訳(メタデータ) (2025-11-28T18:35:37Z) - CAPE: Context-Aware Diffusion Policy Via Proximal Mode Expansion for Collision Avoidance [15.311155448797386]
近位モード拡張(CAPE)による文脈対応拡散政策
CAPEは、文脈認識の事前と推論時のガイダンスで軌道分布モードを拡張する。
本研究では,多様な操作タスクに対するCAPEの評価を行った。
論文 参考訳(メタデータ) (2025-11-27T21:53:09Z) - ResAD: Normalized Residual Trajectory Modeling for End-to-End Autonomous Driving [64.42138266293202]
ResADは正規化された残留軌道モデリングフレームワークである。
学習タスクを再編成し、慣性参照からの残留偏差を予測する。
NAVSIMベンチマークでは、ResADはバニラ拡散ポリシーを用いて最先端のPDMS 88.6を達成している。
論文 参考訳(メタデータ) (2025-10-09T17:59:36Z) - FlowDrive: moderated flow matching with data balancing for trajectory planning [5.553127690929986]
FlowDriveは、条件付き修正フローを学習し、ノイズを直接トラジェクトリ分布にマッピングするフローマッチングトラジェクトリプランナである。
FlowDriveは、学習ベースのプランナーとルールベースの改善によるアプローチ手法の間で、最先端の結果を達成する。
論文 参考訳(メタデータ) (2025-09-26T06:49:22Z) - Real-Time Sampling-based Online Planning for Drone Interception [18.340019191662957]
本稿では,ニューラルネットワークの推論を利用して,時間を要する非線形軌道最適化を代替するサンプリングベースのオンライン計画アルゴリズムを提案する。
提案手法は、無人機が衝突を回避し、不完全な目標予測を処理しながら、目標を迎撃しなければならないドローン迎撃問題に適用される。
論文 参考訳(メタデータ) (2025-02-20T03:48:38Z) - OPUS: Occupancy Prediction Using a Sparse Set [64.60854562502523]
学習可能なクエリの集合を用いて、占有された場所とクラスを同時に予測するフレームワークを提案する。
OPUSには、モデルパフォーマンスを高めるための非自明な戦略が組み込まれている。
最も軽量なモデルではOcc3D-nuScenesデータセットの2倍 FPS に優れたRayIoUが得られる一方、最も重いモデルは6.1 RayIoUを上回ります。
論文 参考訳(メタデータ) (2024-09-14T07:44:22Z) - Layout Sequence Prediction From Noisy Mobile Modality [53.49649231056857]
軌道予測は、自律運転やロボット工学などの応用における歩行者運動を理解する上で重要な役割を担っている。
現在の軌道予測モデルは、視覚的モダリティからの長い、完全な、正確に観察されたシーケンスに依存する。
本稿では,物体の障害物や視界外を,完全に視認できる軌跡を持つものと同等に扱う新しいアプローチであるLTrajDiffを提案する。
論文 参考訳(メタデータ) (2023-10-09T20:32:49Z) - Manifold Interpolating Optimal-Transport Flows for Trajectory Inference [64.94020639760026]
最適輸送流(MIOFlow)を補間するマニフォールド補間法を提案する。
MIOFlowは、散発的なタイムポイントで撮影された静的スナップショットサンプルから、連続的な人口動態を学習する。
本手法は, 胚体分化および急性骨髄性白血病の治療から得られたscRNA-seqデータとともに, 分岐とマージによるシミュレーションデータについて検討した。
論文 参考訳(メタデータ) (2022-06-29T22:19:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。