論文の概要: CAPE: Context-Aware Diffusion Policy Via Proximal Mode Expansion for Collision Avoidance
- arxiv url: http://arxiv.org/abs/2511.22773v1
- Date: Thu, 27 Nov 2025 21:53:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:55.716406
- Title: CAPE: Context-Aware Diffusion Policy Via Proximal Mode Expansion for Collision Avoidance
- Title(参考訳): CAPE:衝突回避のための近位モード拡張のための文脈対応拡散政策
- Authors: Rui Heng Yang, Xuan Zhao, Leo Maxime Brunswic, Montgomery Alban, Mateo Clemente, Tongtong Cao, Jun Jin, Amir Rasouli,
- Abstract要約: 近位モード拡張(CAPE)による文脈対応拡散政策
CAPEは、文脈認識の事前と推論時のガイダンスで軌道分布モードを拡張する。
本研究では,多様な操作タスクに対するCAPEの評価を行った。
- 参考スコア(独自算出の注目度): 15.311155448797386
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In robotics, diffusion models can capture multi-modal trajectories from demonstrations, making them a transformative approach in imitation learning. However, achieving optimal performance following this regiment requires a large-scale dataset, which is costly to obtain, especially for challenging tasks, such as collision avoidance. In those tasks, generalization at test time demands coverage of many obstacles types and their spatial configurations, which are impractical to acquire purely via data. To remedy this problem, we propose Context-Aware diffusion policy via Proximal mode Expansion (CAPE), a framework that expands trajectory distribution modes with context-aware prior and guidance at inference via a novel prior-seeded iterative guided refinement procedure. The framework generates an initial trajectory plan and executes a short prefix trajectory, and then the remaining trajectory segment is perturbed to an intermediate noise level, forming a trajectory prior. Such a prior is context-aware and preserves task intent. Repeating the process with context-aware guided denoising iteratively expands mode support to allow finding smoother, less collision-prone trajectories. For collision avoidance, CAPE expands trajectory distribution modes with collision-aware context, enabling the sampling of collision-free trajectories in previously unseen environments while maintaining goal consistency. We evaluate CAPE on diverse manipulation tasks in cluttered unseen simulated and real-world settings and show up to 26% and 80% higher success rates respectively compared to SOTA methods, demonstrating better generalization to unseen environments.
- Abstract(参考訳): ロボット工学では、拡散モデルはデモから多モード軌道を捉えることができ、模倣学習における変換的アプローチとなる。
しかし、この連隊の最適性能を達成するには大規模なデータセットが必要であり、特に衝突回避のような困難な作業のためにはコストがかかる。
これらのタスクでは、テスト時の一般化は、データを介して純粋に取得できない多くの障害タイプとその空間構成のカバレッジを要求する。
この問題を解決するために,提案するCAPE(Proximal Mode Expansion)によるコンテキスト認識拡散ポリシーを提案する。
フレームワークは、初期軌跡計画を生成し、短いプレフィックス軌跡を実行した後、残りの軌跡セグメントを中間雑音レベルに摂動し、先行軌跡を形成する。
このような事前はコンテキストを認識し、タスクの意図を保存する。
反復的にモードサポートを拡張することで、よりスムーズで、衝突の少ない軌道を見つけることができる。
衝突回避のために、CAPEは衝突を意識した状況で軌道分布モードを拡張し、目標整合性を維持しながら衝突のない軌道のサンプリングを可能にする。
実環境における異種操作タスクにおけるCAPEの評価を行い,SOTA法と比較して26%,80%高い成功率を示した。
関連論文リスト
- Flow Density Control: Generative Optimization Beyond Entropy-Regularized Fine-Tuning [59.11663802446183]
フローおよび拡散生成モデルは、事前情報を保持しながらタスク固有の目的を最適化するために適応することができる。
本研究では,フロー密度制御(FDC)を導入し,複雑な問題をより単純な微調整タスクの特定のシーケンスに還元する。
我々は,近年のミラーフローの理解を活用して,現実的な仮定の下で提案されたスキームの収束保証を導出する。
論文 参考訳(メタデータ) (2025-11-27T17:19:01Z) - Align-Then-stEer: Adapting the Vision-Language Action Models through Unified Latent Guidance [63.33213516925946]
textbfAlign-Then-stEer(textttATE)は,新しいデータ効率,プラグアンドプレイ適応フレームワークである。
我々の研究は、新しいロボットプラットフォームやタスクにVLAモデルをデプロイする実用性を大幅に向上させる、汎用的で軽量なソリューションを提供する。
論文 参考訳(メタデータ) (2025-09-02T07:51:59Z) - TransDiffuser: Diverse Trajectory Generation with Decorrelated Multi-modal Representation for End-to-end Autonomous Driving [20.679370777762987]
エンコーダデコーダに基づく生成軌道計画モデルであるTransDiffuserを提案する。
単純なマルチモーダル表現デコレーションのデノナイジング過程におけるデコレーション最適化機構を利用する。
TransDiffuserは、クローズドループ計画指向ベンチマークNAVSIMで94.85のPDMSを達成する。
論文 参考訳(メタデータ) (2025-05-14T12:10:41Z) - Multi-Agent Path Finding in Continuous Spaces with Projected Diffusion Models [57.45019514036948]
MAPF(Multi-Agent Path Finding)は、ロボット工学における基本的な問題である。
連続空間におけるMAPFの拡散モデルと制約付き最適化を統合する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-12-23T21:27:19Z) - Efficient Data Representation for Motion Forecasting: A Scene-Specific Trajectory Set Approach [12.335528093380631]
本研究では,異なる状況に合わせたシーン固有の軌跡セットを生成するための新しい手法を提案する。
決定論的ゴールサンプリングアルゴリズムは関連する地図領域を同定する一方,再帰的分布サブサンプリング (RIDS) 法はトラジェクトリの妥当性を高める。
Argoverse 2データセットの実験では、運転エリアコンプライアンスの最大10%の改善が達成されている。
論文 参考訳(メタデータ) (2024-07-30T11:06:39Z) - Efficient Text-driven Motion Generation via Latent Consistency Training [21.348658259929053]
非線形逆拡散軌道を解くための動き潜時整合トレーニングフレームワーク(MLCT)を提案する。
これらの拡張を組み合わせることで、非画素モダリティおよび潜在表現空間における安定かつ一貫性のあるトレーニングを実現する。
論文 参考訳(メタデータ) (2024-05-05T02:11:57Z) - Controllable Diverse Sampling for Diffusion Based Motion Behavior
Forecasting [11.106812447960186]
制御可能拡散軌道(CDT)と呼ばれる新しい軌道生成器を導入する。
CDTは、情報と社会的相互作用をトランスフォーマーに基づく条件記述拡散モデルに統合し、将来の軌跡の予測を導く。
マルチモーダル性を確保するため,直進,右折,左折などの軌道モードを指示する行動トークンを組み込んだ。
論文 参考訳(メタデータ) (2024-02-06T13:16:54Z) - Layout Sequence Prediction From Noisy Mobile Modality [53.49649231056857]
軌道予測は、自律運転やロボット工学などの応用における歩行者運動を理解する上で重要な役割を担っている。
現在の軌道予測モデルは、視覚的モダリティからの長い、完全な、正確に観察されたシーケンスに依存する。
本稿では,物体の障害物や視界外を,完全に視認できる軌跡を持つものと同等に扱う新しいアプローチであるLTrajDiffを提案する。
論文 参考訳(メタデータ) (2023-10-09T20:32:49Z) - DeNoising-MOT: Towards Multiple Object Tracking with Severe Occlusions [52.63323657077447]
DNMOTは、複数のオブジェクト追跡のためのエンドツーエンドのトレーニング可能なDeNoising Transformerである。
具体的には、トレーニング中にノイズを伴って軌道を拡大し、エンコーダ・デコーダアーキテクチャのデノイング過程をモデルに学習させる。
我々はMOT17,MOT20,DanceTrackのデータセットについて広範な実験を行い,実験結果から,提案手法が従来の最先端手法よりも明確なマージンで優れていることが示された。
論文 参考訳(メタデータ) (2023-09-09T04:40:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。