論文の概要: OMP: One-step Meanflow Policy with Directional Alignment
- arxiv url: http://arxiv.org/abs/2512.19347v2
- Date: Thu, 29 Jan 2026 14:02:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.467783
- Title: OMP: One-step Meanflow Policy with Directional Alignment
- Title(参考訳): OMP:方向アライメントによる一段階平均フロー政策
- Authors: Han Fang, Yize Huang, Yuheng Zhao, Paul Weng, Xiao Li, Yutong Ban,
- Abstract要約: 高忠実でリアルタイムな操作のために設計されたワンステップ平均フローポリシー(OMP)。
AdroitとMeta-Worldベンチマークの実験では、OMPは成功率と軌道精度において最先端の手法より優れていることが示された。
- 参考スコア(独自算出の注目度): 26.114675928221974
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robot manipulation has increasingly adopted data-driven generative policy frameworks, yet the field faces a persistent trade-off: diffusion models suffer from high inference latency, while flow-based methods often require complex architectural constraints. Although in image generation domain, the MeanFlow paradigm offers a path to single-step inference, its direct application to robotics is impeded by critical theoretical pathologies, specifically spectral bias and gradient starvation in low-velocity regimes. To overcome these limitations, we propose the One-step MeanFlow Policy (OMP), a novel framework designed for high-fidelity, real-time manipulation. We introduce a lightweight directional alignment mechanism to explicitly synchronize predicted velocities with true mean velocities. Furthermore, we implement a Differential Derivation Equation (DDE) to approximate the Jacobian-Vector Product (JVP) operator, which decouples forward and backward passes to significantly reduce memory complexity. Extensive experiments on the Adroit and Meta-World benchmarks demonstrate that OMP outperforms state-of-the-art methods in success rate and trajectory accuracy, particularly in high-precision tasks, while retaining the efficiency of single-step generation.
- Abstract(参考訳): 拡散モデルは高い推論遅延に悩まされる一方、フローベースの手法は複雑なアーキテクチャ制約を必要とすることが多い。
画像生成領域では、MeanFlowパラダイムは単一ステップ推論へのパスを提供するが、ロボット工学への直接的な適用は、特に低速度環境におけるスペクトルバイアスと勾配飢餓による批判的な理論的病理によって妨げられている。
これらの制約を克服するために,高忠実でリアルタイムな操作が可能な新しいフレームワークであるOne-step MeanFlow Policy (OMP)を提案する。
予測速度を真の平均速度と明示的に同期させる軽量な方向アライメント機構を導入する。
さらに,JVP演算子(Jacogen-Vector Product (JVP)演算子)を近似するために微分微分方程式(DDE)を実装した。
AdroitとMeta-Worldベンチマークの大規模な実験は、OMPが単一ステップ生成の効率を維持しながら、特に高精度なタスクにおいて、成功率と軌道精度において最先端の手法より優れていることを示した。
関連論文リスト
- From Flow to One Step: Real-Time Multi-Modal Trajectory Policies via Implicit Maximum Likelihood Estimation-based Distribution Distillation [18.70033095161235]
Indicit Likelihood Estimation (IMLE) を用いて条件付きフローマッチングの専門家を高速な単一ステップの学生に蒸留する枠組みを提案する。
双方向のチャンファー距離は、モードカバレッジと忠実度の両方を促進する設定レベルの目的を提供する。
統合認識エンコーダは、さらに多視点RGB、深度、点雲、プロプレセプションを幾何学的認識表現に統合する。
論文 参考訳(メタデータ) (2026-03-10T09:30:05Z) - Mean Flow Policy with Instantaneous Velocity Constraint for One-step Action Generation [65.13627721310613]
平均速度ポリシー(MVP)は、平均速度場をモデル化し、最速のワンステップアクション生成を実現するための新しい生成ポリシー関数である。
MVPはRoomimicとOGBenchのいくつかの困難なロボット操作タスクに対して、最先端の成功率を達成する。
論文 参考訳(メタデータ) (2026-02-14T14:44:06Z) - FlowConsist: Make Your Flow Consistent with Real Trajectory [99.22869983378062]
現在の高速フロートレーニングパラダイムには,2つの根本的な問題がある,と我々は主張する。
ランダムにペアリングされたノイズデータサンプルから構築された条件付き速度は、系統的な軌跡ドリフトを導入する。
本研究では,高速フローにおける軌道整合性を実現するためのトレーニングフレームワークであるFlowConsistを提案する。
論文 参考訳(メタデータ) (2026-02-06T03:24:23Z) - CoLA-Flow Policy: Temporally Coherent Imitation Learning via Continuous Latent Action Flow Matching for Robotic Manipulation [4.726851899243877]
LG-Flow Policyは、連続的な潜在アクション空間でフローマッチングを実行する軌道レベルの模倣学習フレームワークである。
動作シーケンスを時間的に規則化された潜在軌道に符号化し、明示的な潜在空間の流れを学習することにより、提案手法は低レベル制御ノイズからグローバルな運動構造を分離する。
論文 参考訳(メタデータ) (2026-01-30T15:36:43Z) - Parallel Diffusion Solver via Residual Dirichlet Policy Optimization [88.7827307535107]
拡散モデル(DM)は、最先端の生成性能を達成したが、シーケンシャルなデノナイジング特性のため、高いサンプリング遅延に悩まされている。
既存のソルバベースの加速度法では、低次元の予算で画像品質が著しく低下することが多い。
本研究では,各ステップに複数の勾配並列評価を組み込んだ新しいODE解法であるEnsemble Parallel Directionsolvr(EPD-EPr)を提案する。
論文 参考訳(メタデータ) (2025-12-28T05:48:55Z) - EfficientFlow: Efficient Equivariant Flow Policy Learning for Embodied AI [8.90880897951322]
ジェネレーティブ・モデリングは、ビジュモータ・ポリシー・ラーニング(英語版)において顕著な将来性を示した。
EfficientFlowは、フローベースのポリシー学習を備えた効率的なエンボディAIのための統合されたフレームワークである。
論文 参考訳(メタデータ) (2025-12-01T18:59:59Z) - FUDOKI: Discrete Flow-based Unified Understanding and Generation via Kinetic-Optimal Velocities [76.46448367752944]
MLLM(Multimodal large language model)は、単一のフレームワーク内で視覚的理解と画像生成を統一する言語である。
ほとんどの既存のMLLMはAutore(AR)アーキテクチャに依存しており、将来の開発に固有の制限を課している。
本稿では,離散フローマッチングに基づく統一マルチモーダルモデルであるFUDOKIを紹介する。
論文 参考訳(メタデータ) (2025-05-26T15:46:53Z) - FRMD: Fast Robot Motion Diffusion with Consistency-Distilled Movement Primitives for Smooth Action Generation [3.7351623987275873]
本研究では,スムーズかつ時間的に一貫したロボットの動きを生成するための高速ロボット運動拡散法を提案する。
本手法は,移動プリミティブ(MP)と一貫性モデルを統合し,効率的な単一ステップ軌道生成を実現する。
その結果,FRMDはより高速でスムーズな軌道を発生し,高い成功率を達成できた。
論文 参考訳(メタデータ) (2025-03-03T20:56:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。