論文の概要: Fast and Robust Visuomotor Riemannian Flow Matching Policy
- arxiv url: http://arxiv.org/abs/2412.10855v1
- Date: Sat, 14 Dec 2024 15:03:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-17 13:54:42.643236
- Title: Fast and Robust Visuomotor Riemannian Flow Matching Policy
- Title(参考訳): 高速かつロバストなVisuomotor Riemannian Flow Matching Policy
- Authors: Haoran Ding, Noémie Jaquier, Jan Peters, Leonel Rozo,
- Abstract要約: 拡散に基づくビジュモータポリシーは、複雑なロボットタスクの学習に長けている。
RFMPは、フローマッチングの容易なトレーニングと高速な推論機能を継承するモデルである。
- 参考スコア(独自算出の注目度): 15.341017260123927
- License:
- Abstract: Diffusion-based visuomotor policies excel at learning complex robotic tasks by effectively combining visual data with high-dimensional, multi-modal action distributions. However, diffusion models often suffer from slow inference due to costly denoising processes or require complex sequential training arising from recent distilling approaches. This paper introduces Riemannian Flow Matching Policy (RFMP), a model that inherits the easy training and fast inference capabilities of flow matching (FM). Moreover, RFMP inherently incorporates geometric constraints commonly found in realistic robotic applications, as the robot state resides on a Riemannian manifold. To enhance the robustness of RFMP, we propose Stable RFMP (SRFMP), which leverages LaSalle's invariance principle to equip the dynamics of FM with stability to the support of a target Riemannian distribution. Rigorous evaluation on eight simulated and real-world tasks show that RFMP successfully learns and synthesizes complex sensorimotor policies on Euclidean and Riemannian spaces with efficient training and inference phases, outperforming Diffusion Policies while remaining competitive with Consistency Policies.
- Abstract(参考訳): 拡散に基づくビジュモータポリシーは、視覚データと高次元多モード動作分布を効果的に組み合わせることで、複雑なロボットタスクの学習に優れる。
しかし, 拡散モデルでは, コストのかかるデノナイズプロセスによる推論が遅いことや, 最近の蒸留手法による複雑なシーケンシャルトレーニングが要求される場合が多い。
本稿では,フローマッチング(FM)の容易なトレーニングと高速推論機能を継承するモデルであるRiemannian Flow Matching Policy(RFMP)を紹介する。
さらにRFMPは、ロボット状態がリーマン多様体上に存在するため、現実的なロボット応用でよく見られる幾何学的制約を本質的に含んでいる。
RFMPのロバスト性を高めるために,LaSalleの不変原理を利用した安定RFMP(SRFMP)を提案する。
8つのシミュレートされた実世界のタスクの厳密な評価は、RFMPがユークリッド空間とリーマン空間の複雑なセンセーモレータポリシーを、効率的なトレーニングと推論フェーズで学習し、合成し、一貫性ポリシーと競合しながら拡散ポリシーより優れていることを示している。
関連論文リスト
- Simultaneous Multi-Robot Motion Planning with Projected Diffusion Models [57.45019514036948]
MRMP拡散(SMD)は、制約付き最適化を拡散サンプリングプロセスに統合し、運動学的に実現可能な軌道を生成する新しい手法である。
本稿では, ロボット密度, 障害物の複雑度, 動作制約の異なるシナリオ間の軌道計画アルゴリズムを評価するための総合的MRMPベンチマークを提案する。
論文 参考訳(メタデータ) (2025-02-05T20:51:28Z) - Composite Gaussian Processes Flows for Learning Discontinuous Multimodal Policies [11.729903146557866]
複合ガウスプロセスフロー(英: Composite Gaussian Processes Flows, CGP-Flows)は、ロボット政策のための新しい半パラメトリックモデルである。
CGP-フローは、ガウス過程(OMGPs)と連続正規化流れ(CNFs)の重なり合う混合体を統合する
シミュレーションと実世界のロボットタスクの両方で実施された実験は、CGPフローが制御ポリシーをモデル化する際の性能を著しく向上することを示した。
論文 参考訳(メタデータ) (2025-02-04T01:05:18Z) - Multi-Agent Path Finding in Continuous Spaces with Projected Diffusion Models [57.45019514036948]
MAPF(Multi-Agent Path Finding)は、ロボット工学における基本的な問題である。
連続空間におけるMAPFの拡散モデルと制約付き最適化を統合する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-12-23T21:27:19Z) - Riemannian Flow Matching Policy for Robot Motion Learning [5.724027955589408]
本稿では,ロボットビジュモータポリシーの学習と合成のための新しいモデルを提案する。
RFMPはよりスムーズな行動軌跡を提供し,推論時間を大幅に短縮することを示した。
論文 参考訳(メタデータ) (2024-03-15T20:48:41Z) - Robust and Communication-Efficient Federated Domain Adaptation via Random Features [9.561648314302232]
フェデレートされたドメイン適応(FDA)は、この課題に対処するための強力なアプローチとして現れます。
RF-TCAは、理論的および経験的性能を損なうことなく計算を著しく高速化する標準転送成分分析手法の拡張である。
我々は,FedRF-TCAの優れた性能とロバスト性(ネットワーク状態への)を示す広範囲な実験を行った。
論文 参考訳(メタデータ) (2023-11-08T13:46:58Z) - Leveraging Low-Rank and Sparse Recurrent Connectivity for Robust
Closed-Loop Control [63.310780486820796]
繰り返し接続のパラメータ化が閉ループ設定のロバスト性にどのように影響するかを示す。
パラメータが少ないクローズドフォーム連続時間ニューラルネットワーク(CfCs)は、フルランクで完全に接続されたニューラルネットワークよりも優れています。
論文 参考訳(メタデータ) (2023-10-05T21:44:18Z) - Distributionally Robust Model-based Reinforcement Learning with Large
State Spaces [55.14361269378122]
強化学習における3つの大きな課題は、大きな状態空間を持つ複雑な力学系、コストのかかるデータ取得プロセス、トレーニング環境の展開から現実の力学を逸脱させることである。
広範に用いられているKullback-Leibler, chi-square, および全変分不確実性集合の下で, 連続状態空間を持つ分布ロバストなマルコフ決定過程について検討した。
本稿では,ガウス過程と最大分散削減アルゴリズムを用いて,多出力名目遷移力学を効率的に学習するモデルベースアプローチを提案する。
論文 参考訳(メタデータ) (2023-09-05T13:42:11Z) - Improving and generalizing flow-based generative models with minibatch
optimal transport [90.01613198337833]
連続正規化フロー(CNF)のための一般条件流整合(CFM)技術を導入する。
CFMは、拡散モデルのフローをトレーニングするために使用されるような安定した回帰目標を特徴としているが、決定論的フローモデルの効率的な推論を好んでいる。
我々の目的の変種は最適輸送CFM (OT-CFM) であり、訓練がより安定し、より高速な推論をもたらすより単純なフローを生成する。
論文 参考訳(メタデータ) (2023-02-01T14:47:17Z) - Real-time simulation of parameter-dependent fluid flows through deep
learning-based reduced order models [0.2538209532048866]
還元次数モデル (ROM) はパラメータ依存の流体力学問題を高速に近似する。
ディープラーニング(DL)ベースのROMは、非線形トライアル多様体と還元力学の両方を非侵襲的に学習することで、これらの制限をすべて克服する。
得られたPOD-DL-ROMは、シリンダーベンチマークの周囲の流れ、固定された剛性ブロックに付着した弾性ビームとラミナー非圧縮性フローとの流体構造相互作用、大脳動脈瘤内の血流のほぼリアルタイムに正確な結果をもたらすことが示されている。
論文 参考訳(メタデータ) (2021-06-10T13:07:33Z) - Imitation Learning for Robust and Safe Real-time Motion Planning: A
Contraction Theory Approach [9.35511513240868]
LAG-ROSは、境界外乱によって乱される安全臨界非線形システムのリアルタイムロバストな動作計画アルゴリズムである。
LAG-ROSはリアルタイム計算のためのより速い実行の速度のより高い制御性能そしてタスクの成功率を達成します。
論文 参考訳(メタデータ) (2021-02-25T03:47:15Z) - Efficient semidefinite-programming-based inference for binary and
multi-class MRFs [83.09715052229782]
分割関数やMAP推定をペアワイズMRFで効率的に計算する手法を提案する。
一般のバイナリMRFから完全多クラス設定への半定緩和を拡張し、解法を用いて再び効率的に解けるようなコンパクトな半定緩和を開発する。
論文 参考訳(メタデータ) (2020-12-04T15:36:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。