論文の概要: FocalPolicy: Frequency-Optimized Chunking and Locally Anchored Flow Matching for Coherent Visuomotor Policy
- arxiv url: http://arxiv.org/abs/2605.15944v2
- Date: Wed, 20 May 2026 06:55:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 14:55:44.208472
- Title: FocalPolicy: Frequency-Optimized Chunking and Locally Anchored Flow Matching for Coherent Visuomotor Policy
- Title(参考訳): FocalPolicy:コヒーレントビズモータ政策のための周波数最適化チャンキングと局所アンチャンドフローマッチング
- Authors: Qian He, Zhenshuo Yang, Wenqi Liang, Chunhui Hao, Nicu Sebe, Jiandong Tian,
- Abstract要約: FocalPolicyは、周波数局所的なチャンキングとAnchoredフローマッチングを組み合わせたビジュモータポリシーである。
本稿では,近位行動における時間領域のアライメントを監督する,近位複合目標を提案する。
フローマッチング学習において,信号の伝搬一貫性を目標とした局所的アンカーサンプリングを設計する。
- 参考スコア(独自算出の注目度): 75.32174422881958
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visuomotor policies aim to learn complex manipulation tasks from expert demonstrations. However, generating smooth and coherent trajectories remains challenging, as it requires balancing proximal precision with distal foresight. Existing approaches typically focus on optimizing intra-chunk action distributions, often neglecting the inter-chunk coherence. Consequently, inter-chunk discontinuities significantly impede the learning of coherent long-horizon actions. To overcome this limitation and achieve a synergetic balance between precision and foresight, we propose FocalPolicy, a foresight-aware visuomotor policy that combines Frequency-Optimized Chunking with Locally Anchored flow matching. We introduce a foresight composite objective that supervises time-domain alignment within the proximal actions while regularizing frequency-domain structure over multiple future action chunks to improve cross-chunk coherence. To efficiently learn complex action distributions, we design locally anchored sampling to enhance target signal propagation efficiency during consistency flow matching training. Extensive experiments demonstrate that FocalPolicy outperforms existing approaches and confirm the generalizability of our modules to other baselines. Project website: https://focalpolicy.github.io/
- Abstract(参考訳): Visuomotor Policyは、専門家によるデモンストレーションから複雑な操作タスクを学ぶことを目的としている。
しかし、近位精度と遠位視差のバランスを取る必要があるため、滑らかでコヒーレントな軌道を生成することは依然として困難である。
既存のアプローチは、通常、チャンク間コヒーレンスを無視して、チャンク内アクション分布の最適化に重点を置いている。
その結果、チャンク間の不連続性はコヒーレントな長距離行動の学習を著しく阻害した。
この制限を克服し、精度と予見の相乗的バランスを達成するために、周波数最適化チャンキングと局所アンコールフローマッチングを組み合わせたフォカルポリシィ(FocalPolicy)を提案する。
近位動作における時間領域アライメントを監督し,複数の動作チャンク上で周波数領域構造を規則化することにより,クロスチャンクのコヒーレンスを改善する。
複雑な動作分布を効率よく学習するために,整合性流整合学習時の目標信号伝搬効率を高めるために,局所的なアンカーサンプリングを設計した。
大規模な実験により、FocalPolicyは既存のアプローチより優れており、モジュールを他のベースラインに一般化可能であることが証明された。
プロジェクトウェブサイト:https://focalpolicy.github.io/
関連論文リスト
- Guided Streaming Stochastic Interpolant Policy [8.673777984856075]
推論時指導は, 再現性のない動的目標に向けて, 生成ロボットのポリシーを操るのに不可欠である。
本研究では,動的非構造型補間器(SI)の最適ガイダンス項を導出する。
このフレームワークをストリーム補間ポリシー(SSIP)によるリアルタイム制御に適用する。
論文 参考訳(メタデータ) (2026-05-11T06:24:21Z) - AnchorRefine: Synergy-Manipulation Based on Trajectory Anchor and Residual Refinement for Vision-Language-Action Models [60.04879435087352]
視覚言語アクション(VLA)ポリシーは、単一の統一空間内でアクションを生成する。
本稿では,VLAの動作モデリングを軌跡アンカーと残留精細化に分解する階層的フレームワークであるAnchorRefineを提案する。
LIBERO、CALVIN、および実ロボットタスクの実験では、AnchorRefineは回帰ベースと拡散ベースの両方のVLAバックボーンを一貫して改善している。
論文 参考訳(メタデータ) (2026-04-20T04:25:24Z) - Chain of Modality: From Static Fusion to Dynamic Orchestration in Omni-MLLMs [84.3271821505699]
カオス・オブ・モダリティ(Chain of Modality, CoM)は、マルチモーダル融合を受動的結合から動的オーケストレーションに移行するエージェントフレームワークである。
CoMはトレーニングフリーまたはデータ効率のSFT設定で動作し、様々なベンチマークで堅牢で一貫した一般化を実現する。
論文 参考訳(メタデータ) (2026-04-16T01:21:14Z) - Rethinking Vector Field Learning for Generative Segmentation [50.08025820235397]
生成的セグメンテーションのためのモデリング拡散モデルが注目されている。
ベクトル場学習の観点から拡散セグメンテーションを再考する。
本稿では,学習した消滅速度場を距離認識補正項で拡張するベクトル場再構成手法を提案する。
この補正は、誘引的相互作用と反発的相互作用の両方を導入し、元の拡散訓練フレームワークを保ちながら、セントロイド付近の勾配等級を増大させる。
論文 参考訳(メタデータ) (2026-03-19T17:58:19Z) - BandPO: Bridging Trust Regions and Ratio Clipping via Probability-Aware Bounds for LLM Reinforcement Learning [49.25750348525603]
BandPOは、信頼領域を動的で確率対応のクリッピング間隔に投影する統一理論演算子であるBandに取って代わる。
BandPOはカノニカルクリッピングやClip-Higherより一貫して優れ,エントロピー崩壊の軽減が図られている。
論文 参考訳(メタデータ) (2026-03-05T08:03:05Z) - Flow Matching for Offline Reinforcement Learning with Discrete Actions [18.806918500759704]
フローマッチングを、複数の目的を持った離散的なアクション空間をサポートする一般的なフレームワークに拡張する。
具体的には,連続フローを連続時間マルコフ連鎖に置き換え,Q重み付きフローマッチングの目的を用いて学習する。
次に,多エージェント設定に設計を拡張し,因子化条件付き経路による共同行動空間の指数的成長を緩和する。
論文 参考訳(メタデータ) (2026-02-05T19:13:44Z) - CoLA-Flow Policy: Temporally Coherent Imitation Learning via Continuous Latent Action Flow Matching for Robotic Manipulation [4.726851899243877]
LG-Flow Policyは、連続的な潜在アクション空間でフローマッチングを実行する軌道レベルの模倣学習フレームワークである。
動作シーケンスを時間的に規則化された潜在軌道に符号化し、明示的な潜在空間の流れを学習することにより、提案手法は低レベル制御ノイズからグローバルな運動構造を分離する。
論文 参考訳(メタデータ) (2026-01-30T15:36:43Z) - Latent Spherical Flow Policy for Reinforcement Learning with Combinatorial Actions [31.697208397735395]
既存のアプローチでは、タスク固有の値関数を制約付き最適化プログラムに組み込むか、決定論的構造化ポリシーを学習し、汎用性とポリシー表現性を犠牲にする。
本稿では, 設計による実現性を確保しつつ, 近代的な生成ポリシーの表現性をRLにもたらす, 解法による球面フローポリシーを提案する。
我々のアプローチは、さまざまな課題RLタスクにおいて、最先端のベースラインを平均20.6%上回る。
論文 参考訳(メタデータ) (2026-01-29T18:49:07Z) - ImplicitRDP: An End-to-End Visual-Force Diffusion Policy with Structural Slow-Fast Learning [52.86018040861575]
本稿では,単一のネットワークに視覚計画と反応力制御を統合した,一貫したエンドツーエンドの視覚力拡散政策を提案する。
本稿では,非同期な視覚と力のトークンを同時に処理するための因果的注意力を利用した構造的スローフォールストラーニングを紹介する。
コンタクトリッチタスクの実験では、ImplicitRDPは視覚のみのベースラインと階層的なベースラインの両方で著しく優れていた。
論文 参考訳(メタデータ) (2025-12-11T18:59:46Z) - Stochastic Path Planning in Correlated Obstacle Fields [1.8184089804625951]
本研究では,不確実な状態の空間的相関障害を有するナビゲーション環境であるSCOS(Correlated Obstacle Scene)問題を紹介する。
我々は,ブロック確率を洗練させるベイズ的信念更新を開発し,その後部を用いて探索空間を効率よく削減する。
このフレームワークは、敵の割り込みやクラスタ化された自然災害のある環境でのナビゲーション上の課題に対処する。
論文 参考訳(メタデータ) (2025-09-23T20:30:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。