論文の概要: KoopmanFlow: Spectrally Decoupled Generative Control Policy via Koopman Structural Bias
- arxiv url: http://arxiv.org/abs/2603.13781v1
- Date: Sat, 14 Mar 2026 06:23:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-21 18:33:56.7865
- Title: KoopmanFlow: Spectrally Decoupled Generative Control Policy via Koopman Structural Bias
- Title(参考訳): KoopmanFlow:Koopman構造バイアスによるスペクトル分離型生成制御ポリシー
- Authors: Chengsi Yao, Ge Wang, Kai Kang, Shenhao Yan, Jiahao Yang, Fan Feng, Honghao Cai, Xianxian Zeng, Rongjun Chen, Yiming Zhao, Yatong Han, Xi Li,
- Abstract要約: Generative Control Policies(GCP)は、ロボット操作において大きな可能性を秘めているが、安定なグローバルモーションと高周波局所補正を同時にモデル化するのに苦労している。
クープマンに着想を得た構造的帰納バイアスによって導かれるパラメータ効率の良い生成ポリシーであるクープマンフローを紹介する。
- 参考スコア(独自算出の注目度): 31.486395926173838
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative Control Policies (GCPs) show immense promise in robotic manipulation but struggle to simultaneously model stable global motions and high-frequency local corrections. While modern architectures extract multi-scale spatial features, their underlying Probability Flow ODEs apply a uniform temporal integration schedule. Compressed to a single step for real-time Receding Horizon Control (RHC), uniform ODE solvers mathematically smooth over sparse, high-frequency transients entangled within low-frequency steady states. To decouple these dynamics without accumulating pipelined errors, we introduce KoopmanFlow, a parameter-efficient generative policy guided by a Koopman-inspired structural inductive bias. Operating in a unified multimodal latent space with visual context, KoopmanFlow bifurcates generation at the terminal stage. Because visual conditioning occurs before spectral decomposition, both branches are visually guided yet temporally specialized. A macroscopic branch anchors slow-varying trajectories via single-step Consistency Training, while a transient branch uses Flow Matching to isolate high-frequency residuals stimulated by sudden visual cues (e.g., contacts or occlusions). Guided by an explicit spectral prior and optimized via a novel asymmetric consistency objective, KoopmanFlow establishes a fused co-training mechanism. This allows the variant branch to absorb localized dynamics without multi-stage error accumulation. Extensive experiments show KoopmanFlow significantly outperforms state-of-the-art baselines in contact-rich tasks requiring agile disturbance rejection. By trading a surplus latency buffer for a richer structural prior, KoopmanFlow achieves superior control fidelity and parameter efficiency within real-time deployment limits.
- Abstract(参考訳): Generative Control Policies(GCP)は、ロボット操作において大きな可能性を秘めているが、安定したグローバルモーションと高周波局所補正を同時にモデル化するのに苦労している。
現代のアーキテクチャは、マルチスケールの空間的特徴を抽出するが、その基盤となる確率フローODEは、一様の時間的統合スケジュールを適用する。
RHC(Receding Horizon Control)の単一ステップに圧縮された一様ODEソルバは、低周波定常状態に絡み合ったスパースで数学的に滑らかである。
パイプラインエラーを蓄積することなくこれらのダイナミクスを分離するために,クープマンに着想を得た構造帰納的バイアスに導かれるパラメータ効率の良い生成ポリシーであるクープマンフローを導入する。
視覚的コンテキストを持つ統一マルチモーダルラテント空間で操作すると、KoopmanFlowは端末ステージで生成する。
視覚条件付けはスペクトル分解の前に起こるため、両枝は視覚的にガイドされるが、時間的に特殊化される。
マクロな枝は、単一ステップの一貫性トレーニングによってゆっくりと変化する軌跡をアンカーし、過渡的な枝はフローマッチングを使用して、突然の視覚的手がかり(例えば、接触や閉塞)によって刺激される高周波残基を分離する。
KoopmanFlowは、新しい非対称整合性目標を通じて、明示的なスペクトルに先行して最適化され、融合したコトレーニング機構を確立する。
これにより、変分枝はマルチステージエラーの蓄積なしに局所化ダイナミクスを吸収することができる。
大規模な実験は、KoopmanFlowがアジャイルの障害拒絶を必要とするコンタクトリッチなタスクにおいて、最先端のベースラインを大幅に上回っていることを示している。
よりリッチな構造的事前のために余剰レイテンシバッファを交換することで、KoopmanFlowは、リアルタイムデプロイメント制限内での制御忠実性とパラメータ効率を向上する。
関連論文リスト
- ProbeFlow: Training-Free Adaptive Flow Matching for Vision-Language-Action Models [12.232846303286161]
近年,フローマッチング (FM) アクションヘッドを搭載したビジョン・ランゲージ・アクション (VLA) モデルは,複雑なロボット操作において最先端の性能を実現する。
現在の加速はビジョン・ランゲージ・モデル(VLM)のバックボーンを最適化しているが、アクションヘッドのボトルネックは見落としている。
本稿では,継続的ロボット制御のためのトレーニング不要適応推論フレームワークProbeFlowを提案する。
論文 参考訳(メタデータ) (2026-03-18T15:38:29Z) - From Flow to One Step: Real-Time Multi-Modal Trajectory Policies via Implicit Maximum Likelihood Estimation-based Distribution Distillation [18.70033095161235]
Indicit Likelihood Estimation (IMLE) を用いて条件付きフローマッチングの専門家を高速な単一ステップの学生に蒸留する枠組みを提案する。
双方向のチャンファー距離は、モードカバレッジと忠実度の両方を促進する設定レベルの目的を提供する。
統合認識エンコーダは、さらに多視点RGB、深度、点雲、プロプレセプションを幾何学的認識表現に統合する。
論文 参考訳(メタデータ) (2026-03-10T09:30:05Z) - Unbiased Gradient Estimation for Event Binning via Functional Backpropagation [64.88399635309918]
バックプロパゲーション中に弱微分を合成することにより任意の双対関数の非バイアス勾配推定のための新しいフレームワークを提案する。
自己監督型光流ではECEが9.4%,SLAMでは5.1%低下し,事象に基づく視覚知覚において大きなメリットが示された。
論文 参考訳(メタデータ) (2026-02-13T04:05:03Z) - Towards Stable and Structured Time Series Generation with Perturbation-Aware Flow Matching [16.17115009663765]
安定かつ構造的に一貫した時系列生成を保証するために、摂動軌道をモデル化するフレームワークである textbfPAFM を導入する。
このフレームワークは摂動誘導訓練を取り入れ、局所的な乱れをシミュレートし、二経路速度場を利用して摂動下での軌道偏差を捉える。
非条件および条件生成タスクの両方の実験において、PAFMは強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2025-11-18T13:30:56Z) - Unfolding Generative Flows with Koopman Operators: Fast and Interpretable Sampling [25.420559502119485]
連続正規化フロー (Continuous Normalizing Flows, CNF) はエレガントな生成モデリングを実現する。
Rectified Flow や OT-CFM といった最近の手法は、直線化軌道によるサンプリングを加速するが、学習されたダイナミクスは非線形ブラックボックスのままである。
我々はクープマン理論を通した大域的線形化フローダイナミクスを提案する。
論文 参考訳(メタデータ) (2025-06-27T15:16:16Z) - FLEX: A Backbone for Diffusion-Based Modeling of Spatio-temporal Physical Systems [51.15230303652732]
FLEX (F Low Expert) は、時間物理系の生成モデリングのためのバックボーンアーキテクチャである。
拡散モデルにおける速度場の分散を低減し、トレーニングの安定化に役立つ。
少数の特徴を2つの逆拡散ステップとして用いて、超解像および予測タスクの正確な予測を行う。
論文 参考訳(メタデータ) (2025-05-23T00:07:59Z) - Nesterov Method for Asynchronous Pipeline Parallel Optimization [59.79227116582264]
パイプライン並列処理における非同期最適化のために,Nesterov Accelerated Gradient (NAG) の変種を導入する。
具体的には、NAGのルックアヘッドステップを変更して、勾配の安定性を効果的に解決する。
我々は、勾配の固定遅延の存在下で、我々のアプローチがサブ線形速度で収束することを理論的に証明する。
論文 参考訳(メタデータ) (2025-05-02T08:23:29Z) - SuperFlow++: Enhanced Spatiotemporal Consistency for Cross-Modal Data Pretraining [62.433137130087445]
SuperFlow++は、連続するカメラペアを使用して事前トレーニングと下流タスクを統合する新しいフレームワークである。
SuperFlow++は様々なタスクや運転条件で最先端のメソッドよりも優れています。
強力な一般化性と計算効率により、SuperFlow++は、自動運転におけるデータ効率の高いLiDARベースの認識のための新しいベンチマークを確立する。
論文 参考訳(メタデータ) (2025-03-25T17:59:57Z) - StreamFlow: Streamlined Multi-Frame Optical Flow Estimation for Video
Sequences [31.210626775505407]
連続するフレーム間のオクルージョンは、長い間、光学的フロー推定において重要な課題を提起してきた。
本稿では,ビデオ入力に適したストリーム・イン・バッチ・マルチフレーム(SIM)パイプラインを提案する。
StreamFlowは、挑戦的なKITTIとSintelデータセットのパフォーマンスだけでなく、排他的領域でも特に改善されている。
論文 参考訳(メタデータ) (2023-11-28T07:53:51Z) - Koopa: Learning Non-stationary Time Series Dynamics with Koopman
Predictors [85.22004745984253]
実世界の時系列は、深い予測モデルにとって大きな課題となる固有の非定常性によって特徴づけられる。
我々は、基礎となる時間変動力学を根本的に考慮する現代のクープマン理論を用いて、非定常時系列に取り組む。
階層的力学を学習する積み重ね可能なブロックからなる新しいクープマン予測器としてクーパを提案する。
論文 参考訳(メタデータ) (2023-05-30T07:40:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。