論文の概要: Generative Control as Optimization: Time Unconditional Flow Matching for Adaptive and Robust Robotic Control
- arxiv url: http://arxiv.org/abs/2603.17834v1
- Date: Wed, 18 Mar 2026 15:27:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-19 18:32:57.791887
- Title: Generative Control as Optimization: Time Unconditional Flow Matching for Adaptive and Robust Robotic Control
- Title(参考訳): 最適化としての生成制御:適応型とロバストなロボット制御のための時間非条件フローマッチング
- Authors: Zunzhe Zhang, Runhan Huang, Yicheng Liu, Shaoting Zhu, Linzhan Mou, Hang Zhao,
- Abstract要約: 動作合成を反復的最適化に変換する時間非条件フレームワークGeCOについて紹介する。
テスト時間推論は、単純な状態に対して収束開始早期に基づいて計算を割り当てる適応的なプロセスとなり、難しい状態に対してはより長く精製する。
我々は,GeCOを標準シミュレーションベンチマークで検証し,pi0シリーズのVision-Language-Action(VLA)モデルにシームレスなスケーリングを示す。
- 参考スコア(独自算出の注目度): 33.03635235189535
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models and flow matching have become a cornerstone of robotic imitation learning, yet they suffer from a structural inefficiency where inference is often bound to a fixed integration schedule that is agnostic to state complexity. This paradigm forces the policy to expend the same computational budget on trivial motions as it does on complex tasks. We introduce Generative Control as Optimization (GeCO), a time-unconditional framework that transforms action synthesis from trajectory integration into iterative optimization. GeCO learns a stationary velocity field in the action-sequence space where expert behaviors form stable attractors. Consequently, test-time inference becomes an adaptive process that allocates computation based on convergence--exiting early for simple states while refining longer for difficult ones. Furthermore, this stationary geometry yields an intrinsic, training-free safety signal, as the field norm at the optimized action serves as a robust out-of-distribution (OOD) detector, remaining low for in-distribution states while significantly increasing for anomalies. We validate GeCO on standard simulation benchmarks and demonstrate seamless scaling to pi0-series Vision-Language-Action (VLA) models. As a plug-and-play replacement for standard flow-matching heads, GeCO improves success rates and efficiency with an optimization-native mechanism for safe deployment. Video and code can be found at https://hrh6666.github.io/GeCO/
- Abstract(参考訳): 拡散モデルとフローマッチングは、ロボット模倣学習の基盤となっているが、状態複雑性に非依存な固定された統合スケジュールに推論が束縛される構造的非効率性に悩まされている。
このパラダイムは、複雑なタスクで行うような自明な動作で同じ計算予算を浪費するようにポリシーを強制する。
本稿では,ジェネレーティブ・コントロール・アズ・オプティマイゼーション(GeCO)について紹介する。
GeCOは、専門家の行動が安定した誘引子を形成するアクションシーケンス空間における定常速度場を学習する。
その結果、テスト時間推論は、収束に基づく計算を割り当てる適応的なプロセスとなり、単純な状態では早期に出力し、難しい状態ではより長く精製する。
さらに、この定常幾何学は、最適化された動作におけるフィールドノルムが堅牢なアウト・オブ・ディストリビューション(OOD)検出器として機能し、非分布状態では低いが、異常では顕著に増加するため、本質的な、トレーニング不要な安全信号をもたらす。
我々は,GeCOを標準シミュレーションベンチマークで検証し,pi0シリーズのVision-Language-Action(VLA)モデルにシームレスなスケーリングを示す。
標準的なフローマッチングヘッドのプラグアンドプレイ代替として、GeCOは安全なデプロイメントのための最適化ネイティブメカニズムを使用して、成功率と効率を改善している。
ビデオとコードはhttps://hrh6666.github.io/GeCO/で見ることができる。
関連論文リスト
- DyACE: Dynamic Algorithm Co-evolution for Online Automated Heuristic Design with Large Language Model [12.490525543266807]
非定常バイレベル制御問題としてDyACE(Dynamic Co-evolution)を導入する。
DyACEの中核となる要素はLook-Ahead Rollout Searchである。
結果は、DyACEが最先端の静的ベースラインを大幅に上回っていることを示している。
論文 参考訳(メタデータ) (2026-03-07T06:46:53Z) - SIT-LMPC: Safe Information-Theoretic Learning Model Predictive Control for Iterative Tasks [2.661015608942385]
本稿では,反復的なタスクに対する安全な情報理論学習モデル予測制御アルゴリズムを提案する。
最適性のバランスを保ちつつ安全性を確保するために適応ペナルティ法を開発した。
本稿では,SIT-LMPCがシステムの制約を十分に満たしつつ,システム性能を反復的に改善することを示す。
論文 参考訳(メタデータ) (2026-02-18T05:13:45Z) - Merging Beyond: Streaming LLM Updates via Activation-Guided Rotations [55.047454145941366]
Streaming Mergingは、反復最適化プロセスとしてマージを概念化する革新的なモデル更新パラダイムである。
ARMは勾配勾配勾配のダイナミクスを近似するために設計された戦略である。
ARMは初期のSFTチェックポイントしか必要とせず、反復的なマージによって完全に収束したSFTモデルを上回る。
論文 参考訳(メタデータ) (2026-02-03T08:15:57Z) - Not All Preferences Are Created Equal: Stability-Aware and Gradient-Efficient Alignment for Reasoning Models [52.48582333951919]
ポリシー更新の信号対雑音比を最大化することにより、アライメントの信頼性を高めるために設計された動的フレームワークを提案する。
SAGE(Stability-Aware Gradient Efficiency)は、モデル能力に基づいて候補プールをリフレッシュする粗いきめ細かいカリキュラムメカニズムを統合する。
複数の数学的推論ベンチマークの実験により、SAGEは収束を著しく加速し、静的ベースラインを上回っていることが示された。
論文 参考訳(メタデータ) (2026-02-01T12:56:10Z) - Iterative Refinement of Flow Policies in Probability Space for Online Reinforcement Learning [56.47948583452555]
固定ステップのEulerスキームによるフローマッチング推論プロセスの離散化は,最適輸送から変化するJordan-Kinderlehrer-Otto原理と整合する,というキーインサイトに基づいて,SWFP(Stepwise Flow Policy)フレームワークを紹介した。
SWFPは、大域的な流れを、プロキシメート分布間の小さな漸進的な変換の列に分解する。
この分解は、小さな流れブロックのカスケードを介して事前訓練された流れを微調整する効率的なアルゴリズムを導き、大きな利点をもたらす。
論文 参考訳(メタデータ) (2025-10-17T07:43:51Z) - Adaptive Overclocking: Dynamic Control of Thinking Path Length via Real-Time Reasoning Signals [8.264189366042675]
本稿では,ハイパーパラメータ$alpha$ dynamicとコンテキスト認識を実現するAdaptive Overclockingを提案する。
提案手法は,2つの相補的な信号による推論速度をリアルタイムで調整する。
GSM8K, MATH, SVAMPの実験により, HACは高い精度・遅延トレードオフを実現することが示された。
論文 参考訳(メタデータ) (2025-09-21T09:40:27Z) - Fully Spiking Neural Networks for Unified Frame-Event Object Tracking [17.626181371045575]
我々は、SpikeFETと呼ばれる、最初の完全なSpyking Frame-Event Trackingフレームワークを提案する。
このネットワークは、進化的局所特徴抽出とトランスフォーマーに基づくグローバルモデリングをスパイキングパラダイム内で相乗的に統合する。
提案手法は既存の手法よりも優れたトラッキング精度を実現し,消費電力を大幅に削減できることを示す。
論文 参考訳(メタデータ) (2025-05-27T07:53:50Z) - Efficient Transformed Gaussian Process State-Space Models for Non-Stationary High-Dimensional Dynamical Systems [49.819436680336786]
本研究では,高次元非定常力学系のスケーラブルかつ柔軟なモデリングのための効率的な変換ガウス過程状態空間モデル(ETGPSSM)を提案する。
具体的には、ETGPSSMは、単一の共有GPと入力依存の正規化フローを統合し、複雑な非定常遷移ダイナミクスを捉える前に、表現的な暗黙のプロセスを生成する。
ETGPSSMは、計算効率と精度の観点から、既存のGPSSMとニューラルネットワークベースのSSMより優れています。
論文 参考訳(メタデータ) (2025-03-24T03:19:45Z) - Robust Value Iteration for Continuous Control Tasks [99.00362538261972]
シミュレーションから物理システムへ制御ポリシを転送する場合、そのポリシは、動作の変動に対して堅牢でなければならない。
本稿では、動的プログラミングを用いて、コンパクトな状態領域上での最適値関数を計算するRobust Fitted Value Iterationを提案する。
より深い強化学習アルゴリズムや非ロバストなアルゴリズムと比較して、ロバストな値の方が頑健であることを示す。
論文 参考訳(メタデータ) (2021-05-25T19:48:35Z) - Self Normalizing Flows [65.73510214694987]
本稿では,各層における学習された近似逆数により,勾配の高価な項を置き換えることで,フローの正規化を訓練するための柔軟なフレームワークを提案する。
これにより、各レイヤの正確な更新の計算複雑性が$mathcalO(D3)$から$mathcalO(D2)$に削減される。
実験により,これらのモデルは非常に安定であり,正確な勾配値と類似したデータ可能性値に最適化可能であることが示された。
論文 参考訳(メタデータ) (2020-11-14T09:51:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。