論文の概要: Smoother Action Chunking Flow Policy via Prior-Corrected Orthogonal Trust-Region Guidance
- arxiv url: http://arxiv.org/abs/2605.24433v1
- Date: Sat, 23 May 2026 06:59:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.054968
- Title: Smoother Action Chunking Flow Policy via Prior-Corrected Orthogonal Trust-Region Guidance
- Title(参考訳): 矯正直交信頼指導による平滑な行動チャンキングフロー政策
- Authors: Kai Fang, Hailong Pei, Xuemin Chi,
- Abstract要約: フローマッチングロボットポリシーは、効率的なクローズドループ制御にアクションチャンキング推論を用いるのが一般的である。
本稿では,POTR, a **p*rior-corrected **o*rthogonal **t*rust-*r**egion guidance法を提案する。
- 参考スコア(独自算出の注目度): 2.816680325180659
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Flow-matching robot policies commonly use action-chunking inference for efficient closed-loop control, but chunk boundaries can introduce discontinuous action transitions. Existing RTC guidance improves continuity by injecting correction signals during denoising, yet its weight schedule is weak at intermediate timesteps and its unconstrained correction direction may introduce transverse perturbations. We propose POTR, a **p**rior-corrected **o**rthogonal **t**rust-**r**egion guidance method. First, we incorporate a data-prior scale $σ_d$ into the RTC guidance weight, yielding stronger intermediate-time correction. Second, we decompose the guidance vector into components parallel and perpendicular to the denoising velocity, and constrain the perpendicular component within a trust region. On LIBERO with $π_{0.5}$, POTR improves success rate and consistently reduces chunk-boundary discontinuity, acceleration, and jerk compared with RTC. Ablations show that the prior-corrected weight provides the main correction gain, while the orthogonal trust region further improves stability.
- Abstract(参考訳): フローマッチングロボットポリシーは、効率的なクローズドループ制御にアクションチャンキング推論を用いることが多いが、チャンク境界は不連続な動作遷移をもたらす可能性がある。
既存のRTC誘導は、デノナイジング時に補正信号を注入することで継続性を改善するが、その重量スケジュールは中間時間で弱く、制約のない補正方向は横方向の摂動をもたらす可能性がある。
本稿では,POTR, a **p*rior-corrected **o*rthogonal **t*rust-*r**egion guidance法を提案する。
まず、データ優先スケールの$σ_d$をRTC誘導重みに組み込み、より強い中間時間補正を実現する。
第2に、誘導ベクトルを復調速度に平行かつ垂直な成分に分解し、信頼領域内の垂直成分を制約する。
π_{0.5}$ の LIBERO では、POTR は成功率を改善し、RTC と比較してチャンク境界の不連続性、加速度、およびジャークを一貫して減少させる。
アブレーションは、事前補正された重みが主補正利得を与える一方で、直交信頼領域は安定性をさらに向上することを示している。
関連論文リスト
- AcroRL: Learning Aggressive Quadrotor Inversion using Bidirectional Thrust [1.7394635819080972]
双方向推力は2番目の平衡条件を与え、制御権限を増大させる。
従来の幾何学的制御手法は、双方向スラストをサポートするためにホップフィブレーションに基づく姿勢表現を通じて微分平坦性を拡張する。
本研究では,一定の基準軌道を変調して,コンパクトで位置制約のある四元数逆変換を行う学習ベースフレームワークを提案する。
論文 参考訳(メタデータ) (2026-05-23T00:02:22Z) - Regularized Centered Emphatic Temporal Difference Learning [14.415762410365106]
関数近似を用いたオフ政治時間差学習(TD)は、安定性、投影幾何学、分散制御の間の構造的トレードオフに直面している。
強調的TD(ETD)は、追従的強調により、非政治的な射影幾何学を改善するが、追従的トレースは高いばらつきを持つ。
本稿では,後続トレースを保存し,補助中心再帰のみを正規化する,強調時間差学習(RETD)を提案する。
論文 参考訳(メタデータ) (2026-05-02T10:32:24Z) - K-GMRF: Kinetic Gauss-Markov Random Field for First-Principles Covariance Tracking on Lie Groups [8.489406212619164]
共分散追跡のためのオンライン学習自由フレームワークK-GMRFを提案する。
本手法は, 構造保存型シンプレクティックインテグレータにより伝搬される潜在角速度を駆動するトルクとして観測を解釈する。
理論的には、この2階の力学が一定回転下でゼロ定常誤差を達成することを証明している。
論文 参考訳(メタデータ) (2026-03-20T03:16:36Z) - Diffusion Controller: Framework, Algorithms and Parameterization [54.82539154511621]
本稿では,逆拡散サンプリングを(一般化された)線形解法マルコフ決定過程における状態のみの制御として活用する統一的な制御理論的視点を提案する。
このフレームワークでは、制御はトレーニング済みのリバースタイムのトランジションカーネルを再重み付けし、端末の目的と$f$分割コストのバランスをとる。
安定拡散v1.4の実験では、選好調整の勝利率が一貫した上昇を示し、品質効率のトレードオフを改善した。
論文 参考訳(メタデータ) (2026-03-07T01:49:59Z) - FAST-DIPS: Adjoint-Free Analytic Steps and Hard-Constrained Likelihood Correction for Diffusion-Prior Inverse Problems [2.9506605740700107]
トレーニングなし拡散の先行は、しばしば、繰り返し導関数や、保守的なステップサイズを持つ内部最適化/MCMCループに依存する。
本研究では、これらの内部ループをハードな測定空間実現可能性制約で置き換える訓練不要な解法を提案する。
実験はPSNR/SSIM/LPIPSと最大19.5$times$のスピードアップで、手書きのアジョイントや内部MCMCを使わずに、競争力のあるPSNR/SSIM/LPIPSを実現する。
論文 参考訳(メタデータ) (2026-03-02T08:17:26Z) - Stability and Generalization of Push-Sum Based Decentralized Optimization over Directed Graphs [55.77845440440496]
プッシュベースの分散通信は、情報交換が非対称である可能性のある通信ネットワークの最適化を可能にする。
我々は、グラディエント・プッシュ(SGP)アルゴリズムのための統一的な一様安定性フレームワークを開発する。
重要な技術的要素は、2つの量に束縛された不均衡認識の一般化である。
論文 参考訳(メタデータ) (2026-02-24T05:32:03Z) - Mitigating Staleness in Asynchronous Pipeline Parallelism via Basis Rotation [6.710608163117798]
非同期パイプライン並列処理は、同期実行に固有のパイプラインバブルを排除し、ハードウェア利用を最大化する。
この効率向上は勾配安定度によって損なわれ、遅延勾配による即時モデル更新は最適化プロセスにノイズをもたらす。
本稿では,アライメント問題を効果的に緩和し,非同期設定における収束を著しく促進することを示す,ベースローテーションの利用を提案する。
論文 参考訳(メタデータ) (2026-02-03T13:31:51Z) - PAID: Pairwise Angular-Invariant Decomposition for Continual Test-Time Adaptation [70.98107766265636]
本稿では,事前学習した重みの幾何学的特性を出発点として,3つの重要な成分(等級,絶対角,対角構造)を体系的に解析する。
両角構造は多種多様なドメインにわたって安定であり, ドメイン不変な意味情報を符号化し, 適応中に保存すべきことを示唆する。
論文 参考訳(メタデータ) (2025-06-03T05:18:15Z) - Revisiting Rotation Averaging: Uncertainties and Robust Losses [51.64986160468128]
現在の手法の主な問題は、推定エピポーラを通して入力データと弱い結合しか持たない最小コスト関数である。
本稿では,点対応から回転平均化への不確実性を直接伝播させることにより,基礎となる雑音分布をモデル化することを提案する。
論文 参考訳(メタデータ) (2023-03-09T11:51:20Z) - On the Convergence of Stochastic Extragradient for Bilinear Games with
Restarted Iteration Averaging [96.13485146617322]
本稿では, ステップサイズが一定であるSEG法の解析を行い, 良好な収束をもたらす手法のバリエーションを示す。
平均化で拡張した場合、SEGはナッシュ平衡に確実に収束し、スケジュールされた再起動手順を組み込むことで、その速度が確実に加速されることを証明した。
論文 参考訳(メタデータ) (2021-06-30T17:51:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。