論文の概要: Controlling Transient Amplification Improves Long-horizon Rollouts
- arxiv url: http://arxiv.org/abs/2605.08856v2
- Date: Fri, 15 May 2026 09:57:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 03:45:13.083596
- Title: Controlling Transient Amplification Improves Long-horizon Rollouts
- Title(参考訳): 過渡増幅制御による長軸ロールアウトの改善
- Authors: Adeel Pervez, Francesco Locatello,
- Abstract要約: ロールアウト軌道周りの過渡摂動をロールアウト誤差を駆動するメカニズムとして同定する。
可換正則化: 個々のヤコビアンの正規性欠陥を低減するために設計された2つの罰則の組み合わせを提案する。
本手法は,新しいデータを用いることなく,ERA5のFourNet気候予測を改善した。
- 参考スコア(独自算出の注目度): 33.85418321772749
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autoregressive neural simulators now match classical solvers on short-horizon prediction of physical systems, yet their accuracy degrades rapidly when rolled out over long horizons. In this work, we identify transient amplification of perturbations around rollout trajectories as a structural mechanism driving rollout error. Using a linearization analysis we show that when the Jacobians along an autoregressive trajectory are non-normal and non-commuting, the model amplifies errors transiently, resulting in model rollout drift even when the overall system is asymptotically stable. Building on the analysis, we propose commutativity regularization: a combination of two penalties designed to reduce the normality defect of individual Jacobians and the commutator norm of Jacobians across steps. The penalties are estimated with Jacobian-vector products and have no inference-time cost. We show a propagator bound that quantifies rollout error under approximate commutativity and normality. We evaluate UNet and FNO variants with commutativity regularization on 1D and 2D spatio-temporal data in synthetic and real settings, showing successful long-horizon rollouts over thousands of steps. Further, we show that the method improves FourCastNet climate forecasts on ERA5 without using any new data. The gain is most pronounced out-of-distribution: trained on trajectories of a few hundred steps, regularized models remain in-distribution for thousands of rollout steps on initial conditions where baselines diverge.
- Abstract(参考訳): 自己回帰型ニューラルシミュレータは、物理系の短水平予測において古典的な解法と一致するが、長い地平線の上をロールアウトすると、その精度は急速に低下する。
本研究では,ロールアウト軌道周りの摂動の過渡増幅を,ロールアウト誤差を駆動する構造機構として同定する。
線形化解析を用いて, 自己回帰軌道に沿ったジャコビアンが非正規かつ非可換である場合, モデルが過渡的に誤差を増幅し, 結果として, 全体系が漸近的に安定である場合でも, モデルロールアウトドリフトが生じることを示した。
解析に基づいて可換性正則化を提案する: 個々のヤコビアンの正規性欠陥を低減するために設計された2つのペナルティと、ステップを越えたヤコビアンの可換ノルムの組み合わせ。
罰則はヤコビアン・ベクターの製品で推定され、推論時間のコストがかからない。
近似可換性と正規性の下でロールアウト誤差を定量化するプロパゲータ境界を示す。
合成および実環境下での1次元および2次元時空間データに対する可換性正規化によるUNetおよびFNO変種の評価を行い,数千段以上の長期ロールアウトに成功したことを示す。
さらに,新たなデータを用いることなく,ERA5上でのFourCastNet気候予測を改善できることが示唆された。
数百歩の軌道で訓練され、正規化されたモデルは、ベースラインが分岐する初期条件において数千のロールアウトステップで分配される。
関連論文リスト
- PnP-Corrector: A Universal Correction Framework for Coupled Spatiotemporal Forecasting [62.22445401483844]
既存の手法は複雑なエラーのボトルネックによって厳しく制約されている。
我々は-Cast-Corrector (Plug-and-Play Corrector)と呼ばれる普遍的なフレームワークを提案する。
本手法は,結合予測システムの長期安定性を著しく向上させる。
論文 参考訳(メタデータ) (2026-05-09T13:12:33Z) - Towards Scaling Law Analysis For Spatiotemporal Weather Data [50.25336689856158]
単一ステップのトレーニング損失から長期ロールアウトやチャネル単位のメトリクスまで,自動回帰天気予報のためのニューラルスケーリング分析を拡張した。
プールドスケーリングは望ましいように見えるが、多くのチャネルは遅延リードで劣化する。
本稿では,重み付け対象,地平線対応カリキュラム,出力間の資源配分について論じる。
論文 参考訳(メタデータ) (2026-04-06T18:14:53Z) - K-GMRF: Kinetic Gauss-Markov Random Field for First-Principles Covariance Tracking on Lie Groups [8.489406212619164]
共分散追跡のためのオンライン学習自由フレームワークK-GMRFを提案する。
本手法は, 構造保存型シンプレクティックインテグレータにより伝搬される潜在角速度を駆動するトルクとして観測を解釈する。
理論的には、この2階の力学が一定回転下でゼロ定常誤差を達成することを証明している。
論文 参考訳(メタデータ) (2026-03-20T03:16:36Z) - The Geometric Inductive Bias of Grokking: Bypassing Phase Transitions via Architectural Topology [0.0]
巡回加法(Zp)を訓練した変圧器のグルーキング-遅れ一般化に関する研究
標準変圧器における2つの独立した構造因子:表現の大きさとデータ依存型アテンションルーティングを同定する。
論文 参考訳(メタデータ) (2026-03-05T14:41:01Z) - Accelerating Single-Pass SGD for Generalized Linear Prediction [10.482631815569919]
ストリーミング環境下での一般化線形予測について検討し、各イテレーションは勾配レベルの更新に1つの新しいデータポイントのみを使用する。
そこで本研究では,新しいデータ依存的近位法によりモーメントをうまく組み込んだ最初のアルゴリズムを提案する。
論文 参考訳(メタデータ) (2026-03-02T15:04:00Z) - FlowConsist: Make Your Flow Consistent with Real Trajectory [99.22869983378062]
現在の高速フロートレーニングパラダイムには,2つの根本的な問題がある,と我々は主張する。
ランダムにペアリングされたノイズデータサンプルから構築された条件付き速度は、系統的な軌跡ドリフトを導入する。
本研究では,高速フローにおける軌道整合性を実現するためのトレーニングフレームワークであるFlowConsistを提案する。
論文 参考訳(メタデータ) (2026-02-06T03:24:23Z) - Analytical blueprint for 99.999% fidelity X-gates on present superconducting hardware under strong driving [4.406638884109584]
既存のデコヒーレンスレートを組み込んだ場合, 7ns$-rotationに対して, 10~5$以下のゲート不忠実度を数値的に示す。
また、DRAGプリファクタの最適値に関する長年の質問にも答えるとともに、常にデチューンする。
論文 参考訳(メタデータ) (2025-12-22T22:47:43Z) - Revisiting Zeroth-Order Optimization: Minimum-Variance Two-Point Estimators and Directionally Aligned Perturbations [57.179679246370114]
乱摂動の分布は, 摂動段差がゼロになる傾向にあるため, 推定子の分散を最小限に抑える。
以上の結果から, 一定の長さを維持するのではなく, 真の勾配に方向を合わせることが可能であることが示唆された。
論文 参考訳(メタデータ) (2025-10-22T19:06:39Z) - ResAD: Normalized Residual Trajectory Modeling for End-to-End Autonomous Driving [64.42138266293202]
ResADは正規化された残留軌道モデリングフレームワークである。
学習タスクを再編成し、慣性参照からの残留偏差を予測する。
NAVSIMベンチマークでは、ResADはバニラ拡散ポリシーを用いて最先端のPDMS 88.6を達成している。
論文 参考訳(メタデータ) (2025-10-09T17:59:36Z) - Sampling from Gaussian Process Posteriors using Stochastic Gradient
Descent [43.097493761380186]
勾配アルゴリズムは線形系を解くのに有効な方法である。
最適値に収束しない場合であっても,勾配降下は正確な予測を導出することを示す。
実験的に、勾配降下は十分に大規模または不条件の回帰タスクにおいて最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-06-20T15:07:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。