論文の概要: NoRIN: Backbone-Adaptive Reversible Normalization for Time-Series Forecasting
- arxiv url: http://arxiv.org/abs/2605.10823v1
- Date: Mon, 11 May 2026 16:42:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 02:24:05.582846
- Title: NoRIN: Backbone-Adaptive Reversible Normalization for Time-Series Forecasting
- Title(参考訳): NoRIN: 時系列予測のためのバックボーン適応可逆正規化
- Authors: Shun Zhang, Yuyang Xiao,
- Abstract要約: NoRIN は arcsinh-form Johnson $S_U$ 変換に基づく非線形正規化であり、2つの形状パラメータ $(,varepsilon)$ が尾行性および歪性を制御する。
NoRINは、勾配学習から形状選択を分離することで、変性問題から逃れる。
- 参考スコア(独自算出の注目度): 7.171078684701748
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reversible instance normalization (RevIN) and its successors (Dish-TS, SAN, FAN) have become the de facto plug-in for time-series forecasting, yet the map they apply to each data point is strictly affine, $x \mapsto ax+b$, so they cannot reshape the underlying distribution -- heavy tails remain heavy and skewness remains uncorrected. We propose NoRIN, a non-linear reversible normalization based on the arcsinh-form Johnson $S_U$ transform with two shape parameters $(δ,\varepsilon)$ that control tailedness and skewness; the linear $Z$-score used by RevIN is recovered only in the limit $δ\to \infty$. Training $(δ,\varepsilon)$ jointly with the backbone via gradient descent reliably pushes them toward this linear limit within a few epochs -- a phenomenon we name the degeneration problem: the forecasting loss is locally indifferent to shape, and the high-capacity backbone compensates for any monotone reparameterization of its input. NoRIN escapes the degeneration by decoupling shape selection from gradient training: $(δ,\varepsilon)$ are initialized by a closed-form Slifker-Shapiro quantile fit and refined by Bayesian optimization on the validation objective, while the inner training loop is identical to standard RevIN-style training. Across six representative backbones x five real-world datasets x three prediction horizons (90 configurations), decoupled shape optimization recovers $(δ^\star,\varepsilon^\star)$ that sit systematically far from the linear limit, with values that vary in a backbone-dependent way. This empirically supports the central thesis: different backbones genuinely require different normalization parameters to reach their best performance.
- Abstract(参考訳): 可逆なインスタンス正規化(RevIN)とその後継(Dish-TS, SAN, FAN)は時系列予測の事実上のプラグインとなっているが、各データポイントに適用されるマップは厳密なアフィン、$x \mapsto ax+b$である。
RIN は arcsinh-form Johnson $S_U$ transform with two shape parameters $(δ,\varepsilon)$ that control tailedness and skewness; RevIN で使われる線形 $Z$-score は、極限 $δ\to \infty$ でのみ回復される。
トレーニング$(δ,\varepsilon)$は、勾配降下によるバックボーンとの結合により、数エポック内のこの線形極限まで確実に押し上げます -- 縮退問題と呼ばれる現象は、予測損失が局所的に形に無関心であり、高容量のバックボーンはその入力のモノトン再パラメータ化を補償する。
NoRIN は勾配トレーニングから形状選択を分離することで変性を逃れる:$(δ,\varepsilon)$ は閉形式 Slifker-Shapiro Quantile fit によって初期化され、ベイズ最適化によりバリデーションの目的に洗練され、内部トレーニングループは標準のRevINスタイルのトレーニングと同一である。
6つの代表的なバックボーン x 5 つの実世界のデータセット x 3 つの予測水平線 (90 構成) にまたがって、分離された形状の最適化は、バックボーン依存の方法で異なる値を持つ線形極限から体系的に離れた位置にある$(δ^\star,\varepsilon^\star)$を回復する。
異なるバックボーンは、彼らの最高のパフォーマンスに到達するために、真に異なる正規化パラメータを必要とします。
関連論文リスト
- Amortized Simulation-Based Inference in Generalized Bayes via Neural Posterior Estimation [1.096028999747108]
一般化ベイズ推論(英語版)(GBI)は、過信を緩和し、モデルの不特定性の下で改善するために温度$>0$の損失を誘惑する。
本研究は,1つの前進パスでサンプリング可能な1ドル(x,)$条件のニューラルな後進推定器$q_(mid x,)$をトレーニングすることにより,最初の完全償却変分近似を後進群$p_(mid x) propto (),p(x mid )$に与える。
論文 参考訳(メタデータ) (2026-01-29T22:20:47Z) - Closed-Form Last Layer Optimization [72.49151473937319]
正方形損失の下では、線形最終層重みに対する最適解は閉形式で知られている。
これは、バックボーン上の勾配降下ステップと最終層上のクローズドフォーム更新の交互に行われることを示す。
論文 参考訳(メタデータ) (2025-10-06T09:14:39Z) - FedSVD: Adaptive Orthogonalization for Private Federated Learning with LoRA [68.44043212834204]
Low-Rank Adaptation (LoRA) は、学習における言語モデルの効率的な微調整に広く用いられている。
Low-Rank Adaptation (LoRA) は、学習における言語モデルの効率的な微調整に広く用いられている。
論文 参考訳(メタデータ) (2025-05-19T07:32:56Z) - Learning with Norm Constrained, Over-parameterized, Two-layer Neural Networks [54.177130905659155]
近年の研究では、再生カーネルヒルベルト空間(RKHS)がニューラルネットワークによる関数のモデル化に適した空間ではないことが示されている。
本稿では,有界ノルムを持つオーバーパラメータ化された2層ニューラルネットワークに適した関数空間について検討する。
論文 参考訳(メタデータ) (2024-04-29T15:04:07Z) - Stable Nonconvex-Nonconcave Training via Linear Interpolation [51.668052890249726]
本稿では,ニューラルネットワークトレーニングを安定化(大規模)するための原理的手法として,線形アヘッドの理論解析を提案する。
最適化過程の不安定性は、しばしば損失ランドスケープの非単調性によって引き起こされるものであり、非拡張作用素の理論を活用することによって線型性がいかに役立つかを示す。
論文 参考訳(メタデータ) (2023-10-20T12:45:12Z) - Posterior Coreset Construction with Kernelized Stein Discrepancy for
Model-Based Reinforcement Learning [78.30395044401321]
我々は、強化学習(MBRL)のための新しいモデルベースアプローチを開発する。
ターゲット遷移モデルの仮定を緩和し、混合モデルの一般的な族に属する。
連続的な制御環境では、壁時計の時間を最大50%削減することができる。
論文 参考訳(メタデータ) (2022-06-02T17:27:49Z) - Model-based Reinforcement Learning for Continuous Control with Posterior
Sampling [10.91557009257615]
連続状態空間における強化学習(PSRL)のためのモデルベース後方サンプリングについて検討した。
MPC-PSRLはモデルに基づく後部サンプリングアルゴリズムであり,行動選択のためのモデル予測制御を行う。
論文 参考訳(メタデータ) (2020-11-20T21:00:31Z) - Implicit Bias of Gradient Descent for Mean Squared Error Regression with
Two-Layer Wide Neural Networks [1.3706331473063877]
幅$n$浅いReLUネットワークをトレーニングする解は、トレーニングデータに適合する関数の$n-1/2$以内であることを示す。
また, トレーニング軌道はスムーズなスプラインの軌道によって捕捉され, 正規化強度は低下することを示した。
論文 参考訳(メタデータ) (2020-06-12T17:46:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。