論文の概要: Don't Learn the Shape: Forecasting Periodic Time Series by Rank-1 Decomposition
- arxiv url: http://arxiv.org/abs/2605.07222v1
- Date: Fri, 08 May 2026 04:15:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.796596
- Title: Don't Learn the Shape: Forecasting Periodic Time Series by Rank-1 Decomposition
- Title(参考訳): Don't Learn the Shape: Forecasting Periodic Time Series by Rank-1 Decomposition
- Authors: Takato Honda,
- Abstract要約: 24列の行列に1日1列の時間帯の電気系列は、およそ1ランクである。
最後のK=2サイクルの単純な平均よりも、スムーズ、縮小、低ランクのフィットが明らかにアップグレードされているように思える。
結果のFLAIRは(a)有効である:PatchTSTを集合GIFT-Eval(relMASE 0.838 vs 0.849)にマッチする
- 参考スコア(独自算出の注目度): 0.2538209532048866
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: How few parameters do we really need to forecast a periodic time series? An hourly electricity series, reshaped as a 24-row matrix with one column per day, is approximately rank-1: a daily shape modulated by a daily level (median centered rank-1 energy 0.82 on GIFT-Eval). Should we learn the shape? Smoothing, shrinkage, and low-rank fits all seem like obvious upgrades over the simple average of the last K=2 cycles. On all 97 GIFT-Eval configurations, we tested 8 such alternatives (e.g., Fourier, EWMA, James-Stein, rank-r SVD): none significantly beats the frozen baseline under Holm correction; two are significantly worse. The resulting method, FLAIR, is (a) Effective: matches PatchTST on aggregate GIFT-Eval (relMASE 0.838 vs 0.849); (b) Compact: 28 scalars for hourly, 57 for weekly; (c) Fast: 22 minutes on one CPU core of a MacBook Pro; (d) Closed-form & Hands-Off: one SVD per period candidate, GCV-averaged Ridge, no GPU, no pre-training, no per-task tuning. In the high-rank-1, many-cycle regime, extra flexibility is estimation noise.
- Abstract(参考訳): 周期的な時系列を予測する必要があるパラメータはいくつありますか?
24列の行列に1日1列の時間帯の電気系列は、ほぼ1階1:1日単位で変調される(GIFT-Evalでは、中間階1エネルギー0.12)。
形を学ぶべきか?
平滑化、縮小、低ランク化は全て、前回のK=2サイクルの単純な平均よりも明らかにアップグレードされているように思える。
97のGIFT-Eval構成で、私たちは8つの選択肢(例: Fourier、EWMA、James-Stein、 rank-r SVD)をテストしました。
結果はFLAIRです。
(a)有効:総合GIFT-Eval(relMASE 0.838 vs 0.849)でPatchTSTにマッチする
(b)小型:1時間28スカラー、週57スカラー
(c)高速:MacBook Proの1つのCPUコアで22分。
(d)クローズドフォーム&ハンドオフ:期間毎の1つのSVD、GCV平均リッジ、GPUなし、事前トレーニングなし、タスク毎のチューニングなし。
高ランク-1、多サイクル系では、余分な柔軟性は推定ノイズである。
関連論文リスト
- The Spectral Lifecycle of Transformer Training: Transient Compression Waves, Persistent Spectral Gradients, and the Q/K--V Asymmetry [4.28787537081191]
本稿では,重み行列特異値スペクトルの事前学習に関する最初の体系的研究について述べる。
textbf(1) 過渡圧縮波: 安定な階数圧縮は、初期から後期の進行波として伝播する。
textbf(2) Persistent Spectral Gradients: the power-law exponent$$s developing a permanent depth gradient formed a non-monotonic inverted-U in deep model。
論文 参考訳(メタデータ) (2026-04-03T08:58:53Z) - One-for-All: A Lightweight Stabilized and Parameter-Efficient Pre-trained LLM for Time Series Forecasting [4.364999214109123]
One-for-Allは、時系列分析のためにトレーニング済みの大規模言語モデルを適用するためのフレームワークである。
rsLoRAは、低いランクでの証明可能な勾配安定性を可能にする数学的に基底的なランク安定化機構を導入している。
One-for-Allは最先端の効率と精度のトレードオフを達成する。
論文 参考訳(メタデータ) (2026-03-31T13:54:43Z) - Power-SMC: Low-Latency Sequence-Level Power Sampling for Training-Free LLM Reasoning [11.356198488445488]
トレーニング不要なSequential Monte CarloスキームであるPower-SMCを導入する。
MATH500では、Power-SMCはMHの電力サンプリングと一致し、レイテンシを16$---28times$から1.4$---3.3times$に下げる。
論文 参考訳(メタデータ) (2026-02-10T20:31:40Z) - Optimal Learning-Rate Schedules under Functional Scaling Laws: Power Decay and Warmup-Stable-Decay [9.371921537573346]
機能的スケーリング法則の下で、最適学習率スケジュール(LRS)について検討する。
LRSは線形回帰と大規模言語モデル(LLM)の事前学習の損失ダイナミクスを正確にモデル化する。
我々は,ピーク学習率のみを調整した最適な形状固定スケジュールを解析する。
論文 参考訳(メタデータ) (2026-02-06T15:52:30Z) - Theory of Optimal Learning Rate Schedules and Scaling Laws for a Random Feature Model [19.00191673972499]
勾配降下学習モデル(SGD)の最適学習率スケジュールの解法モデルについて検討する。
ハードフェーズでは、最適スケジュールはウォームアップ安定デカイに似ており、初期学習レートは一定($T$)で、トレーニングステップの消滅分だけ実行されます。
我々のモデルは、簡単かつ困難な状況下での計算-最適スケーリング法則(モデルサイズとトレーニングステップが選択される)も予測します。
論文 参考訳(メタデータ) (2026-02-04T17:11:36Z) - Scale-Invariant Regret Matching and Online Learning with Optimal Convergence: Bridging Theory and Practice in Zero-Sum Games [60.871651115241406]
ゼロサムゲームにおける理論と実践の間、何十年にもわたってかなりのシャズムが一階法によって浸食されてきた。
我々は、IREG-PRM$+$と呼ぶPRM$+$の新しいスケール不変かつパラメータフリーな変種を提案する。
ベンチマークゲームでは, PRM$+$と同等でありながら, 最適収束保証を$T-1/2$, $T-1$とする。
論文 参考訳(メタデータ) (2025-10-06T00:33:20Z) - REPA Works Until It Doesn't: Early-Stopped, Holistic Alignment Supercharges Diffusion Training [58.33728862521732]
Diffusion Transformer (DiTs)は最先端の画像品質を提供するが、訓練は依然として遅い。
最近の治療 -- DiT の隠された特徴と非生成的教師(例えば DINO)の特徴とを一致させる表現アライメント(REPA) -- は、初期のエポックを劇的に加速させるが、その後パフォーマンスを低下させる。
生成学習者が共同データ分布をモデル化し始めると、教師の低次元埋め込みと注意パターンがガイドではなくストラトジャケットになる。
HASTEを紹介する
論文 参考訳(メタデータ) (2025-05-22T15:34:33Z) - Orthogonal SVD Covariance Conditioning and Latent Disentanglement [65.67315418971688]
SVDメタ層をニューラルネットワークに挿入すると、共分散が不調和になる。
我々は最寄り直交勾配(NOG)と最適学習率(OLR)を提案する。
視覚認識実験は,共分散条件と一般化を同時に改善できることを実証した。
論文 参考訳(メタデータ) (2022-12-11T20:31:31Z) - Sharper Convergence Guarantees for Asynchronous SGD for Distributed and
Federated Learning [77.22019100456595]
通信周波数の異なる分散計算作業者のトレーニングアルゴリズムを示す。
本研究では,より厳密な収束率を$mathcalO!!(sigma2-2_avg!)とする。
また,不均一性の項は,作業者の平均遅延によっても影響されることを示した。
論文 参考訳(メタデータ) (2022-06-16T17:10:57Z) - VSAC: Efficient and Accurate Estimator for H and F [68.65610177368617]
VSACはRANSAC型頑健な推定器であり、多くの新奇性がある。
従来のすべてのプロセッサよりも大幅に高速で、CPU上では平均1-2msで動作する。
現在最も正確な2次元幾何学推定器である MAGSAC++ と同等の精度で2桁高速である。
論文 参考訳(メタデータ) (2021-06-18T17:04:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。