論文の概要: MSMixer: Learned Multi-Scale Temporal Mixing with Complementary Linear Shortcut for Long-Term Time Series Forecasting
- arxiv url: http://arxiv.org/abs/2605.02689v1
- Date: Mon, 04 May 2026 15:03:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.35196
- Title: MSMixer: Learned Multi-Scale Temporal Mixing with Complementary Linear Shortcut for Long-Term Time Series Forecasting
- Title(参考訳): MSMixer:長期連続予測のための相補的線形ショートカットを用いたマルチスケールテンポラル混合学習
- Authors: Ahmed Cherif,
- Abstract要約: 長期の時系列予測には、急激な振動、中距離周期性、固定されたルックバックウィンドウからの緩やかなマクロトレンドを同時にキャプチャするモデルが必要である。
既存の軽量モデルは通常、単一の時間分解能で動作し、複数のスケールでパターンを明示的にモデル化する能力を制限する。
本稿では,チャネルに依存しないマルチスケールアーキテクチャであるMSMixerを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Long-term time series forecasting requires models that simultaneously capture rapid oscillations, medium-range periodicities, and slowly evolving macro-trends from a fixed look-back window. Existing lightweight MLP-based models typically operate on a single temporal resolution, limiting their ability to explicitly model patterns at multiple scales. We propose MSMixer, a channel-independent multi-scale MLP architecture that addresses this limitation through three complementary innovations: (i) three parallel scale branches at down-sample factors {1x, 4x, 16x} with independent MLP blocks, (ii) a learnable softmax gate that dynamically weighs branch outputs, and (iii) a DLinear complementary shortcut that provides full-window trend and seasonality context. MSMixer contains only 112K parameters at H=96 and runs at O(T) complexity. Evaluated on four ETT benchmarks with standard chronological splits and three random seeds, MSMixer achieves the lowest average MSE (0.357) among lightweight models, outperforming DLinear (0.386, -7.4%) and NLinear (0.365, -2.1%), winning 12 of 16 configurations. Against five Transformer-based baselines from the literature, MSMixer achieves best or second-best MSE in 9 of 16 configurations while using 5x fewer parameters than PatchTST. Ablation and sensitivity analyses confirm the complementary contributions of the multi-scale branches and the DLinear shortcut.
- Abstract(参考訳): 長期の時系列予測には、急激な振動、中距離周期性、固定されたルックバックウィンドウからの緩やかなマクロトレンドを同時にキャプチャするモデルが必要である。
既存の軽量MLPベースのモデルは、通常、単一の時間分解能で動作し、複数のスケールでパターンを明示的にモデル化する能力を制限する。
チャネルに依存しないマルチスケールMLPアーキテクチャであるMSMixerを提案する。
(i)独立したMLPブロックを持つダウンサンプル因子 {1x, 4x, 16x} における3つの並列スケール分岐
(二)分岐出力を動的に重み付けする学習可能なソフトマックスゲート、及び
(3)全風傾向と季節的文脈を提供するDLinear補間ショートカット。
MSMixerはH=96で112Kのパラメータしか持たず、O(T)複雑性で実行される。
MSMixerは標準の時間分割と3つのランダムシードを持つ4つのETTベンチマークで評価され、DLinear (0.386, -7.4%) とNLinear (0.365, -2.1%) を上回り、軽量モデルの中では最も低い平均MSE (0.357) を達成した。
文献から5つのTransformerベースのベースラインに対して、MSMixerは、PatchTSTよりも5倍少ないパラメータを使用しながら、16の構成のうち9つの構成でベストまたはセカンドベストのMSEを達成する。
アブレーションおよび感度解析は多スケール枝とDLinearショートカットの相補的寄与を裏付ける。
関連論文リスト
- SEMixer: Semantics Enhanced MLP-Mixer for Multiscale Mixing and Long-term Time Series Forecasting [9.398256560898448]
SEMixerは長期時系列予測(TSF)用に設計された軽量モデルである
MixerはRAM(Random Attention Mechanism)とMPMC(Multiscale Progressive Mixing Chain)を備えている。
MPMCはRAMとアンサンブルミキサーをメモリ効率よくスタックし、より効果的な時間混合を実現する。
論文 参考訳(メタデータ) (2026-02-18T06:53:32Z) - DPWMixer: Dual-Path Wavelet Mixer for Long-Term Time Series Forecasting [6.01829429039985]
長期時系列予測は計算知能において重要な課題である。
本稿では,計算効率の良いDual-PathアーキテクチャDPWMixerを提案する。
8つの公開ベンチマーク実験により,本手法は最先端のベースラインよりも一貫した改善を達成できることが示された。
論文 参考訳(メタデータ) (2025-11-30T03:12:50Z) - MoDES: Accelerating Mixture-of-Experts Multimodal Large Language Models via Dynamic Expert Skipping [52.02659589971978]
我々は,MoE MLLM推論を効果的かつ正確なものにするために,専門家を適応的にスキップする最初のトレーニングフリーフレームワークであるMoDESを提案する。
MoDESは推論速度を大幅に向上させ、プリフィルタイムを2.16$times$、デコードタイムを1.26$times$に改善する。
論文 参考訳(メタデータ) (2025-11-19T18:48:27Z) - T3Time: Tri-Modal Time Series Forecasting via Adaptive Multi-Head Alignment and Residual Fusion [0.4915744683251151]
T3Timeは、時間、スペクトル、プロンプトブランチで構成される新しい3モーダルフレームワークである。
予測地平線に基づいて時間的特徴とスペクトル的特徴の優先順位付けを学習する。
我々のモデルは一貫して最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2025-08-06T09:31:44Z) - Mixture-of-Mamba: Enhancing Multi-Modal State-Space Models with Modality-Aware Sparsity [56.0251572416922]
状態空間モデル(SSM)は、シーケンシャルモデリングのためのトランスフォーマーの効率的な代替手段として登場した。
本稿では,Mambaブロックのモダリティ特異的パラメータ化により,モダリティを意識した疎結合を実現する新しいSSMアーキテクチャを提案する。
マルチモーダル事前学習環境におけるMixture-of-Mambaの評価を行った。
論文 参考訳(メタデータ) (2025-01-27T18:35:05Z) - Mini-Sequence Transformer: Optimizing Intermediate Memory for Long Sequences Training [78.93900796545523]
ミニシーケンス変換器(Mini-Sequence Transformer, MsT)は、非常に長いシーケンスを持つ高速かつ高精度なLLMトレーニング手法である。
MsTは入力シーケンスを分割し、中間メモリ使用量を減らすためにミニシーケンスを反復的に処理する。
huggingfaceライブラリと統合され、MsTはQwen、Mistral、Gemma-2の最大コンテキスト長を12-24倍に拡張した。
論文 参考訳(メタデータ) (2024-07-22T01:52:30Z) - MM-Mixing: Multi-Modal Mixing Alignment for 3D Understanding [64.65145700121442]
MM-Mixingは3次元理解のためのマルチモーダルミキシングアライメントフレームワークである。
提案する2段階学習パイプラインは,特徴レベルと入力レベルを混合して3Dエンコーダを最適化する。
MM-Mixingは,様々な学習シナリオにおけるベースライン性能を大幅に向上させることを示した。
論文 参考訳(メタデータ) (2024-05-28T18:44:15Z) - TSMixer: Lightweight MLP-Mixer Model for Multivariate Time Series
Forecasting [13.410217680999459]
トランスフォーマーは、時系列の相互作用をキャプチャする能力のために時系列予測で人気を博している。
高メモリとコンピューティングの要求は、長期予測にとって重要なボトルネックとなる。
マルチ層パーセプトロン(MLP)モジュールからなる軽量ニューラルネットワークTSMixerを提案する。
論文 参考訳(メタデータ) (2023-06-14T06:26:23Z) - TriMLP: Revenge of a MLP-like Architecture in Sequential Recommendation [23.32537260687907]
本稿では,TriMLPという逐次レコメンデーションのためのシーケンシャルなアーキテクチャと,クロストークン通信のための新しい三角形ミキサーを提案する。
三角ミキサーの設計において,基本行列乗算としてのクロストケン操作のイナシイを単純化し,重み行列の下方三角形ニューロンを落として,反時間次接続を将来のトークンからブロックする。
論文 参考訳(メタデータ) (2023-05-24T03:32:31Z) - SplitMixer: Fat Trimmed From MLP-like Models [53.12472550578278]
視覚認識のためのシンプルで軽量な等方的アーキテクチャであるSplitMixerを提案する。
情報(空間混合)とチャネル(チャネル混合)の2種類のインターリーブ畳み込み操作を含む。
論文 参考訳(メタデータ) (2022-07-21T01:37:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。