論文の概要: MSNet and LS-Net: Scalable Multi-Scale Multi-Representation Networks for Time Series Classification
- arxiv url: http://arxiv.org/abs/2603.19315v1
- Date: Sat, 14 Mar 2026 11:51:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 19:48:38.78399
- Title: MSNet and LS-Net: Scalable Multi-Scale Multi-Representation Networks for Time Series Classification
- Title(参考訳): MSNetとLS-Net:時系列分類のためのスケーラブルなマルチスケールマルチ表現ネットワーク
- Authors: Celal Alagöz, Mehmet Kurnaz, Farhan Aadil,
- Abstract要約: 時系列分類(TSC)のパフォーマンスは、アーキテクチャ設計だけでなく、入力表現の多様性にも依存する。
構造化多表現入力を体系的に統合するスケーラブルなマルチスケール畳み込みフレームワークを提案する。
我々は、ロバスト性とキャリブレーションに最適化された階層型マルチスケール畳み込みネットワークであるMSNetと、効率を意識したデプロイメント用に設計された軽量なLS-Netの2つのアーキテクチャを紹介する。
- 参考スコア(独自算出の注目度): 0.6780086370528623
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Time series classification (TSC) performance depends not only on architectural design but also on the diversity of input representations. In this work, we propose a scalable multi-scale convolutional framework that systematically integrates structured multi-representation inputs for univariate time series. We introduce two architectures: MSNet, a hierarchical multi-scale convolutional network optimized for robustness and calibration, and LS-Net, a lightweight variant designed for efficiency-aware deployment. In addition, we adapt LiteMV -- originally developed for multivariate inputs -- to operate on multi-representation univariate signals, enabling cross-representation interaction. We evaluate all models across 142 benchmark datasets under a unified experimental protocol. Critical Difference analysis confirms statistically significant performance differences among the top models. Results show that LiteMV achieves the highest mean accuracy, MSNet provides superior probabilistic calibration (lowest NLL), and LS-Net offers the best efficiency-accuracy tradeoff. Pareto analysis further demonstrates that multi-representation multi-scale modeling yields a flexible design space that can be tuned for accuracy-oriented, calibration-oriented, or resource-constrained settings. These findings establish scalable multi-representation multi-scale learning as a principled and practical direction for modern TSC. Reference implementation of MSNet and LS-Net is available at: https://github.com/alagoz/msnet-lsnet-tsc
- Abstract(参考訳): 時系列分類(TSC)のパフォーマンスは、アーキテクチャ設計だけでなく、入力表現の多様性にも依存する。
本研究では,一変量時系列に対する構造化多重表現入力を体系的に統合したスケーラブルなマルチスケール畳み込みフレームワークを提案する。
我々は、ロバスト性とキャリブレーションに最適化された階層型マルチスケール畳み込みネットワークであるMSNetと、効率を意識したデプロイメント用に設計された軽量なLS-Netの2つのアーキテクチャを紹介する。
また、もともと多変量入力用に開発されたLiteMVを多変量単変量信号に適応させ、相互表現の相互作用を可能にする。
統一実験プロトコルにより,142のベンチマークデータセットにまたがるすべてのモデルを評価した。
臨界差解析は、上位モデル間の統計的に重要な性能差を確認する。
その結果、LiteMVは平均精度が最も高く、MSNetはより優れた確率的キャリブレーション(最も低いNLL)を提供し、LS-Netは最良の効率と精度のトレードオフを提供することがわかった。
Pareto分析はさらに、マルチ表現のマルチスケールモデリングは、精度指向、キャリブレーション指向、リソース制約のある設定に調整できる柔軟な設計空間をもたらすことを示した。
これらの知見は、現代のTSCの原則的かつ実践的な方向性として、スケーラブルなマルチ表現型マルチスケール学習を確立した。
MSNetとLS-Netのリファレンス実装は、https://github.com/alagoz/msnet-lsnet-tscで公開されている。
関連論文リスト
- UniT: Unified Multimodal Chain-of-Thought Test-time Scaling [85.590774707406]
統一モデルは単一のアーキテクチャ内でマルチモーダル理解と生成の両方を扱うことができるが、通常は出力を反復的に書き換えることなく単一のパスで操作する。
マルチモーダルなテストタイムスケーリングのためのフレームワークであるUniTを導入し、単一の統一モデルで複数のラウンドをまたいだ推論、検証、精査を可能にします。
論文 参考訳(メタデータ) (2026-02-12T18:59:49Z) - Co-Training Vision Language Models for Remote Sensing Multi-task Learning [68.15604397741753]
視覚言語モデル(VLM)は、RS画像理解、グラウンド化、超高解像度(UHR)画像推論において有望な結果を得た。
本稿では,RSMTLのための簡易かつ柔軟なVLMベースラインであるRSCoVLMを提案する。
本稿では、RS画像に固有の多様な画像スケールに対処する、統一された動的解像度戦略を提案する。
論文 参考訳(メタデータ) (2025-11-26T10:55:07Z) - ADEM-VL: Adaptive and Embedded Fusion for Efficient Vision-Language Tuning [38.26304604660713]
ADEM-VLは、事前訓練された大規模言語モデルに基づいてモデルをチューニングする効率的な視覚言語手法である。
我々のフレームワークはScienceQAデータセットの平均精度を0.77%上回る。
論文 参考訳(メタデータ) (2024-10-23T11:31:06Z) - TSCMamba: Mamba Meets Multi-View Learning for Time Series Classification [13.110156202816112]
シフト等分散のような特性を持つパターンを捉えるための新しい多視点手法を提案する。
提案手法は, スペクトル, 時間, 局所, グローバルな特徴を含む多様な特徴を統合して, TSCのリッチで相補的な文脈を得る。
提案手法では,TSCモデルよりも平均精度が4.01-6.45%,7.93%向上した。
論文 参考訳(メタデータ) (2024-06-06T18:05:10Z) - TACTiS-2: Better, Faster, Simpler Attentional Copulas for Multivariate Time Series [57.4208255711412]
パウラ理論に基づいて,最近導入されたトランスフォーマーに基づく注目パウラ(TACTiS)の簡易な目的を提案する。
結果から,実世界の予測タスクにまたがって,このモデルのトレーニング性能が大幅に向上し,最先端のパフォーマンスが達成できることが示唆された。
論文 参考訳(メタデータ) (2023-10-02T16:45:19Z) - Adapting model-based deep learning to multiple acquisition conditions:
Ada-MoDL [17.21936233574088]
本研究の目的は、アンサンプされた並列MRIデータから高品質な再構成を可能にする、単一のモデルベースのディープネットワークを導入することである。
複数の取得設定のための優れた再構築を提供する、単一のアンロールアーキテクチャが導入された。
論文 参考訳(メタデータ) (2023-04-21T20:12:59Z) - MS-LSTM: Exploring Spatiotemporal Multiscale Representations in Video
Prediction Domain [8.216911980865902]
既存のRNNモデルは、積み重ねレイヤーのみによって、マルチスケールの機能を得ることができる。
本稿では,マルチスケールの観点からMS-LSTMを完全に提案する。
理論的にはMS-LSTMとそのコンポーネントのトレーニングコストと性能を理論的に分析する。
論文 参考訳(メタデータ) (2023-04-16T08:25:02Z) - Learning Visual Representation from Modality-Shared Contrastive
Language-Image Pre-training [88.80694147730883]
本稿では,多種多様なモダリティ共有コントラスト言語-画像事前学習(MS-CLIP)フレームワークについて検討する。
学習条件下では、視覚と言語信号のためのほとんど統一されたエンコーダが、より多くのパラメータを分離する他のすべてのバリエーションより優れていることが観察された。
我々のアプローチは、24の下流視覚タスクのコレクションに基づいて、線形探索においてバニラCLIPを1.6ポイント上回ります。
論文 参考訳(メタデータ) (2022-07-26T05:19:16Z) - TMS: A Temporal Multi-scale Backbone Design for Speaker Embedding [60.292702363839716]
話者埋め込みのための現在のSOTAバックボーンネットワークは、話者表現のためのマルチブランチネットワークアーキテクチャを用いた発話からマルチスケール特徴を集約するように設計されている。
本稿では, 話者埋め込みネットワークにおいて, 計算コストの増大を伴わずに, マルチスケール分岐を効率的に設計できる効果的な時間的マルチスケール(TMS)モデルを提案する。
論文 参考訳(メタデータ) (2022-03-17T05:49:35Z) - ResNeSt: Split-Attention Networks [86.25490825631763]
このアーキテクチャは、異なるネットワークブランチにチャンネルワイズを応用し、機能間相互作用のキャプチャと多様な表現の学習の成功を活用する。
我々のモデルはResNeStと呼ばれ、画像分類の精度と遅延トレードオフにおいてEfficientNetより優れています。
論文 参考訳(メタデータ) (2020-04-19T20:40:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。