Fugu-MT 論文翻訳(概要): Small but Mighty: Enhancing Time Series Forecasting with Lightweight LLMs

論文の概要: Small but Mighty: Enhancing Time Series Forecasting with Lightweight LLMs

arxiv url: http://arxiv.org/abs/2503.03594v2
Date: Sun, 09 Mar 2025 10:56:53 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-11 13:36:29.429012
Title: Small but Mighty: Enhancing Time Series Forecasting with Lightweight LLMs
Title（参考訳）: 軽量LDMによる時系列予測の小型化
Authors: Haoran Fan, Bin Li, Yixuan Weng, Shoujun Zhou,
Abstract要約: 本稿では,SMETimesについて述べる。SMETimesは,3B以下のパラメータのSLMを,効率的かつ正確な時系列予測を行うための最初の体系的な研究である。統計的特徴によって数値時系列をテキスト意味論でブリッジする統計的に強化されたプロンプト機構; 学習可能なパラメータを通して時間パターンと言語モデルトークン空間を整列する適応型融合埋め込みアーキテクチャ。
参考スコア（独自算出の注目度）: 11.1036247482657
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: While LLMs have demonstrated remarkable potential in time series forecasting, their practical deployment remains constrained by excessive computational demands and memory footprints. Existing LLM-based approaches typically suffer from three critical limitations: Inefficient parameter utilization in handling numerical time series patterns; Modality misalignment between continuous temporal signals and discrete text embeddings; and Inflexibility for real-time expert knowledge integration. We present SMETimes, the first systematic investigation of sub-3B parameter SLMs for efficient and accurate time series forecasting. Our approach centers on three key innovations: A statistically-enhanced prompting mechanism that bridges numerical time series with textual semantics through descriptive statistical features; A adaptive fusion embedding architecture that aligns temporal patterns with language model token spaces through learnable parameters; And a dynamic mixture-of-experts framework enabled by SLMs' computational efficiency, adaptively combining base predictions with domain-specific models. Extensive evaluations across seven benchmark datasets demonstrate that our 3B-parameter SLM achieves state-of-the-art performance on five primary datasets while maintaining 3.8x faster training and 5.2x lower memory consumption compared to 7B-parameter LLM baselines. Notably, the proposed model exhibits better learning capabilities, achieving 12.3% lower MSE than conventional LLM. Ablation studies validate that our statistical prompting and cross-modal fusion modules respectively contribute 15.7% and 18.2% error reduction in long-horizon forecasting tasks. By redefining the efficiency-accuracy trade-off landscape, this work establishes SLMs as viable alternatives to resource-intensive LLMs for practical time series forecasting. Code and models are available at https://github.com/xiyan1234567/SMETimes.
Abstract（参考訳）: LLMは時系列予測において顕著な可能性を示しているが、その実際の展開は過剰な計算要求とメモリフットプリントによって制約されている。既存のLCMベースのアプローチでは、数値時系列パターンを扱う際の非効率なパラメータ利用、連続時間信号と離散テキストの埋め込みの間のモダリティの不整合、リアルタイム知識の統合のための非フレキシビリティの3つの重要な制限がある。本稿では,SMETimesについて述べる。SMETimesは,3B以下のパラメータのSLMを,効率的かつ正確な時系列予測を行うための最初の体系的な研究である。提案手法は, 数値時系列を記述的統計特徴によるテキスト意味学にブリッジする統計的に強化されたプロンプト機構, 学習可能なパラメータによる時間パターンと言語モデルトークン空間を整列する適応型融合組込みアーキテクチャ, SLMの計算効率によって実現された動的混合実験フレームワーク, ベース予測とドメイン固有モデルとを適応的に結合する動的混合実験フレームワークである。 7つのベンチマークデータセットにわたる大規模な評価の結果、我々の3BパラメータSLMは5つのプライマリデータセットで最先端のパフォーマンスを達成しつつ、3.8倍の高速トレーニングと5.2倍のメモリ消費を維持しながら、7BパラメータLDMベースラインよりも低いメモリ消費を実現している。特に,提案モデルでは学習能力が向上し,従来のLLMよりも12.3%低いMSEを実現している。アブレーション研究は、我々の統計的プロンプトとクロスモーダル融合モジュールが、長期予測タスクにおいてそれぞれ15.7%と18.2%のエラー削減に寄与していることを検証する。本研究は, 資源集約型LCMの実用的時系列予測のための代替手段として, SLMを有効に活用することを目的としている。コードとモデルはhttps://github.com/xiyan1234567/SMETimes.comで入手できる。

関連論文リスト

Forecasting Time Series with LLMs via Patch-Based Prompting and Decomposition [48.50019311384125]
我々は、LLMが広範囲のトレーニングを伴わずに時系列予測を行うことのできる、シンプルで柔軟なプロンプトベースの戦略を探求する。我々は,LLMが正確かつ効果的に予測できるPatchInstructを提案する。
論文参考訳（メタデータ） (2025-06-15T19:42:58Z)
Univariate to Multivariate: LLMs as Zero-Shot Predictors for Time-Series Forecasting [6.100075022678881]
時系列予測や予測は多くの実世界の動的システムにおいて重要である。近年,この課題にLarge Language Models (LLM) を用いることが提案されている。時系列列をテキストに変換してLLMに送ってゼロショット予測を行うことにより,LLMに基づく時系列予測を向上するLLMPredを提案する。
論文参考訳（メタデータ） (2025-06-03T03:02:47Z)
Efficient Model Selection for Time Series Forecasting via LLMs [52.31535714387368]
本稿では,Large Language Models (LLM) をモデル選択の軽量な代替手段として活用することを提案する。提案手法は, LLMの固有知識と推論能力を活用することで, 明示的な性能行列の必要性を解消する。
論文参考訳（メタデータ） (2025-04-02T20:33:27Z)
LLM-PS: Empowering Large Language Models for Time Series Forecasting with Temporal Patterns and Semantics [56.99021951927683]
Time Series Forecasting (TSF) は、金融計画や健康モニタリングなど、多くの現実世界のドメインにおいて重要である。既存のLarge Language Models (LLM) は通常、時系列データ固有の特性を無視するため、非最適に実行する。時系列データから基本的なtextitPatterns と有意義な textitSemantics を学習し,TLF のための LLM-PS を提案する。
論文参考訳（メタデータ） (2025-03-12T11:45:11Z)
Large Language Models are Few-shot Multivariate Time Series Classifiers [23.045734479292356]
大規模言語モデル (LLM) は時系列解析に広く応用されている。しかし、数発の分類(すなわち重要な訓練シナリオ)におけるそれらの実用性は過小評価されている。データ不足を克服するために,LLMの学習済み知識を幅広く活用することを目的としている。
論文参考訳（メタデータ） (2025-01-30T03:59:59Z)
Adaptive Pruning for Large Language Models with Structural Importance Awareness [66.2690963378878]
大規模言語モデル(LLM)は言語理解と生成能力を大幅に改善した。 LLMは、高い計算およびストレージリソース要求のため、リソース制約のあるエッジデバイスにデプロイするのは難しい。モデル性能を維持しつつ,計算コストとメモリコストを大幅に削減する構造的適応型プルーニング(SAAP)を提案する。
論文参考訳（メタデータ） (2024-12-19T18:08:04Z)
Adversarial Vulnerabilities in Large Language Models for Time Series Forecasting [14.579802892916101]
大規模言語モデル(LLM)は、最近、時系列予測において大きな可能性を証明している。しかし、現実世界のアプリケーションにおける堅牢性と信頼性は、まだ未調査のままである。 LLMに基づく時系列予測のためのターゲット対向攻撃フレームワークを提案する。
論文参考訳（メタデータ） (2024-12-11T04:53:15Z)
TableTime: Reformulating Time Series Classification as Training-Free Table Understanding with Large Language Models [14.880203496664963]
大規模言語モデル (LLM) は多変量時系列分類において有効であることを示した。 LLM は LLM の潜在空間内の時系列の埋め込みを直接コードし、LLM の意味空間と一致させる。 MTSCを表理解タスクとして再編成するテーブルタイムを提案する。
論文参考訳（メタデータ） (2024-11-24T07:02:32Z)
Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3175915185287]
コンテキスト is Key" (CiK) は、数値データを多種多様なテキストコンテキストと組み合わせた予測ベンチマークである。我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。提案手法は,提案するベンチマークにおいて,他の試験手法よりも優れる簡易かつ効果的なLCMプロンプト法である。
論文参考訳（メタデータ） (2024-10-24T17:56:08Z)
Scaling Laws for Predicting Downstream Performance in LLMs [75.28559015477137]
この研究は、性能評価のためのより効率的な指標として、事前学習損失に焦点を当てている。我々は、データソース間のFLOPに基づいて、ドメイン固有の事前学習損失を予測するために、電力法解析関数を拡張した。我々は2層ニューラルネットワークを用いて、複数のドメイン固有の損失と下流性能の非線形関係をモデル化する。
論文参考訳（メタデータ） (2024-10-11T04:57:48Z)
60 Data Points are Sufficient to Fine-Tune LLMs for Question-Answering [50.12622877002846]
大規模言語モデル(LLM)は、大量のデータセットの事前トレーニングを通じて、広範囲な世界の知識を符号化する。我々は,事前学習したLLMが記憶する知識の量に基づいて,教師付き微調整(SFT)データを分類した。実験の結果,SFTの段階では60個のデータポイントが事前学習中に符号化された知識を活性化することができ,LLMがQAタスクを実行できることがわかった。
論文参考訳（メタデータ） (2024-09-24T07:38:38Z)
A Comprehensive Evaluation of Large Language Models on Temporal Event Forecasting [45.0261082985087]
時間的事象予測のための大規模言語モデル(LLM)を総合的に評価する。 LLMの入力に生テキストを直接統合しても、ゼロショット補間性能は向上しないことがわかった。対照的に、特定の複雑なイベントや微調整LDMに生テキストを組み込むことで、性能が大幅に向上する。
論文参考訳（メタデータ） (2024-07-16T11:58:54Z)
CALF: Aligning LLMs for Time Series Forecasting via Cross-modal Fine-Tuning [59.88924847995279]
MTSFのためのクロスモーダルLCMファインチューニング(CALF)フレームワークを提案する。分散の相違を低減するため,クロスモーダルマッチングモジュールを開発した。 CALFは、長期および短期の予測タスクの最先端のパフォーマンスを確立する。
論文参考訳（メタデータ） (2024-03-12T04:04:38Z)
AutoTimes: Autoregressive Time Series Forecasters via Large Language Models [67.83502953961505]
AutoTimesは時系列を言語トークンの埋め込み空間に投影し、任意の長さで将来予測を生成する。時系列をプロンプトとして定式化し、ルックバックウィンドウを越えて予測のコンテキストを拡張する。 AutoTimesは、トレーニング可能なパラメータが0.1%、トレーニング/推論のスピードアップが5ドル以上で最先端を実現している。
論文参考訳（メタデータ） (2024-02-04T06:59:21Z)
LLM4TS: Aligning Pre-Trained LLMs as Data-Efficient Time-Series Forecasters [11.796765525301051]
事前学習された大言語モデル(LLM)を用いた時系列予測のためのフレームワークを提案する。 LLM4TSは、LLMを時系列データのニュアンスと整合させる2段階の微調整戦略と、下流の時系列予測タスクの予測微調整段階から構成される。我々のフレームワークは、事前訓練されたLLM内に多段階の時間データを統合し、時間固有の情報を解釈する能力を向上する新しい2段階集約手法を特徴としている。
論文参考訳（メタデータ） (2023-08-16T16:19:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。