論文の概要: TS-MLLM: A Multi-Modal Large Language Model-based Framework for Industrial Time-Series Big Data Analysis
- arxiv url: http://arxiv.org/abs/2603.07572v1
- Date: Sun, 08 Mar 2026 10:14:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:14.819426
- Title: TS-MLLM: A Multi-Modal Large Language Model-based Framework for Industrial Time-Series Big Data Analysis
- Title(参考訳): TS-MLLM:産業時系列ビッグデータ分析のためのマルチモーダル大規模言語モデルベースフレームワーク
- Authors: Haiteng Wang, Yikang Li, Yunfei Zhu, Jingheng Yan, Lei Ren, Laurence T. Yang,
- Abstract要約: 時系列解析のための統合型大言語モデルフレームワークTS-MLLMを提案する。
まず, 長期時間的ダイナミクスを捉えるために, 産業時系列・パッチ・モデリング・ブランチを開発した。
クロスモーダルな事前情報を統合するために,Spectrum-aware Vision-Language Model Adaptation (SVLMA) 機構を導入する。
複数の産業ベンチマークでの大規模な実験により、TS-MLLMは最先端の手法を著しく上回っていることが示された。
- 参考スコア(独自算出の注目度): 26.025289609138763
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate analysis of industrial time-series big data is critical for the Prognostics and Health Management (PHM) of industrial equipment. While recent advancements in Large Language Models (LLMs) have shown promise in time-series analysis, existing methods typically focus on single-modality adaptations, failing to exploit the complementary nature of temporal signals, frequency-domain visual representations, and textual knowledge information. In this paper, we propose TS-MLLM, a unified multi-modal large language model framework designed to jointly model temporal signals, frequency-domain images, and textual domain knowledge. Specifically, we first develop an Industrial time-series Patch Modeling branch to capture long-range temporal dynamics. To integrate cross-modal priors, we introduce a Spectrum-aware Vision-Language Model Adaptation (SVLMA) mechanism that enables the model to internalize frequency-domain patterns and semantic context. Furthermore, a Temporal-centric Multi-modal Attention Fusion (TMAF) mechanism is designed to actively retrieve relevant visual and textual cues using temporal features as queries, ensuring deep cross-modal alignment. Extensive experiments on multiple industrial benchmarks demonstrate that TS-MLLM significantly outperforms state-of-the-art methods, particularly in few-shot and complex scenarios. The results validate our framework's superior robustness, efficiency, and generalization capabilities for industrial time-series prediction.
- Abstract(参考訳): 産業用時系列ビッグデータの正確な分析は、産業機器の診断・健康管理(PHM)にとって重要である。
近年のLarge Language Models (LLMs) の進歩は時系列解析において有望であるが、既存の手法は時間的信号、周波数領域の視覚表現、テキスト知識情報の相補的な性質を活かさない単一モダリティ適応に重点を置いている。
本稿では,時間的信号,周波数領域の画像,テキスト領域の知識を協調的にモデル化する多モーダル大規模言語モデルフレームワークTS-MLLMを提案する。
具体的には、まず、長距離時間ダイナミクスを捉えるために、産業時系列パッチモデリングブランチを開発する。
周波数領域パターンと意味コンテキストを内在化できるSVLMA(Spectrum-aware Vision-Language Model Adaptation)機構を導入する。
さらに、時間中心のマルチモーダルアテンションフュージョン(TMAF)機構は、時間的特徴をクエリとして使用し、関連する視覚的およびテキスト的手がかりを積極的に検索し、深い相互モーダルアライメントを確保するように設計されている。
複数の産業ベンチマークでの大規模な実験により、TS-MLLMは最先端の手法、特にショット数と複雑なシナリオにおいて著しく優れていた。
その結果、我々のフレームワークの優れた堅牢性、効率、および工業時系列予測のための一般化能力が検証された。
関連論文リスト
- Enhancing few-shot time series forecasting with LLM-guided diffusion [12.286204074670236]
専門分野における時系列予測は、データ可用性の制限によって制約されることが多い。
本稿では,大言語モデルの表現力と拡散モデルの生成能力を統合する新しい学習フレームワークLTSM-DIFFを提案する。
我々の研究はデータ不足下での時系列解析の新しいパラダイムを確立する。
論文 参考訳(メタデータ) (2026-01-19T06:30:05Z) - UniDiff: A Unified Diffusion Framework for Multimodal Time Series Forecasting [90.47915032778366]
マルチモーダル時系列予測のための統合拡散フレームワークUniDiffを提案する。
コアには統一的で並列な融合モジュールがあり、単一のクロスアテンション機構がタイムスタンプからの構造化情報とテキストからのセマンティックコンテキストを統合する。
8つの領域にわたる実世界のベンチマークデータセットの実験は、提案したUniDiffモデルが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2025-12-08T05:36:14Z) - MAP4TS: A Multi-Aspect Prompting Framework for Time-Series Forecasting with Large Language Models [21.55012962327603]
MAP4TSは、古典的な時系列分析をプロンプト設計に明示的に組み込んだ、新しいマルチアスペクト・プロンプトフレームワークである。
我々のフレームワークでは、データセットレベルのコンテキストを伝達するGlobal Domain Prompt、最近のトレンドとシリーズ固有の振る舞いをエンコードするLocal Domain Prompt、手作りの洞察を埋め込む統計的および時間的Promptという4つの特別なプロンプトコンポーネントを導入しています。
論文 参考訳(メタデータ) (2025-10-27T07:51:54Z) - UniCast: A Unified Multimodal Prompting Framework for Time Series Forecasting [9.836278124939453]
時系列予測は、ファイナンス、ヘルスケア、環境モニタリングといった分野における基本的なタスクである。
既存のモデルは、視覚やテキストなどのリッチなマルチモーダルコンテキストを無視し、実世界のシナリオで時系列データを伴って運用される。
本稿では、TSFMを拡張して時系列、視覚、テキストのモダリティを併用して予測性能を向上する、パラメータ効率の高い新しいマルチモーダルフレームワークUniCastを提案する。
論文 参考訳(メタデータ) (2025-08-16T07:33:27Z) - Adapting LLMs to Time Series Forecasting via Temporal Heterogeneity Modeling and Semantic Alignment [32.41581846555808]
大規模言語モデル(LLM)は、最近、自然言語処理における印象的な能力を実証した。
時間的アライメントのモデル化と意味的アライメントの強化によりLLMに基づく予測を強化する統合フレームワークであるTALONを提案する。
7つの実世界のベンチマークの実験では、TALONはすべてのデータセットで優れたパフォーマンスを達成している。
論文 参考訳(メタデータ) (2025-08-10T06:06:19Z) - Discrete Diffusion in Large Language and Multimodal Models: A Survey [61.86669998363359]
離散拡散言語モデル(dLLMs)と離散拡散多モード言語モデル(dMLLMs)の体系的調査を行う。
自己回帰(AR)モデルとは異なり、dLLMsとdMLLMsはマルチトークンの並列デコーディングパラダイムを採用しており、フルアテンションとデノナイジングに基づく生成戦略を採用している。
我々は、dLLMとdMLLMの歴史的発展を辿り、基礎となる数学的枠組みを定式化し、一般的なモデリング手法を列挙し、代表モデルを分類する。
論文 参考訳(メタデータ) (2025-06-16T17:59:08Z) - ChronoSteer: Bridging Large Language Model and Time Series Foundation Model via Synthetic Data [22.81326423408988]
我々はChronoSteerを紹介した。ChronoSteerはマルチモーダルTSFMであり、テキストのリビジョン命令で操作できる。
クロスモーダルな命令系列ペアデータ不足を軽減するため,合成データに基づく2段階のトレーニング戦略を考案した。
ChronoSteerは、前回の最先端マルチモーダル法よりも25.7%の精度で予測精度が向上し、22.5%も向上した。
論文 参考訳(メタデータ) (2025-05-15T08:37:23Z) - LLM-PS: Empowering Large Language Models for Time Series Forecasting with Temporal Patterns and Semantics [56.99021951927683]
Time Series Forecasting (TSF) は、金融計画や健康モニタリングなど、多くの現実世界のドメインにおいて重要である。
既存のLarge Language Models (LLM) は通常、時系列データ固有の特性を無視するため、非最適に実行する。
時系列データから基本的なtextitPatterns と有意義な textitSemantics を学習し,TLF のための LLM-PS を提案する。
論文 参考訳(メタデータ) (2025-03-12T11:45:11Z) - Time-LLM: Time Series Forecasting by Reprogramming Large Language Models [110.20279343734548]
時系列予測は多くの実世界の力学系において重要な意味を持つ。
時系列予測のための大規模言語モデルを再利用するための再プログラミングフレームワークであるTime-LLMを提案する。
Time-LLMは、最先端の特殊な予測モデルよりも優れた、強力な時系列学習者である。
論文 参考訳(メタデータ) (2023-10-03T01:31:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。