論文の概要: UniDiff: A Unified Diffusion Framework for Multimodal Time Series Forecasting
- arxiv url: http://arxiv.org/abs/2512.07184v1
- Date: Mon, 08 Dec 2025 05:36:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-09 22:03:54.720843
- Title: UniDiff: A Unified Diffusion Framework for Multimodal Time Series Forecasting
- Title(参考訳): UniDiff:マルチモーダル時系列予測のための統一拡散フレームワーク
- Authors: Da Zhang, Bingyu Li, Zhuyuan Zhao, Junyu Gao, Feiping Nie, Xuelong Li,
- Abstract要約: マルチモーダル時系列予測のための統合拡散フレームワークUniDiffを提案する。
コアには統一的で並列な融合モジュールがあり、単一のクロスアテンション機構がタイムスタンプからの構造化情報とテキストからのセマンティックコンテキストを統合する。
8つの領域にわたる実世界のベンチマークデータセットの実験は、提案したUniDiffモデルが最先端のパフォーマンスを達成することを示す。
- 参考スコア(独自算出の注目度): 90.47915032778366
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As multimodal data proliferates across diverse real-world applications, leveraging heterogeneous information such as texts and timestamps for accurate time series forecasting (TSF) has become a critical challenge. While diffusion models demonstrate exceptional performance in generation tasks, their application to TSF remains largely confined to modeling single-modality numerical sequences, overlooking the abundant cross-modal signals inherent in complex heterogeneous data. To address this gap, we propose UniDiff, a unified diffusion framework for multimodal time series forecasting. To process the numerical sequence, our framework first tokenizes the time series into patches, preserving local temporal dynamics by mapping each patch to an embedding space via a lightweight MLP. At its core lies a unified and parallel fusion module, where a single cross-attention mechanism adaptively weighs and integrates structural information from timestamps and semantic context from texts in one step, enabling a flexible and efficient interplay between modalities. Furthermore, we introduce a novel classifier-free guidance mechanism designed for multi-source conditioning, allowing for decoupled control over the guidance strength of textual and temporal information during inference, which significantly enhances model robustness. Extensive experiments on real-world benchmark datasets across eight domains demonstrate that the proposed UniDiff model achieves state-of-the-art performance.
- Abstract(参考訳): マルチモーダルデータが様々な現実世界のアプリケーションにまたがって普及するにつれて、テキストやタイムスタンプなどの異種情報を正確な時系列予測(TSF)に活用することが重要な課題となっている。
拡散モデルは、生成タスクにおいて例外的な性能を示すが、TSFへの適用は、複雑な異種データに固有の豊富なクロスモーダル信号を見越して、単一モードの数値列のモデリングに限られている。
このギャップに対処するため,マルチモーダル時系列予測のための統合拡散フレームワークUniDiffを提案する。
この数値列を処理するために、我々はまず時系列をパッチにトークン化し、各パッチを軽量MLPを介して埋め込み空間にマッピングすることで、局所的時間的ダイナミクスを保存する。
1つのクロスアテンション機構は、1ステップでタイムスタンプからの構造情報とテキストからのセマンティックコンテキストを適応的に重み付け、統合し、モダリティ間の柔軟で効率的な相互作用を可能にする。
さらに,マルチソースコンディショニング用に設計された新しい分類器フリー誘導機構を導入し,推論中のテキスト情報と時間情報のガイダンス強度を分離制御することにより,モデルロバスト性を大幅に向上させる。
8つの領域にわたる実世界のベンチマークデータセットに対する大規模な実験は、提案したUniDiffモデルが最先端のパフォーマンスを達成することを実証している。
関連論文リスト
- JointDiff: Bridging Continuous and Discrete in Multi-Agent Trajectory Generation [75.58351043849385]
生成モデルは、しばしば連続したデータと離散的なイベントを別々のプロセスとして扱う。
このギャップを埋めるために、連続時間データと同期離散イベントを同時に生成してこれらの2つのプロセス間の相互作用を設計した新しい拡散フレームワークであるJointDiffを導入する。
JointDiffは最先端のパフォーマンスを実現し、インタラクティブシステムのための現実的で制御可能なモデルを構築するために、ジョイントモデリングが不可欠であることを実証している。
論文 参考訳(メタデータ) (2025-09-26T16:04:00Z) - TIMED: Adversarial and Autoregressive Refinement of Diffusion-Based Time Series Generation [0.31498833540989407]
TIMEDは、フォワード-リバース拡散プロセスを通じてグローバル構造をキャプチャする統合生成フレームワークである。
特徴空間における実および合成分布をさらに整合させるため、TIMEDは最大平均離散性(MMD)損失を取り入れている。
我々は、TIMEDが最先端の生成モデルよりも現実的で時間的に一貫性のあるシーケンスを生成することを示す。
論文 参考訳(メタデータ) (2025-09-23T23:05:40Z) - UniCast: A Unified Multimodal Prompting Framework for Time Series Forecasting [9.836278124939453]
時系列予測は、ファイナンス、ヘルスケア、環境モニタリングといった分野における基本的なタスクである。
既存のモデルは、視覚やテキストなどのリッチなマルチモーダルコンテキストを無視し、実世界のシナリオで時系列データを伴って運用される。
本稿では、TSFMを拡張して時系列、視覚、テキストのモダリティを併用して予測性能を向上する、パラメータ効率の高い新しいマルチモーダルフレームワークUniCastを提案する。
論文 参考訳(メタデータ) (2025-08-16T07:33:27Z) - FindRec: Stein-Guided Entropic Flow for Multi-Modal Sequential Recommendation [57.577843653775]
textbfFindRec (textbfFlexible unified textbfinformation textbfdisentanglement for multi-modal sequence textbfRecommendation)を提案する。
Stein kernel-based Integrated Information Coordination Module (IICM) は理論上、マルチモーダル特徴とIDストリーム間の分散一貫性を保証する。
マルチモーダル特徴を文脈的関連性に基づいて適応的にフィルタリング・結合するクロスモーダル・エキスパート・ルーティング機構。
論文 参考訳(メタデータ) (2025-07-07T04:09:45Z) - Multimodal Conditioned Diffusive Time Series Forecasting [16.72476672866356]
時系列予測(TSF)のためのマルチモーダル条件付き拡散モデルを提案する。
タイムスタンプとテキストを組み合わせて、異なるデータポイント間の時間的および意味的な相関を確立する。
実世界のベンチマークデータセットの実験では、提案したMCD-TSFモデルが最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2025-04-28T10:56:23Z) - LAST SToP For Modeling Asynchronous Time Series [19.401463051705377]
Asynchronous Time Series に合わせたLarge Language Models (LLM) のための新しいプロンプト設計を提案する。
我々のアプローチはイベント記述のリッチな自然言語を効果的に活用し、LLMはさまざまなドメインやタスクをまたがる推論において、広範囲にわたる知識の恩恵を受けることができる。
さらに、モデル性能を大幅に向上させる新しいプロンプトチューニング機構であるSoft Promptingを導入し、QLoRAのような既存の微調整方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-02-04T01:42:45Z) - TimeDiT: General-purpose Diffusion Transformers for Time Series Foundation Model [11.281386703572842]
TimeDiTは時間依存性学習と確率的サンプリングを組み合わせた拡散トランスフォーマーモデルである。
TimeDiTは、さまざまなタスクにわたるトレーニングと推論プロセスを調和させるために、統一的なマスキングメカニズムを採用している。
我々の体系的評価は、ゼロショット/ファインチューニングによる予測と計算という基本的なタスクにおいて、TimeDiTの有効性を示す。
論文 参考訳(メタデータ) (2024-09-03T22:31:57Z) - SOFTS: Efficient Multivariate Time Series Forecasting with Series-Core Fusion [59.96233305733875]
時系列予測は、金融、交通管理、エネルギー、医療など様々な分野で重要な役割を果たしている。
いくつかの方法は、注意やミキサーのようなメカニズムを利用して、チャネル相関をキャプチャすることでこの問題に対処する。
本稿では,効率的なモデルであるSOFTS(Series-cOre Fused Time Series forecaster)を提案する。
論文 参考訳(メタデータ) (2024-04-22T14:06:35Z) - Multi-scale Attention Flow for Probabilistic Time Series Forecasting [68.20798558048678]
マルチスケールアテンション正規化フロー(MANF)と呼ばれる非自己回帰型ディープラーニングモデルを提案する。
我々のモデルは累積誤差の影響を回避し、時間の複雑さを増大させない。
本モデルは,多くの多変量データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-05-16T07:53:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。