論文の概要: TRACE: A Temporal Conditional Estimation for Multimodal Time Series Foundation Models
- arxiv url: http://arxiv.org/abs/2606.06285v1
- Date: Thu, 04 Jun 2026 15:25:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:44.897571
- Title: TRACE: A Temporal Conditional Estimation for Multimodal Time Series Foundation Models
- Title(参考訳): TRACE:マルチモーダル時系列基礎モデルの時間条件推定
- Authors: Ziwen Kan, Yishuo Chen, Kecheng Li, Andrew Wen, Xiaomeng Wang, Liwei Wang, Jihao Duan, Song Wang, Hongfang Liu, Tianlong Chen,
- Abstract要約: 時系列基礎モデル(TS-FM)は、幅広い下流タスクに適応可能な一般化可能な時間表現を学習することを目的としている。
既存のアプローチは一般的に、単純な命令やマスキング戦略に頼っているが、これはクロスモーダルな依存関係を考慮できない。
本稿では,マルチモーダル時系列基礎モデルパイプラインに対する条件推定パラダイムであるTRACEを提案する。
- 参考スコア(独自算出の注目度): 38.02980231068582
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Time series foundation models (TS-FMs) aim to learn generalizable temporal representations that can be adapted to a wide range of downstream tasks. In real-world multimodal settings, time series are frequently affected by temporal misalignment and partial modality missingness, where different modalities are observed at heterogeneous time scales or are partially absent. Existing approaches typically rely on naive imputation or masking strategies, which fail to account for cross-modal dependencies and often lead to misaligned or degraded representations. We propose TRACE, a conditional estimation paradigm for multimodal time series foundation model pipelines under missingness and irregular sampling, allowing incomplete target modalities to be systematically inferred from available auxiliary modalities. We evaluate TRACE on diverse multimodal benchmarks spanning healthcare and affective computing, including the MIMIC-IV clinical dataset and the CMU-MOSI and CMU-MOSEI benchmarks for multimodal sentiment analysis. Across a range of downstream prediction tasks and missing-modality settings, TRACE consistently outperforms prior multimodal fusion approaches, demonstrating improved robustness to severe modality missingness and more reliable cross-modal representations.
- Abstract(参考訳): 時系列基礎モデル(TS-FM)は、幅広い下流タスクに適応可能な一般化可能な時間表現を学習することを目的としている。
実世界のマルチモーダル環境では、時系列は時間的ミスアライメントと部分的モダリティの欠如によって頻繁に影響を受ける。
既存のアプローチは一般的に、単純な命令やマスキング戦略に頼っているが、これは相互依存を考慮せず、しばしば誤った整合性や劣化した表現につながる。
本研究では,不完全な対象モダリティを,利用可能な補助モダリティから体系的に推定することが可能な多モード時系列基礎モデルパイプラインの条件推定パラダイムであるTRACEを提案する。
我々は、MIMIC-IV臨床データセットやCMU-MOSIおよびCMU-MOSEIベンチマークを含む、医療と情緒的コンピューティングにまたがる多様なマルチモーダル・ベンチマークでTRACEを評価し、マルチモーダル・感情分析を行う。
ダウンストリーム予測タスクやモダリティ設定の欠如を通じて、TRACEは従来からのマルチモーダル融合アプローチを一貫して上回り、厳密なモダリティの欠如とより信頼性の高いクロスモーダル表現に対する堅牢性の向上を実証している。
関連論文リスト
- LIMSSR: LLM-Driven Sequence-to-Score Reasoning under Training-Time Incomplete Multimodal Observations [53.20772659095155]
本稿では、トレーニング時不完全観察において、より困難なIMLの設定に取り組む。
本稿では,この課題を条件付きシーケンス推論タスクとして再構成したLIMSSR(LLM-Driven Incomplete Multimodal Sequence-to-Score Reasoning)を提案する。
論文 参考訳(メタデータ) (2026-05-01T06:11:42Z) - TiMi: Empower Time Series Transformers with Multimodal Mixture of Experts [16.497819301793538]
LLMの因果推論能力を解き放つために,マルチモーダル・ミックス・オブ・エキスパート(TiMi)を用いた時系列変換器を提案する。
因子と時系列の両方をシームレスに予測に統合するために,Multimodal Mixture-of-Experts (MMoE) モジュールを導入する。
論文 参考訳(メタデータ) (2026-02-25T08:51:03Z) - UniDiff: A Unified Diffusion Framework for Multimodal Time Series Forecasting [90.47915032778366]
マルチモーダル時系列予測のための統合拡散フレームワークUniDiffを提案する。
コアには統一的で並列な融合モジュールがあり、単一のクロスアテンション機構がタイムスタンプからの構造化情報とテキストからのセマンティックコンテキストを統合する。
8つの領域にわたる実世界のベンチマークデータセットの実験は、提案したUniDiffモデルが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2025-12-08T05:36:14Z) - Both Text and Images Leaked! A Systematic Analysis of Data Contamination in Multimodal LLM [53.05486269607166]
マルチモーダルな大言語モデル (MLLM) はベンチマーク間で大幅に性能が向上した。
マルチモーダルデータ複雑性とマルチフェーズトレーニングのため,既存のLLM検出手法はMLLMでは不十分である。
我々は分析フレームワークMM-Detectを用いてマルチモーダルデータの汚染を分析する。
論文 参考訳(メタデータ) (2024-11-06T10:44:15Z) - CTPD: Cross-Modal Temporal Pattern Discovery for Enhanced Multimodal Electronic Health Records Analysis [50.56875995511431]
マルチモーダルEHRデータから有意な時間的パターンを効率的に抽出するために,CTPD(Cross-Modal Temporal Pattern Discovery)フレームワークを導入する。
提案手法では,時間的セマンティックな埋め込みを生成するためにスロットアテンションを用いて改良された時間的パターン表現を提案する。
論文 参考訳(メタデータ) (2024-11-01T15:54:07Z) - MTSCI: A Conditional Diffusion Model for Multivariate Time Series Consistent Imputation [41.681869408967586]
主要な研究課題は、どのようにインパルスの整合性を確保するか、すなわち観測値とインパルス値の整合性を確保するかである。
従来の手法は、学習プロセスを導くために、計算対象の帰納的バイアスにのみ依存する。
論文 参考訳(メタデータ) (2024-08-11T10:24:53Z) - Missing Modality Prediction for Unpaired Multimodal Learning via Joint Embedding of Unimodal Models [6.610033827647869]
実世界のシナリオでは、完全なマルチモーダルデータを一貫して取得することは重大な課題である。
これはしばしば、特定のモダリティのデータが欠落しているモダリティの問題につながる。
自己教師型共同埋め込み学習手法を用いて, パラメータ効率のよい未学習モデルの微調整を行う新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-17T14:44:25Z) - Scalable Numerical Embeddings for Multivariate Time Series: Enhancing Healthcare Data Representation Learning [6.635084843592727]
独立トークンとして各特徴値を扱う新しいフレームワークであるSCANEを提案する。
SCANEは、異なる機能埋め込みの特性を正規化し、スケーラブルな埋め込みメカニズムを通じて表現学習を強化する。
本研究は,MTSの精度の高い予測出力を実現するために,nUMerical eMbeddIng Transformer (SUMMIT) を開発した。
論文 参考訳(メタデータ) (2024-05-26T13:06:45Z) - MST-GAT: A Multimodal Spatial-Temporal Graph Attention Network for Time
Series Anomaly Detection [37.1803255271591]
マルチモーダル時系列(MTS)異常検出は,作業機器の安全性と安定性を維持する上で重要である。
近年の深層学習法は異常検出に大きな可能性を示しているが,空間的・時間的関係を明示的に捉えていない。
この問題に対処するためのマルチモーダル時空間グラフアテンションネットワーク(MST-GAT)を提案する。
論文 参考訳(メタデータ) (2023-10-17T11:37:40Z) - Multi-scale Attention Flow for Probabilistic Time Series Forecasting [68.20798558048678]
マルチスケールアテンション正規化フロー(MANF)と呼ばれる非自己回帰型ディープラーニングモデルを提案する。
我々のモデルは累積誤差の影響を回避し、時間の複雑さを増大させない。
本モデルは,多くの多変量データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-05-16T07:53:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。