論文の概要: Chronicle: A Multimodal Foundation Model for Joint Language and Time Series Understanding
- arxiv url: http://arxiv.org/abs/2605.20268v1
- Date: Mon, 18 May 2026 21:39:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.252369
- Title: Chronicle: A Multimodal Foundation Model for Joint Language and Time Series Understanding
- Title(参考訳): Chronicle: 共同言語と時系列理解のためのマルチモーダル基礎モデル
- Authors: Paul Quinlan, Jeremy Levasseur, Qingguo Li, Xiaodan Zhu,
- Abstract要約: 自然言語と時系列をスクラッチから学習したコンパクトな324Mパラメータデコーダのみの変換器であるChronicleについて述べる。
我々の知る限り、Chronicleはテキストと時系列をゼロからトレーニングした最初のモデルであり、両方のドメインで専用の基礎モデルに対して評価された最初のマルチモーダルモデルである。
- 参考スコア(独自算出の注目度): 11.063684308771471
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Real-world time series come with text: metadata, descriptions, news, reports. Yet time series foundation models process numerical sequences in isolation, and the multimodal text-and-time-series models that attempt to bridge the two all adapt a pretrained language model post hoc, inheriting representations shaped without ever seeing temporal data. These models are also evaluated almost exclusively against other multimodal baselines, not against the strongest unimodal foundation models in either domain, leaving open whether joint training is needed at all. We present Chronicle, a compact 324M-parameter decoder-only transformer trained from scratch on natural language and time series within a single unified architecture. Both modalities share the same transformer blocks, attention mechanism, and residual stream; the bulk of pretraining uses unimodal batches so cross-modal capability emerges purely from shared parameters, with a short alignment stage that interleaves the two. To our knowledge, Chronicle is the first model jointly pretrained on text and time series from scratch, and the first multimodal model evaluated against dedicated foundation models in both domains. It matches Gemma-3-270M-PT on 19 NLU tasks, sets a new bar for frozen-embedding time series classification on 24 UCR/UEA datasets, and produces multimodal forecasts on Time-MMD that beat every supervised fusion baseline, all from a single backbone.
- Abstract(参考訳): 実世界の時系列には、メタデータ、説明、ニュース、レポートというテキストが付属している。
しかし、時系列基礎モデルは個別に数値列を処理し、2つの橋渡しを試みるマルチモーダル・テキスト・アンド・タイム・シリーズ・モデルは、時間的データを見ることなく形作られた表現を継承し、事前訓練された言語モデルに適応する。
これらのモデルは、他のマルチモーダルベースラインに対してのみ評価され、どちらの領域でも最強のユニモーダル基礎モデルに対してではなく、ジョイントトレーニングが全く必要かどうかを問わない。
本稿では,1つの統一アーキテクチャ内での自然言語と時系列をスクラッチから学習した,コンパクトな324Mパラメータデコーダのみの変換器であるChronicleを紹介する。
両方のモダリティは同じトランスフォーマーブロック、アテンション機構、残ストリームを共有しており、事前訓練の大多数は単調なバッチを使用しており、クロスモーダル能力は共有パラメータから純粋に現れ、その2つをインターリーブする短いアライメントステージを持つ。
我々の知る限り、Chronicleはテキストと時系列をゼロからトレーニングした最初のモデルであり、両方のドメインで専用の基礎モデルに対して評価された最初のマルチモーダルモデルである。
19のNLUタスクでGemma-3-270M-PTにマッチし、24のUCR/UEAデータセットで凍結埋め込み時系列分類のための新しいバーを設定し、単一のバックボーンから全ての制御された核融合ベースラインを打ち負かすTime-MMD上でマルチモーダル予測を生成する。
関連論文リスト
- Empowering Time Series Analysis with Large-Scale Multimodal Pretraining [34.22079919081765]
マルチモーダル・ファンデーション・モデルの構築は次の自然なステップだが、重要な課題に直面している。
時系列解析のための統合型マルチモーダル事前学習パラダイムと大規模マルチモーダルコーパスの欠如
不均一なモジュラリティを効果的に統合し、モデルの一般化を強化する方法。
論文 参考訳(メタデータ) (2026-02-05T13:26:35Z) - UniDiff: A Unified Diffusion Framework for Multimodal Time Series Forecasting [90.47915032778366]
マルチモーダル時系列予測のための統合拡散フレームワークUniDiffを提案する。
コアには統一的で並列な融合モジュールがあり、単一のクロスアテンション機構がタイムスタンプからの構造化情報とテキストからのセマンティックコンテキストを統合する。
8つの領域にわたる実世界のベンチマークデータセットの実験は、提案したUniDiffモデルが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2025-12-08T05:36:14Z) - MoTM: Towards a Foundation Model for Time Series Imputation based on Continuous Modeling [0.764671395172401]
暗黙的ニューラル表現(INR)を活用することでギャップを埋める第一歩を提案する。
MoTMは、それぞれ異なる時系列のファミリーに基づいて独立に訓練されたINRの基底と、推論時に観察された文脈に適応する尾根回帰器を結合する。
多様な計算シナリオにまたがる堅牢なドメイン内一般化とドメイン外一般化を実証する。
論文 参考訳(メタデータ) (2025-07-17T15:16:30Z) - TimesBERT: A BERT-Style Foundation Model for Time Series Understanding [72.64824086839631]
GPTスタイルのモデルは時系列予測の基礎モデルとして位置づけられている。
BERTスタイルのアーキテクチャは時系列理解のために完全にアンロックされていない。
時系列の汎用表現を学ぶために TimesBERT を設計する。
私たちのモデルは、さまざまなドメインにまたがる2600億のタイムポイントで事前トレーニングされています。
論文 参考訳(メタデータ) (2025-02-28T17:14:44Z) - Moirai-MoE: Empowering Time Series Foundation Models with Sparse Mixture of Experts [103.725112190618]
本稿では,単一入出力プロジェクション層を用いたMoirai-MoEを紹介するとともに,多種多様な時系列パターンのモデリングを専門家の疎結合に委ねる。
39のデータセットに対する大規模な実験は、既存の基盤モデルよりも、分配シナリオとゼロショットシナリオの両方において、Moirai-MoEの優位性を実証している。
論文 参考訳(メタデータ) (2024-10-14T13:01:11Z) - Sports-Traj: A Unified Trajectory Generation Model for Multi-Agent Movement in Sports [53.637837706712794]
任意の軌道をマスク入力として処理する統一軌道生成モデルUniTrajを提案する。
具体的には,空間特徴抽出のためのトランスフォーマーエンコーダ内に埋め込まれたゴースト空間マスキング(GSM)モジュールを紹介する。
バスケットボールU,サッカーU,サッカーUの3つの実践的スポーツデータセットをベンチマークして評価を行った。
論文 参考訳(メタデータ) (2024-05-27T22:15:23Z) - UniTS: A Unified Multi-Task Time Series Model [31.675845788410246]
UniTSは、予測タスクと生成タスクを単一のフレームワークに統合した、統合されたマルチタスク時系列モデルである。
UniTSは、人間の活動センサー、ヘルスケア、エンジニアリング、ファイナンスにまたがる38のデータセットでテストされている。
論文 参考訳(メタデータ) (2024-02-29T21:25:58Z) - Unified Training of Universal Time Series Forecasting Transformers [104.56318980466742]
マスク型ユニバーサル時系列予測変換器(モイライ)について述べる。
Moiraiは、新たに導入された大規模オープンタイムシリーズアーカイブ(LOTSA)で訓練されており、9つのドメインで27億以上の観測が行われた。
Moiraiは、フルショットモデルと比較してゼロショットの予測器として、競争力や優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-02-04T20:00:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。