論文の概要: Compositionality in Time Series: A Proof of Concept using Symbolic Dynamics and Compositional Data Augmentation
- arxiv url: http://arxiv.org/abs/2508.20656v1
- Date: Thu, 28 Aug 2025 11:02:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-29 18:12:02.35513
- Title: Compositionality in Time Series: A Proof of Concept using Symbolic Dynamics and Compositional Data Augmentation
- Title(参考訳): 時系列における構成性:シンボリックダイナミクスと合成データ拡張を用いた概念の証明
- Authors: Michael Hagmann, Michael Staniek, Stefan Riezler,
- Abstract要約: 本研究は、自然現象の時系列が、体系的および規則的な方法で順序付けられた潜在状態の列によって生成されると理解できるかどうかを考察する。
本研究は,臨床時系列に焦点をあて,臨床測定が系統的原則に従っている有意義な生理的状態によって生成されると解釈できるかどうかを問う。
- 参考スコア(独自算出の注目度): 7.237068561453081
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This work investigates whether time series of natural phenomena can be understood as being generated by sequences of latent states which are ordered in systematic and regular ways. We focus on clinical time series and ask whether clinical measurements can be interpreted as being generated by meaningful physiological states whose succession follows systematic principles. Uncovering the underlying compositional structure will allow us to create synthetic data to alleviate the notorious problem of sparse and low-resource data settings in clinical time series forecasting, and deepen our understanding of clinical data. We start by conceptualizing compositionality for time series as a property of the data generation process, and then study data-driven procedures that can reconstruct the elementary states and composition rules of this process. We evaluate the success of this methods using two empirical tests originating from a domain adaptation perspective. Both tests infer the similarity of the original time series distribution and the synthetic time series distribution from the similarity of expected risk of time series forecasting models trained and tested on original and synthesized data in specific ways. Our experimental results show that the test set performance achieved by training on compositionally synthesized data is comparable to training on original clinical time series data, and that evaluation of models on compositionally synthesized test data shows similar results to evaluating on original test data, outperforming randomization-based data augmentation. An additional downstream evaluation of the prediction task of sequential organ failure assessment (SOFA) scores shows significant performance gains when model training is entirely based on compositionally synthesized data compared to training on original data.
- Abstract(参考訳): 本研究は、自然現象の時系列が、体系的および規則的な方法で順序付けられた潜在状態の列によって生成されると理解できるかどうかを考察する。
本研究は,臨床時系列に焦点をあて,臨床測定が系統的原則に従っている有意義な生理的状態によって生成されると解釈できるかどうかを問う。
基礎となる構成構造を明らかにすることで,臨床時系列予測におけるスパースおよび低リソースデータ設定の悪名高い問題を緩和し,臨床データの理解を深めるため,合成データを作成することができる。
まず、時系列の合成性をデータ生成プロセスの特性として概念化し、そのプロセスの基本的な状態と構成規則を再構築するデータ駆動の手順を研究する。
ドメイン適応の観点から2つの経験的テストを用いて,本手法の有効性を評価する。
どちらのテストも、オリジナルの時系列分布と合成時系列分布の類似性を予測し、特定の方法でオリジナルのデータや合成データに基づいてトレーニングおよびテストされた時系列予測モデルの予測リスクの類似性から推定する。
実験結果から, 合成データを用いたトレーニングによって達成されるテストセット性能は, オリジナルの臨床時系列データによるトレーニングに匹敵するものであり, 合成データを用いたモデルの評価は, 原試験データによる評価と類似した結果を示し, 乱数化に基づくデータ拡張よりも優れていた。
逐次臓器不全評価(SOFA)スコアの予測タスクの下流でのさらなる評価は、モデルトレーニングがオリジナルのデータによるトレーニングに比べて完全に合成されたデータに基づいている場合、顕著なパフォーマンス向上を示す。
関連論文リスト
- CondTSF: One-line Plugin of Dataset Condensation for Time Series Forecasting [22.473436770730657]
データセット凝縮の目的は、合成データセットでトレーニングされたモデルが、完全なデータセットでトレーニングされたモデルと互換性を持って動作できることを保証することである。
分類において、合成データは、全データセットで訓練されたモデルと合成データセットで訓練されたモデルが同じ入力に対して同一のラベルを生成する場合、よく蒸留されると考えられる。
TS予測において, 合成データ蒸留の有効性は, モデル間の距離によって決定される。
論文 参考訳(メタデータ) (2024-06-04T09:18:20Z) - TimeSiam: A Pre-Training Framework for Siamese Time-Series Modeling [67.02157180089573]
時系列事前トレーニングは、最近、ラベルのコストを削減し、下流の様々なタスクに利益をもたらす可能性があるとして、広く注目を集めている。
本稿では,シームズネットワークに基づく時系列の簡易かつ効果的な自己教師型事前学習フレームワークとしてTimeSiamを提案する。
論文 参考訳(メタデータ) (2024-02-04T13:10:51Z) - T-Phenotype: Discovering Phenotypes of Predictive Temporal Patterns in
Disease Progression [82.85825388788567]
我々は、ラベル付き時系列データから予測時相パターンの表現型を発見するために、新しい時間的クラスタリング手法T-Phenotypeを開発した。
T-フェノタイプは, 評価ベースラインのすべてに対して, 最良の表現型発見性能を示す。
論文 参考訳(メタデータ) (2023-02-24T13:30:35Z) - Conformal Prediction Under Feedback Covariate Shift for Biomolecular Design [56.86533144730384]
本稿では,トレーニングデータとテストデータが統計的に依存した環境での予測不確実性を定量化する手法を提案する。
モチベーション・ユースケースとして,本手法が設計したタンパク質の適合性予測の不確かさを定量化する方法を実データで示す。
論文 参考訳(メタデータ) (2022-02-08T02:59:12Z) - TACTiS: Transformer-Attentional Copulas for Time Series [76.71406465526454]
時間変化量の推定は、医療や金融などの分野における意思決定の基本的な構成要素である。
本稿では,アテンションベースデコーダを用いて関節分布を推定する多元的手法を提案する。
本研究では,本モデルが実世界の複数のデータセットに対して最先端の予測を生成することを示す。
論文 参考訳(メタデータ) (2022-02-07T21:37:29Z) - Towards Synthetic Multivariate Time Series Generation for Flare
Forecasting [5.098461305284216]
データ駆動・レアイベント予測アルゴリズムのトレーニングにおける制限要因の1つは、関心のあるイベントの不足である。
本研究では,データインフォームド・オーバーサンプリングを行う手段として,条件付き生成逆数ネットワーク(CGAN)の有用性を検討する。
論文 参考訳(メタデータ) (2021-05-16T22:23:23Z) - Estimating Individual Treatment Effects with Time-Varying Confounders [9.784193264717098]
医療において、観察データから個別治療効果(ITE)を推定することは意義があり実用的である。
既存の作業は主に、隠れた共同設立者が存在しないという強い無知の仮定に依存している。
時系列重み付け (DSW) を用いて, ITE の時間変化を推定する手法を提案する。
論文 参考訳(メタデータ) (2020-08-27T02:21:56Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。