論文の概要: Compositionality in Time Series: A Proof of Concept using Symbolic Dynamics and Compositional Data Augmentation
- arxiv url: http://arxiv.org/abs/2508.20656v1
- Date: Thu, 28 Aug 2025 11:02:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-29 18:12:02.35513
- Title: Compositionality in Time Series: A Proof of Concept using Symbolic Dynamics and Compositional Data Augmentation
- Title(参考訳): 時系列における構成性:シンボリックダイナミクスと合成データ拡張を用いた概念の証明
- Authors: Michael Hagmann, Michael Staniek, Stefan Riezler,
- Abstract要約: 本研究は、自然現象の時系列が、体系的および規則的な方法で順序付けられた潜在状態の列によって生成されると理解できるかどうかを考察する。
本研究は,臨床時系列に焦点をあて,臨床測定が系統的原則に従っている有意義な生理的状態によって生成されると解釈できるかどうかを問う。
- 参考スコア(独自算出の注目度): 7.237068561453081
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This work investigates whether time series of natural phenomena can be understood as being generated by sequences of latent states which are ordered in systematic and regular ways. We focus on clinical time series and ask whether clinical measurements can be interpreted as being generated by meaningful physiological states whose succession follows systematic principles. Uncovering the underlying compositional structure will allow us to create synthetic data to alleviate the notorious problem of sparse and low-resource data settings in clinical time series forecasting, and deepen our understanding of clinical data. We start by conceptualizing compositionality for time series as a property of the data generation process, and then study data-driven procedures that can reconstruct the elementary states and composition rules of this process. We evaluate the success of this methods using two empirical tests originating from a domain adaptation perspective. Both tests infer the similarity of the original time series distribution and the synthetic time series distribution from the similarity of expected risk of time series forecasting models trained and tested on original and synthesized data in specific ways. Our experimental results show that the test set performance achieved by training on compositionally synthesized data is comparable to training on original clinical time series data, and that evaluation of models on compositionally synthesized test data shows similar results to evaluating on original test data, outperforming randomization-based data augmentation. An additional downstream evaluation of the prediction task of sequential organ failure assessment (SOFA) scores shows significant performance gains when model training is entirely based on compositionally synthesized data compared to training on original data.
- Abstract(参考訳): 本研究は、自然現象の時系列が、体系的および規則的な方法で順序付けられた潜在状態の列によって生成されると理解できるかどうかを考察する。
本研究は,臨床時系列に焦点をあて,臨床測定が系統的原則に従っている有意義な生理的状態によって生成されると解釈できるかどうかを問う。
基礎となる構成構造を明らかにすることで,臨床時系列予測におけるスパースおよび低リソースデータ設定の悪名高い問題を緩和し,臨床データの理解を深めるため,合成データを作成することができる。
まず、時系列の合成性をデータ生成プロセスの特性として概念化し、そのプロセスの基本的な状態と構成規則を再構築するデータ駆動の手順を研究する。
ドメイン適応の観点から2つの経験的テストを用いて,本手法の有効性を評価する。
どちらのテストも、オリジナルの時系列分布と合成時系列分布の類似性を予測し、特定の方法でオリジナルのデータや合成データに基づいてトレーニングおよびテストされた時系列予測モデルの予測リスクの類似性から推定する。
実験結果から, 合成データを用いたトレーニングによって達成されるテストセット性能は, オリジナルの臨床時系列データによるトレーニングに匹敵するものであり, 合成データを用いたモデルの評価は, 原試験データによる評価と類似した結果を示し, 乱数化に基づくデータ拡張よりも優れていた。
逐次臓器不全評価(SOFA)スコアの予測タスクの下流でのさらなる評価は、モデルトレーニングがオリジナルのデータによるトレーニングに比べて完全に合成されたデータに基づいている場合、顕著なパフォーマンス向上を示す。
関連論文リスト
- Independent Component Discovery in Temporal Count Data [46.526610368455096]
本稿では、時間数データの独立成分分析のための生成フレームワークを導入し、レギュラー適応力学とポアソン対数正規放出を組み合わせた。
このモデルは、状態に依存したコントリビューションで絡み合ったコンポーネントを特定し、表現学習と摂動解析を可能にする。
論文 参考訳(メタデータ) (2026-01-29T13:30:10Z) - Self-Supervised Dynamical System Representations for Physiological Time-Series [24.669317615791343]
生理的時系列のための自己教師付き学習(SSL)は、非関連ノイズを除去しながら、基礎となる生理的状態に関する情報を保存するための事前訓練対象の能力に依存する。
本稿では,複数の時系列にまたがる動的システム生成モデルの情報構造を利用した事前学習フレームワークを提案する。
このフレームワークは,類似した時系列サンプル間で共有されるシステムパラメータに関連する生成変数に関する情報を抽出することにより,クラスアイデンティティを効率的に取得できるという,私たちのキーとなる洞察を明らかにする。
PULSEは、生理学的時系列データセットのためのクロスコンストラクションに基づく事前学習対象であり、非参照型サンプルを捨てながら、システム情報を明示的に抽出する。
論文 参考訳(メタデータ) (2025-11-28T22:53:31Z) - Limits of Generative Pre-Training in Structured EMR Trajectories with Irregular Sampling [0.7537475180985093]
ファンデーションモデルは、複雑なパターンやモチーフをキャプチャするために自動回帰事前トレーニングを使用して、広大なデータセットでトレーニングされたアーキテクチャを指す。
HIVおよび急性低血圧データセットの経時的ART(Sequence-to-Sequence LSTM)とTransformer(reduced Transformer)の2つの自己回帰モデル(Sequence-to-Sequence LSTM)をトレーニングした。
ランダムな視線間ギャップを介してトレーニング中に制御された不規則性が追加されたが、テストシーケンスは完了しなかった。
どちらも特徴分布を再現したが、クロスフィーチャー構造を保存できなかった。
論文 参考訳(メタデータ) (2025-10-27T00:04:17Z) - Improving the Generation and Evaluation of Synthetic Data for Downstream Medical Causal Inference [89.5628648718851]
因果推論は医療介入の開発と評価に不可欠である。
現実の医療データセットは、規制障壁のためアクセスが難しいことが多い。
本稿では,医学における治療効果分析のための新しい合成データ生成法STEAMを提案する。
論文 参考訳(メタデータ) (2025-10-21T16:16:00Z) - CondTSF: One-line Plugin of Dataset Condensation for Time Series Forecasting [22.473436770730657]
データセット凝縮の目的は、合成データセットでトレーニングされたモデルが、完全なデータセットでトレーニングされたモデルと互換性を持って動作できることを保証することである。
分類において、合成データは、全データセットで訓練されたモデルと合成データセットで訓練されたモデルが同じ入力に対して同一のラベルを生成する場合、よく蒸留されると考えられる。
TS予測において, 合成データ蒸留の有効性は, モデル間の距離によって決定される。
論文 参考訳(メタデータ) (2024-06-04T09:18:20Z) - TimeSiam: A Pre-Training Framework for Siamese Time-Series Modeling [67.02157180089573]
時系列事前トレーニングは、最近、ラベルのコストを削減し、下流の様々なタスクに利益をもたらす可能性があるとして、広く注目を集めている。
本稿では,シームズネットワークに基づく時系列の簡易かつ効果的な自己教師型事前学習フレームワークとしてTimeSiamを提案する。
論文 参考訳(メタデータ) (2024-02-04T13:10:51Z) - T-Phenotype: Discovering Phenotypes of Predictive Temporal Patterns in
Disease Progression [82.85825388788567]
我々は、ラベル付き時系列データから予測時相パターンの表現型を発見するために、新しい時間的クラスタリング手法T-Phenotypeを開発した。
T-フェノタイプは, 評価ベースラインのすべてに対して, 最良の表現型発見性能を示す。
論文 参考訳(メタデータ) (2023-02-24T13:30:35Z) - Conformal Prediction Under Feedback Covariate Shift for Biomolecular Design [56.86533144730384]
本稿では,トレーニングデータとテストデータが統計的に依存した環境での予測不確実性を定量化する手法を提案する。
モチベーション・ユースケースとして,本手法が設計したタンパク質の適合性予測の不確かさを定量化する方法を実データで示す。
論文 参考訳(メタデータ) (2022-02-08T02:59:12Z) - TACTiS: Transformer-Attentional Copulas for Time Series [76.71406465526454]
時間変化量の推定は、医療や金融などの分野における意思決定の基本的な構成要素である。
本稿では,アテンションベースデコーダを用いて関節分布を推定する多元的手法を提案する。
本研究では,本モデルが実世界の複数のデータセットに対して最先端の予測を生成することを示す。
論文 参考訳(メタデータ) (2022-02-07T21:37:29Z) - Towards Synthetic Multivariate Time Series Generation for Flare
Forecasting [5.098461305284216]
データ駆動・レアイベント予測アルゴリズムのトレーニングにおける制限要因の1つは、関心のあるイベントの不足である。
本研究では,データインフォームド・オーバーサンプリングを行う手段として,条件付き生成逆数ネットワーク(CGAN)の有用性を検討する。
論文 参考訳(メタデータ) (2021-05-16T22:23:23Z) - Estimating Individual Treatment Effects with Time-Varying Confounders [9.784193264717098]
医療において、観察データから個別治療効果(ITE)を推定することは意義があり実用的である。
既存の作業は主に、隠れた共同設立者が存在しないという強い無知の仮定に依存している。
時系列重み付け (DSW) を用いて, ITE の時間変化を推定する手法を提案する。
論文 参考訳(メタデータ) (2020-08-27T02:21:56Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。