論文の概要: Imputing Missing Observations with Time Sliced Synthetic Minority
Oversampling Technique
- arxiv url: http://arxiv.org/abs/2201.05634v1
- Date: Fri, 14 Jan 2022 19:23:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-19 14:44:37.291813
- Title: Imputing Missing Observations with Time Sliced Synthetic Minority
Oversampling Technique
- Title(参考訳): 時間スライス合成マイノリティオーバーサンプリング法による欠落観測の示唆
- Authors: Andrew Baumgartner, Sevda Molani, Qi Wei and Jennifer Hadlock
- Abstract要約: 本稿では,データセット内の各サンプルに対して均一な不規則な時系列を構成することを目的とした,単純かつ斬新な時系列計算手法を提案する。
我々は、観測時間の重複しないビン(「スライス」と呼ばれる)の中間点で定義される格子を固定し、各サンプルが所定の時間にすべての特徴に対して値を持つことを保証する。
これにより、完全に欠落した観察をインプットし、データ全体の時系列の均一な分類を可能にし、特別な場合には個々の欠落した特徴をインプットすることができる。
- 参考スコア(独自算出の注目度): 0.3973560285628012
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present a simple yet novel time series imputation technique with the goal
of constructing an irregular time series that is uniform across every sample in
a data set. Specifically, we fix a grid defined by the midpoints of
non-overlapping bins (dubbed "slices") of observation times and ensure that
each sample has values for all of the features at that given time. This allows
one to both impute fully missing observations to allow uniform time series
classification across the entire data and, in special cases, to impute
individually missing features. To do so, we slightly generalize the well-known
class imbalance algorithm SMOTE \cite{smote} to allow component wise nearest
neighbor interpolation that preserves correlations when there are no missing
features. We visualize the method in the simplified setting of 2-dimensional
uncoupled harmonic oscillators. Next, we use tSMOTE to train an Encoder/Decoder
long-short term memory (LSTM) model with Logistic Regression for predicting and
classifying distinct trajectories of different 2D oscillators. After
illustrating the the utility of tSMOTE in this context, we use the same
architecture to train a clinical model for COVID-19 disease severity on an
imputed data set. Our experiments show an improvement over standard mean and
median imputation techniques by allowing a wider class of patient trajectories
to be recognized by the model, as well as improvement over aggregated
classification models.
- Abstract(参考訳): 本稿では,データセットの各サンプルに対して均一な不規則時系列を構築することを目的とした,単純かつ新しい時系列インプテーション手法を提案する。
具体的には、観察時間の重複しないビン(スライス)の中間点で定義されたグリッドを修正し、各サンプルが所定の時間にすべての機能に対して値を持つことを保証する。
これにより、完全に欠落した観察をインプットし、データ全体の時系列の均一な分類を可能にし、特別な場合には個々の欠落した特徴をインプットすることができる。
そのため、よく知られたクラス不均衡アルゴリズムであるSMOTE \cite{smote} を少し一般化し、欠落した特徴が存在しない場合に相関を保ったコンポーネントワイズ近傍補間を可能にする。
2次元非結合高調波発振器の簡易設定でこの手法を可視化した。
次に、tSMOTEを用いて、異なる2次元発振器の異なる軌跡を予測・分類するために、ロジスティック回帰を用いてエンコーダ/デコーダ長短項メモリ(LSTM)モデルを訓練する。
この文脈で tSMOTE の有用性を説明した後、我々は同じアーキテクチャを用いて、インプットされたデータセット上で、COVID-19 病重症度に関する臨床モデルを訓練する。
本実験は, 患者軌跡のより広いクラスをモデルに認識させることにより, 標準的な平均値と中央値の計算手法の改善, および集約分類モデルの改善を示す。
関連論文リスト
- Graph Spatiotemporal Process for Multivariate Time Series Anomaly
Detection with Missing Values [67.76168547245237]
本稿では,グラフ時間過程と異常スコアラを用いて異常を検出するGST-Proという新しいフレームワークを提案する。
実験結果から,GST-Pro法は時系列データ中の異常を効果的に検出し,最先端の手法より優れていることがわかった。
論文 参考訳(メタデータ) (2024-01-11T10:10:16Z) - Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。
I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文 参考訳(メタデータ) (2023-08-31T05:05:53Z) - TSI-GAN: Unsupervised Time Series Anomaly Detection using Convolutional
Cycle-Consistent Generative Adversarial Networks [2.4469484645516837]
異常検出は、ネットワーク侵入検知、自律運転、診断、クレジットカード詐欺などに広く用いられている。
本稿では、複雑な時間パターンを自動的に学習できる時系列の教師なし異常検出モデルであるTSI-GANを提案する。
提案手法は,250個の高度・厳密なデータセットを用いてTSI-GANを評価し,最先端の8つのベースライン手法と比較した。
論文 参考訳(メタデータ) (2023-03-22T23:24:47Z) - Mutual Exclusivity Training and Primitive Augmentation to Induce
Compositionality [84.94877848357896]
最近のデータセットは、標準的なシーケンス・ツー・シーケンスモデルにおける体系的な一般化能力の欠如を露呈している。
本稿では,セq2seqモデルの振る舞いを分析し,相互排他バイアスの欠如と全例を記憶する傾向の2つの要因を同定する。
広範に使用されている2つの構成性データセット上で、標準的なシーケンス・ツー・シーケンスモデルを用いて、経験的改善を示す。
論文 参考訳(メタデータ) (2022-11-28T17:36:41Z) - Tripletformer for Probabilistic Interpolation of Irregularly sampled
Time Series [6.579888565581481]
本稿では,不規則なサンプル時間列の確率的推定のために,"Tripletformer"と呼ばれる新しいエンコーダデコーダアーキテクチャを提案する。
この注意に基づくモデルは、各要素が三重時間、チャネル、および値からなる観測セットで動作する。
その結果,実世界のデータセットでは最大32%,合成データセットでは85%の負の対数誤差が改善された。
論文 参考訳(メタデータ) (2022-10-05T08:31:05Z) - Stacked Residuals of Dynamic Layers for Time Series Anomaly Detection [0.0]
多変量時系列における異常検出を行うために,終端から終端までの微分可能なニューラルネットワークアーキテクチャを提案する。
このアーキテクチャは、信号の線形予測可能なコンポーネントを分離するために設計された動的システムのカスケードである。
異常検出器は、予測残差の時間的構造を利用して、孤立した点異常とセットポイントの変化の両方を検出する。
論文 参考訳(メタデータ) (2022-02-25T01:50:22Z) - Anomaly Detection of Time Series with Smoothness-Inducing Sequential
Variational Auto-Encoder [59.69303945834122]
Smoothness-Inducing Sequential Variational Auto-Encoder (SISVAE) モデルを提案する。
我々のモデルは、フレキシブルニューラルネットワークを用いて各タイムスタンプの平均と分散をパラメータ化する。
合成データセットと公開実世界のベンチマークの両方において,本モデルの有効性を示す。
論文 参考訳(メタデータ) (2021-02-02T06:15:15Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - Learning from Irregularly-Sampled Time Series: A Missing Data
Perspective [18.493394650508044]
不規則にサンプリングされた時系列は、医療を含む多くの領域で発生する。
連続だが観測されていない関数からサンプリングされた指数値対の列として、不規則にサンプリングされた時系列データをモデル化する。
本稿では,変分オートエンコーダと生成対向ネットワークに基づく学習手法を提案する。
論文 参考訳(メタデータ) (2020-08-17T20:01:55Z) - Unsupervised Online Anomaly Detection On Irregularly Sampled Or Missing
Valued Time-Series Data Using LSTM Networks [0.0]
異常検出について検討し,変長,不規則なサンプルシーケンス,あるいは欠落した値を含むシーケンスを処理するアルゴリズムを提案する。
しかし,本アルゴリズムは完全に教師なしであり,教師付きあるいは半教師付きケースに容易に拡張できる。
論文 参考訳(メタデータ) (2020-05-25T09:41:04Z) - Convolutional Tensor-Train LSTM for Spatio-temporal Learning [116.24172387469994]
本稿では,ビデオシーケンスの長期相関を効率的に学習できる高次LSTMモデルを提案する。
これは、時間をかけて畳み込み特徴を組み合わせることによって予測を行う、新しいテンソルトレインモジュールによって達成される。
この結果は,幅広いアプリケーションやデータセットにおいて,最先端のパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2020-02-21T05:00:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。