論文の概要: Hinge-FM2I: An Approach using Image Inpainting for Interpolating Missing Data in Univariate Time Series
- arxiv url: http://arxiv.org/abs/2406.06631v1
- Date: Sat, 8 Jun 2024 17:52:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-12 20:54:41.194366
- Title: Hinge-FM2I: An Approach using Image Inpainting for Interpolating Missing Data in Univariate Time Series
- Title(参考訳): Hinge-FM2I:一様時系列における欠測データの補間に画像インペインティングを用いるアプローチ
- Authors: Noufel Saad, Maaroufi Nadir, Najib Mehdi, Bakhouya Mohamed,
- Abstract要約: 時系列予測は、交通管理、電力消費、医療など様々な用途に不可欠である。
データ品質に関する一般的な問題のひとつは、欠落データと呼ばれるデータポイントの欠如である。
本稿では,欠落データを扱う新しい手法であるHinge-FM2Iを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate time series forecasts are crucial for various applications, such as traffic management, electricity consumption, and healthcare. However, limitations in models and data quality can significantly impact forecasts accuracy. One common issue with data quality is the absence of data points, referred to as missing data. It is often caused by sensor malfunctions, equipment failures, or human errors. This paper proposes Hinge-FM2I, a novel method for handling missing data values in univariate time series data. Hinge-FM2I builds upon the strengths of the Forecasting Method by Image Inpainting (FM2I). FM2I has proven effective, but selecting the most accurate forecasts remain a challenge. To overcome this issue, we proposed a selection algorithm. Inspired by door hinges, Hinge-FM2I drops a data point either before or after the gap (left/right-hinge), then use FM2I for imputation, and then select the imputed gap based on the lowest error of the dropped data point. Hinge-FM2I was evaluated on a comprehensive sample composed of 1356 time series, extracted from the M3 competition benchmark dataset, with missing value rates ranging from 3.57\% to 28.57\%. Experimental results demonstrate that Hinge-FM2I significantly outperforms established methods such as, linear/spline interpolation, K-Nearest Neighbors (K-NN), and ARIMA. Notably, Hinge-FM2I achieves an average Symmetric Mean Absolute Percentage Error (sMAPE) score of 5.6\% for small gaps, and up to 10\% for larger ones. These findings highlight the effectiveness of Hinge-FM2I as a promising new method for addressing missing values in univariate time series data.
- Abstract(参考訳): 正確な時系列予測は、交通管理、電力消費、医療など様々な用途に欠かせない。
しかし、モデルとデータ品質の制限は予測精度に大きな影響を及ぼす可能性がある。
データ品質に関する一般的な問題のひとつは、欠落データと呼ばれるデータポイントの欠如である。
しばしば、センサーの故障、機器の故障、ヒューマンエラーによって引き起こされる。
本稿では,一変量時系列データの欠落データを扱う新しい手法であるHinge-FM2Iを提案する。
Hinge-FM2I は Image Inpainting (FM2I) による予測手法の強みに基づいている。
FM2Iは有効であることが証明されているが、最も正確な予測を選択することは依然として困難である。
この問題を克服するため,我々は選択アルゴリズムを提案した。
ドアヒンジにインスパイアされたHinge-FM2Iは、ギャップ(左/右ヒンジ)の前後にデータポイントをドロップし、インプットにFM2Iを使用し、ドロップしたデータポイントの最も低いエラーに基づいてインプットされたギャップを選択する。
Hinge-FM2Iは、M3競合ベンチマークデータセットから抽出された1356の時系列からなる総合的なサンプルで評価され、値の欠落は3.57\%から28.57\%であった。
実験結果から,Hinge-FM2Iは線形/スプライン補間,K-Nearest Neighbors(K-NN),ARIMAといった確立された手法よりも優れていた。
特に、Hinge-FM2Iは、SMAPE(Symmetric Mean Absolute Percentage Error)スコアが5.6\%、大きいものは10\%に達する。
これらの結果から,単変量時系列データの欠落に対処する新しい手法として,Hinge-FM2Iの有効性が示唆された。
関連論文リスト
- FM-TS: Flow Matching for Time Series Generation [71.31148785577085]
本稿では、時系列生成のための修正フローマッチングベースのフレームワークFM-TSを紹介する。
FM-TSは、トレーニングと推論の点でより効率的である。
我々は、太陽予測とMuJoCo計算タスクにおいて優れた性能を達成した。
論文 参考訳(メタデータ) (2024-11-12T03:03:23Z) - Less is more: Embracing sparsity and interpolation with Esiformer for time series forecasting [19.8447763392479]
実世界のアプリケーションから生成された時系列データは、常に高いばらつきと多くのノイズを示す。
本稿では,元のデータに適用し,データ全体のばらつきを低減し,ノイズの影響を軽減するEsiformerを提案する。
MSEを6.5%,MAEを5.8%削減した。
論文 参考訳(メタデータ) (2024-10-08T06:45:47Z) - DiffImpute: Tabular Data Imputation With Denoising Diffusion Probabilistic Model [9.908561639396273]
DiffImputeという新しい拡散確率モデル(DDPM)を提案する。
既存のデータの信頼性を損なうことなく、欠落したエントリに対して信頼できる警告を生成する。
Missing Completely At Random (MCAR) と Missing At Random (MAR) の様々な設定に適用できる。
論文 参考訳(メタデータ) (2024-03-20T08:45:31Z) - SEMRes-DDPM: Residual Network Based Diffusion Modelling Applied to
Imbalanced Data [9.969882349165745]
データマイニングと機械学習の分野では、一般的に使われている分類モデルは、不均衡なデータで効果的に学習することはできない。
古典的なオーバーサンプリング手法の多くは、データのローカル情報のみに焦点を当てたSMOTE技術に基づいている。
本稿では,SEMRes-DDPMのオーバーサンプリング手法を提案する。
論文 参考訳(メタデータ) (2024-03-09T14:01:04Z) - Graph Spatiotemporal Process for Multivariate Time Series Anomaly
Detection with Missing Values [67.76168547245237]
本稿では,グラフ時間過程と異常スコアラを用いて異常を検出するGST-Proという新しいフレームワークを提案する。
実験結果から,GST-Pro法は時系列データ中の異常を効果的に検出し,最先端の手法より優れていることがわかった。
論文 参考訳(メタデータ) (2024-01-11T10:10:16Z) - ImDiffusion: Imputed Diffusion Models for Multivariate Time Series
Anomaly Detection [44.21198064126152]
我々はImDiffusionという新しい異常検出フレームワークを提案する。
ImDiffusionは時系列計算と拡散モデルを組み合わせて、正確で堅牢な異常検出を実現する。
我々はImDiffusionの性能をベンチマークデータセットの広範な実験により評価する。
論文 参考訳(メタデータ) (2023-07-03T04:57:40Z) - DynImp: Dynamic Imputation for Wearable Sensing Data Through Sensory and
Temporal Relatedness [78.98998551326812]
従来の手法では、データの時系列ダイナミクスと、異なるセンサーの特徴の関連性の両方をめったに利用していない、と我々は主張する。
我々はDynImpと呼ばれるモデルを提案し、特徴軸に沿って近接する隣人と異なる時間点の欠如を扱う。
本手法は, 関連センサのマルチモーダル性特性を活かし, 履歴時系列のダイナミックスから学習し, 極端に欠落した状態でデータを再構築することができることを示す。
論文 参考訳(メタデータ) (2022-09-26T21:59:14Z) - GraphFM: Improving Large-Scale GNN Training via Feature Momentum [65.22219413158042]
本稿では,特徴表現を更新する際に,履歴埋め込みを組み込むモーメントステップを用いた特徴運動量(FM)と呼ばれる新しい手法を提案する。
我々は,グラフFM-IBとグラフFM-OBという2つの特定のアルゴリズムを開発し,それぞれがバッチ内データとアウト・オブ・バッチデータについて検討する。
論文 参考訳(メタデータ) (2022-06-14T20:43:25Z) - Real-Time Anomaly Detection in Edge Streams [49.26098240310257]
マイクロクラスタ異常の検出に焦点を当てたMIDASを提案する。
さらに、アルゴリズムの内部状態に異常が組み込まれている問題を解くために、MIDAS-Fを提案する。
実験の結果,MIDAS-Fの精度はMIDASよりも有意に高かった。
論文 参考訳(メタデータ) (2020-09-17T17:59:27Z) - Deep F-measure Maximization for End-to-End Speech Understanding [52.36496114728355]
本稿では,F測度に対する微分可能な近似法を提案し,標準バックプロパゲーションを用いてネットワークをトレーニングする。
我々は、アダルト、コミュニティ、犯罪の2つの標準フェアネスデータセットの実験を行い、ATISデータセットの音声・インテリジェンス検出と音声・COCOデータセットの音声・イメージ概念分類を行った。
これらの4つのタスクのすべてにおいて、F測定は、クロスエントロピー損失関数で訓練されたモデルと比較して、最大8%の絶対的な絶対的な改善を含む、マイクロF1スコアの改善をもたらす。
論文 参考訳(メタデータ) (2020-08-08T03:02:27Z) - Anomaly Detection at Scale: The Case for Deep Distributional Time Series
Models [14.621700495712647]
我々のアプローチの主な特徴は、実値または実値のベクトルからなる時系列をモデル化するのではなく、実値(またはベクトル)上の確率分布の時系列をモデル化することである。
本手法は,数百万の時系列上の異常検出とスケールのストリーミングに有効である。
我々は,オープンソースの異常検出ツールを,実世界のデータセットに対する平均17%の改善率で上回っていることを示す。
論文 参考訳(メタデータ) (2020-07-30T15:48:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。