論文の概要: Unveiling the Secrets: How Masking Strategies Shape Time Series Imputation
- arxiv url: http://arxiv.org/abs/2405.17508v2
- Date: Tue, 26 Nov 2024 13:26:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-27 13:32:36.258476
- Title: Unveiling the Secrets: How Masking Strategies Shape Time Series Imputation
- Title(参考訳): 謎を解き明かす:マスキング戦略がいかに時系列のインプットを形作るか
- Authors: Linglong Qian, Yiyuan Yang, Wenjie Du, Jun Wang, Zina Ibrahim,
- Abstract要約: 時系列計算はデータマイニングにおいて重要な課題であり、特に医療や環境モニタリングのような分野では、欠落したデータが分析結果を損なう可能性がある。
本研究では, 多様なマスキング戦略, 正規化タイミング, 欠落パターンが3つの多様なデータセットにおける11種類の最先端計算モデルの性能に及ぼす影響について検討した。
- 参考スコア(独自算出の注目度): 7.650009336768971
- License:
- Abstract: Time series imputation is a critical challenge in data mining, particularly in domains like healthcare and environmental monitoring, where missing data can compromise analytical outcomes. This study investigates the influence of diverse masking strategies, normalization timing, and missingness patterns on the performance of eleven state-of-the-art imputation models across three diverse datasets. Specifically, we evaluate the effects of pre-masking versus in-mini-batch masking, augmentation versus overlaying of artificial missingness, and pre-normalization versus post-normalization. Our findings reveal that masking strategies profoundly affect imputation accuracy, with dynamic masking providing robust augmentation benefits and overlay masking better simulating real-world missingness patterns. Sophisticated models, such as CSDI, exhibited sensitivity to preprocessing configurations, while simpler models like BRITS delivered consistent and efficient performance. We highlight the importance of aligning preprocessing pipelines and masking strategies with dataset characteristics to improve robustness under diverse conditions, including high missing rates. This study provides actionable insights for designing imputation pipelines and underscores the need for transparent and comprehensive experimental designs.
- Abstract(参考訳): 時系列計算はデータマイニングにおいて重要な課題であり、特に医療や環境モニタリングのような分野では、欠落したデータが分析結果を損なう可能性がある。
本研究では, 多様なマスキング戦略, 正規化タイミング, 欠落パターンが3つの多様なデータセットにおける11種類の最先端計算モデルの性能に及ぼす影響について検討した。
具体的には,プリマスキングとミニバッチマスキング,人工欠損のオーバレイ化とプレノーマライゼーションとポストノーマライゼーションの効果について検討した。
以上の結果から,マスキング戦略は計算精度に大きく影響し,動的マスキングは強靭な拡張効果をもたらし,オーバーレイマスキングは現実世界の欠陥パターンをシミュレートしやすくすることが明らかとなった。
CSDIのような洗練されたモデルは前処理の構成に敏感であり、BRITSのような単純なモデルは一貫性と効率的な性能をもたらした。
我々は、多種多様な条件下で堅牢性を改善するために、プレプロセスパイプラインとマスキング戦略をデータセット特性と整合させることの重要性を強調した。
本研究は, 透過的かつ包括的な実験設計の必要性を浮き彫りにして, インキュベーションパイプラインの設計に有効な知見を提供する。
関連論文リスト
- Promptable Anomaly Segmentation with SAM Through Self-Perception Tuning [63.55145330447408]
Segment Anything Model (SAM) は、その顕著な一般化能力により、異常セグメンテーションタスクにおいて大きな進歩を遂げている。
SAMを直接適用する既存のメソッドは、しばしばドメインシフトの問題を見落としている。
本稿では, SAMの異常セグメンテーションに対する知覚能力を高めることを目的とした, 自己パーセプティノンチューニング(SPT)手法を提案する。
論文 参考訳(メタデータ) (2024-11-26T08:33:25Z) - EMIT- Event-Based Masked Auto Encoding for Irregular Time Series [9.903108445512576]
データポイントが不均一な間隔で記録される不規則な時系列は、医療設定で一般的である。
この変動は、患者の健康の重大な変動を反映し、情報的臨床的意思決定に不可欠である。
不規則時系列に関する既存の自己教師型学習研究は、しばしば予測のような一般的な前提課題に依存している。
本稿では,不規則な時系列に対するイベントベースのマスキングである,新しい事前学習フレームワーク EMIT を提案する。
論文 参考訳(メタデータ) (2024-09-25T02:05:32Z) - Open-Set Deepfake Detection: A Parameter-Efficient Adaptation Method with Forgery Style Mixture [58.60915132222421]
本稿では,顔偽造検出に汎用的かつパラメータ効率の高い手法を提案する。
フォージェリー・ソース・ドメインの多様性を増大させるフォージェリー・ミックス・フォーミュレーションを設計する。
設計したモデルは、トレーニング可能なパラメータを著しく減らし、最先端の一般化性を実現する。
論文 参考訳(メタデータ) (2024-08-23T01:53:36Z) - A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。
本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。
背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文 参考訳(メタデータ) (2024-08-01T07:40:00Z) - Feature Attenuation of Defective Representation Can Resolve Incomplete Masking on Anomaly Detection [1.0358639819750703]
教師なし異常検出(UAD)研究では、計算効率が高くスケーラブルなソリューションを開発する必要がある。
再建・塗り替えのアプローチを再考し、強みと弱みを分析して改善する。
異常再構成の特徴情報を減衰させる2つの層のみを用いるFADeR(Feature Attenuation of Defective Representation)を提案する。
論文 参考訳(メタデータ) (2024-07-05T15:44:53Z) - DetDiffusion: Synergizing Generative and Perceptive Models for Enhanced Data Generation and Perception [78.26734070960886]
現在の知覚モデルは、リソース集約的なデータセットに大きく依存している。
セグメンテーションを通じて知覚認識損失(P.A.損失)を導入し、品質と制御性の両方を改善した。
本手法は,世代間における知覚認識属性(P.A. Attr)の抽出と利用により,データ拡張をカスタマイズする。
論文 参考訳(メタデータ) (2024-03-20T04:58:03Z) - Semantic-Preserving Feature Partitioning for Multi-View Ensemble
Learning [11.415864885658435]
本稿では,情報理論に基づく新しい手法であるセマンティック・保存特徴分割(SPFP)アルゴリズムを紹介する。
SPFPアルゴリズムは、データセットを複数のセマンティックな一貫したビューに効果的に分割し、マルチビューアンサンブル学習プロセスを強化する。
モデル精度を維持しつつ、高い一般化性能が達成可能なシナリオにおける不確実性対策を大幅に改善する。
論文 参考訳(メタデータ) (2024-01-11T20:44:45Z) - Representation Learning for Wearable-Based Applications in the Case of
Missing Data [20.37256375888501]
実環境におけるマルチモーダルセンサデータは、データ品質が低く、データアノテーションが限られているため、依然として困難である。
本稿では,不足するウェアラブルデータに対する表現学習について検討し,最新統計手法と比較する。
本研究は,マスキングに基づく自己指導型学習タスクの設計と開発に関する知見を提供する。
論文 参考訳(メタデータ) (2024-01-08T08:21:37Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - RARE: Robust Masked Graph Autoencoder [45.485891794905946]
Masked graph autoencoder (MGAE) は、有望な自己教師付きグラフ事前学習(SGP)パラダイムとして登場した。
本稿では,ロバストmAsked gRaph autoEncoder (RARE) と呼ばれる新しいSGP手法を提案する。
論文 参考訳(メタデータ) (2023-04-04T03:35:29Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。