論文の概要: TimeLAVA: Learning-Agnostic Data Valuation for Time Series
- arxiv url: http://arxiv.org/abs/2606.18729v2
- Date: Tue, 23 Jun 2026 01:06:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.230255
- Title: TimeLAVA: Learning-Agnostic Data Valuation for Time Series
- Title(参考訳): TimeLAVA: 時系列の学習非依存データ評価
- Authors: Wenqin Liu, Weizhi Quan, Aoqi Zuo, Erdun Gao, Vu Nguyen, Dino Sejdinovic, Howard Bondell, Mingming Gong,
- Abstract要約: TimeLAVAは、評価データと参照データの間の分布差を最小限に抑えるために、時間セグメントを限界貢献によって評価する学習非依存のフレームワークである。
モデルに依存しない一般化にバリュエーションをリンクする理論的保証を提供し、汚染に対する有界感度を証明する。
- 参考スコア(独自算出の注目度): 48.76711740818533
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data valuation quantifies the intrinsic quality of individual samples to enable principled data curation, quality control, and robust learning. For time series in critical domains such as healthcare, finance, and industrial monitoring, effective valuation methods are essential yet fundamentally lacking. Existing approaches are either model-dependent, limiting their generalizability, or designed for i.i.d. data and thus fail to capture temporal dependencies, multi-scale patterns, and non-stationary dynamics inherent to sequential data. We introduce TimeLAVA, a learning-agnostic framework that values temporal segments by their marginal contribution to minimizing distributional discrepancy between evaluated and reference data. At its core is a novel Selective Wavelet-based Wasserstein discrepancy combining multi-scale wavelet transforms for temporal localization with unbalanced optimal transport for robustness to distributional shifts. Segment values are efficiently computed via sensitivity analysis without requiring model training and aggregated into point-wise scores. We provide theoretical guarantees linking valuation to model-agnostic generalization and prove bounded sensitivity to outlier contamination. Extensive experiments across anomaly detection, data pruning, and label noise detection demonstrate that TimeLAVA produces significantly more informative value scores than existing methods on diverse real-world datasets.
- Abstract(参考訳): データバリュエーションは、データキュレーション、品質管理、堅牢な学習を可能にするために、個々のサンプルの固有の品質を定量化する。
医療、金融、産業監視といった重要な分野における時系列では、効果的な評価方法が不可欠だが根本的な欠如である。
既存のアプローチはモデルに依存しており、一般化可能性を制限するか、すなわちデータのために設計されている。
評価データと参照データ間の分布差の最小化に際し,時間セグメントを評価する学習非依存のフレームワークであるTimeLAVAを紹介する。
中心となるのは、多スケールのウェーブレット変換を時間的ローカライゼーションに組み合わせたSelective Waveletベースのワッサースタイン差分法と、分散シフトに対するロバスト性のための不均衡な最適輸送である。
セグメント値は、モデルトレーニングを必要とせずに感度解析によって効率的に計算され、ポイントワイズスコアに集約される。
モデルに依存しない一般化にバリュエーションをリンクする理論的保証を与え, 外部汚染に対する境界感度を証明した。
異常検出、データプルーニング、ラベルノイズ検出などにわたる大規模な実験により、TimeLAVAは、さまざまな実世界のデータセットの既存の方法よりも、はるかに有意義な値スコアを生成することが示された。
関連論文リスト
- Temporal-Decay Shapley: A Time-Aware Data Valuation Framework for Time-Series Data [0.8729998428218245]
本稿では,時系列データの正確なサンプル評価を可能にする時間軸データ評価法を提案する。
具体的には,3つの時間的シャプリー法を提案する。
実験結果から,提案手法はノイズ検出や高価値データ識別タスクにおいて従来の手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2026-05-04T04:32:33Z) - Revisiting Multivariate Time Series Forecasting with Missing Values [65.30332997607141]
現実の時系列では欠落値が一般的である。
現在のアプローチでは、計算モジュールを使用して、不足した値を補う、計算済みの予測フレームワークが開発されている。
このフレームワークは、致命的な問題を見落としている: 欠落した値に対して基礎的な真理は存在せず、予測精度を劣化させる可能性のあるエラーの影響を受けやすいようにしている。
本稿では,Information Bottleneck原則に基づく新しいフレームワークであるConsistency-Regularized Information Bottleneck(CRIB)を紹介する。
論文 参考訳(メタデータ) (2025-09-27T20:57:48Z) - CALM: A Framework for Continuous, Adaptive, and LLM-Mediated Anomaly Detection in Time-Series Streams [0.42970700836450476]
本稿では,リアルタイム異常検出のための新しいエンドツーエンドフレームワークであるCALMを紹介する。
CALMはApache Beam分散処理フレームワーク上に構築されている。
クローズドループで連続的な微調整機構を実装し、異常検出モデルがほぼリアルタイムで進化するデータパターンに適応できるようにする。
論文 参考訳(メタデータ) (2025-08-29T00:27:35Z) - TANDEM: Temporal Attention-guided Neural Differential Equations for Missingness in Time Series Classification [13.404503606887717]
TANDEMは注意誘導型ニューラルネットワーク微分方程式フレームワークで、時系列データを欠落した値で効果的に分類する。
TANDEMを30のベンチマークデータセットと実世界の医療データセットで評価した。
論文 参考訳(メタデータ) (2025-08-24T20:59:14Z) - CoSTI: Consistency Models for (a faster) Spatio-Temporal Imputation [0.0]
CoSTIは、推論時間を劇的に削減しつつ、DDPMに匹敵する計算品質を達成するために一貫性トレーニングを採用している。
複数のデータセットとデータシナリオをまたいだCoSTIを評価し、拡散モデルと同等のパフォーマンスで、計算時間を最大98%削減することを示した。
論文 参考訳(メタデータ) (2025-01-31T18:14:28Z) - PeFAD: A Parameter-Efficient Federated Framework for Time Series Anomaly Detection [51.20479454379662]
私たちはaを提案します。
フェデレートされた異常検出フレームワークであるPeFADは、プライバシーの懸念が高まっている。
我々は、4つの実際のデータセットに対して広範な評価を行い、PeFADは既存の最先端ベースラインを最大28.74%上回っている。
論文 参考訳(メタデータ) (2024-06-04T13:51:08Z) - Stochastic Amortization: A Unified Approach to Accelerate Feature and Data Attribution [62.71425232332837]
雑音ラベル付きモデルを用いたトレーニングは安価で驚くほど効果的であることを示す。
このアプローチは、いくつかの特徴属性とデータ評価手法を著しく加速し、しばしば既存のアプローチよりも桁違いにスピードアップする。
論文 参考訳(メタデータ) (2024-01-29T03:42:37Z) - Graph Spatiotemporal Process for Multivariate Time Series Anomaly
Detection with Missing Values [67.76168547245237]
本稿では,グラフ時間過程と異常スコアラを用いて異常を検出するGST-Proという新しいフレームワークを提案する。
実験結果から,GST-Pro法は時系列データ中の異常を効果的に検出し,最先端の手法より優れていることがわかった。
論文 参考訳(メタデータ) (2024-01-11T10:10:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。