論文の概要: TEDD: Robust Detection of Unstable Temporal Features
- arxiv url: http://arxiv.org/abs/2606.12643v1
- Date: Wed, 10 Jun 2026 20:10:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.441783
- Title: TEDD: Robust Detection of Unstable Temporal Features
- Title(参考訳): TEDD:不安定な時間的特徴のロバスト検出
- Authors: Ricardo Ribeiro Pereira, Bruno Casal Laraña, Nádia Soares, Miguel Araújo,
- Abstract要約: 時間とともに分布が変化している特徴に遭遇することが一般的である。
機械学習モデルの素早い採用は、急速にパフォーマンスを低下させる可能性がある。
我々は、データセットが不安定な機械学習モデルにいつ導かれるかを特定する技術であるTEDDを提案する。
- 参考スコア(独自算出の注目度): 0.052498055901649014
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: When working with real-world temporal data, it is common to encounter features whose distribution is changing over time. The naive employment of Machine Learning models on this unstable data might lead to rapidly degrading performance, especially if the new distribution is much different from what was previously seen during training. In order to cope with this problem, it is critical to automatically identify features that are changing over time. With these features detected, data scientists and other practitioners will be able to mitigate the issue (for instance, by applying data transformations), deploying more robust models that retain high performance for longer periods of time. In this paper, we describe which temporal changes a feature should not suffer from, and propose TEDD, a technique to a) identify when a dataset might lead to an unstable Machine Learning model and b) automatically detect which features cause such lack of robustness. In order to achieve it, we leverage a regression model to highlight which features contribute to a good prediction of an instance's timestamp. We compare our approach to other methods in real and synthetic data, testing their detection capability on all simple change patterns. We show that our method: detects all types of basic changes, both for numerical and categorical features; can detect multivariate drifts; returns a comparable value measuring the amount of change of each feature; requires no parameter tuning; and is scalable both on number of features and instances of the dataset.
- Abstract(参考訳): 実世界の時間データを扱う場合、時間とともに分布が変化している特徴に遭遇することが一般的である。
この不安定なデータに機械学習モデルを用いることで、特にトレーニング中にこれまで見られていたものとは大きく異なる場合、パフォーマンスが急速に低下する可能性がある。
この問題に対処するためには、時間とともに変化する特徴を自動的に識別することが重要である。
これらの機能が検出されると、データサイエンティストや他の実践者が(例えば、データ変換を適用することによって)問題を緩和し、より堅牢なモデルを配置し、長期間にわたって高いパフォーマンスを維持することができる。
本稿では,特徴がどの時間的変化に悩ますべきでないかを記述し,その手法であるTEDDを提案する。
a)データセットが不安定な機械学習モデルにいつ導かれるかを特定し、
b) このような堅牢性の欠如の原因となる特徴を自動的に検出する。
これを達成するために、回帰モデルを利用して、どの機能がインスタンスのタイムスタンプのよい予測に寄与しているかを強調します。
我々は,本手法を実データと合成データで比較し,その検出能力をすべての単純な変化パターンで検証する。
提案手法は,数値的特徴と分類的特徴の両方において,基本的変化のすべてのタイプを検出すること,多変量ドリフトを検出すること,各特徴の変化量を測定する同等の値を返すこと,パラメータチューニングを必要としないこと,データセットの特徴数とインスタンス数に基づいてスケーラブルであること,などを示す。
関連論文リスト
- Feature-aware Modulation for Learning from Temporal Tabular Data [47.36022303401642]
時間分布シフトは、現実世界のデプロイメントにおいて大きな課題となる。
静的モデルは一般化を保証する固定写像を仮定するが、適応モデルは過渡パターンに過度に適合する。
本稿では,時間的文脈における特徴表現を特徴付ける特徴認識型時間変調機構を提案する。
論文 参考訳(メタデータ) (2025-12-03T11:13:12Z) - Predictive variational autoencoder for learning robust representations
of time-series data [0.0]
本稿では,次点を予測するVAEアーキテクチャを提案する。
VAEの2つの制約は、時間とともにスムーズであることを示し、堅牢な潜伏表現を生成し、合成データセット上の潜伏因子を忠実に回収する。
論文 参考訳(メタデータ) (2023-12-12T02:06:50Z) - Monitoring Machine Learning Models: Online Detection of Relevant
Deviations [0.0]
機械学習モデルは、データ分散やその他の要因の変化によって、時間の経過とともに劣化する可能性がある。
本稿では,関連する変化を検出するための逐次モニタリング手法を提案する。
本研究は, 微ゆらぎと有意義な劣化を区別する実用的な解決法である。
論文 参考訳(メタデータ) (2023-09-26T18:46:37Z) - AnomalyBERT: Self-Supervised Transformer for Time Series Anomaly
Detection using Data Degradation Scheme [0.7216399430290167]
時系列、特にラベルなしデータに対する異常検出タスクは、難しい問題である。
自己教師型モデルトレーニングに適切なデータ劣化スキームを適用することで、この問題に対処する。
自己認識機構に触発されて、時間的文脈を認識するトランスフォーマーベースのアーキテクチャを設計する。
論文 参考訳(メタデータ) (2023-05-08T05:42:24Z) - Time-Varying Propensity Score to Bridge the Gap between the Past and Present [104.46387765330142]
本稿では,データ分布の段階的変化を検出するための時間変化確率スコアを提案する。
実装のさまざまな方法を示し、さまざまな問題について評価する。
論文 参考訳(メタデータ) (2022-10-04T07:21:49Z) - PSEUDo: Interactive Pattern Search in Multivariate Time Series with
Locality-Sensitive Hashing and Relevance Feedback [3.347485580830609]
PSEUDoは、マルチトラックシーケンシャルデータにおける視覚パターンを探索するための適応的機能学習技術である。
提案アルゴリズムは,サブ線形学習と推論時間を特徴とする。
我々は,PSEUDoの効率,精度,操縦性において優位性を示す。
論文 参考訳(メタデータ) (2021-04-30T13:00:44Z) - Anomaly Detection of Time Series with Smoothness-Inducing Sequential
Variational Auto-Encoder [59.69303945834122]
Smoothness-Inducing Sequential Variational Auto-Encoder (SISVAE) モデルを提案する。
我々のモデルは、フレキシブルニューラルネットワークを用いて各タイムスタンプの平均と分散をパラメータ化する。
合成データセットと公開実世界のベンチマークの両方において,本モデルの有効性を示す。
論文 参考訳(メタデータ) (2021-02-02T06:15:15Z) - Change Point Detection in Time Series Data using Autoencoders with a
Time-Invariant Representation [69.34035527763916]
変化点検出(CPD)は、時系列データにおける急激な特性変化を見つけることを目的としている。
近年のCDD法は、深層学習技術を用いる可能性を示したが、信号の自己相関統計学におけるより微妙な変化を識別する能力に欠けることが多い。
我々は、新しい損失関数を持つオートエンコーダに基づく手法を用い、使用済みオートエンコーダは、CDDに適した部分的な時間不変表現を学習する。
論文 参考訳(メタデータ) (2020-08-21T15:03:21Z) - Stance Detection Benchmark: How Robust Is Your Stance Detection? [65.91772010586605]
Stance Detection (StD) は、あるトピックやクレームに対する著者の姿勢を検出することを目的としている。
マルチデータセット学習環境において、さまざまなドメインの10のStDデータセットから学習するStDベンチマークを導入する。
このベンチマーク設定では、5つのデータセットに新しい最先端結果を表示することができます。
論文 参考訳(メタデータ) (2020-01-06T13:37:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。