論文の概要: Suitability of Different Metric Choices for Concept Drift Detection
- arxiv url: http://arxiv.org/abs/2202.09486v1
- Date: Sat, 19 Feb 2022 01:11:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-23 09:57:38.302725
- Title: Suitability of Different Metric Choices for Concept Drift Detection
- Title(参考訳): コンセプトドリフト検出のための異なるメトリック選択の適合性
- Authors: Fabian Hinder, Valerie Vaquet, Barbara Hammer
- Abstract要約: ドリフト検出のための多くの教師なしのアプローチは、2つの時間窓のサンプル間の差を測定することに依存している。
ほとんどのドリフト検出法は、どの計量を使用するか、この計量がどのように推定されるか、どのように決定しきい値が見つかるかで区別できる。
我々は,異なる種類の推定器と測定器を理論的,実証的に比較し,単一の測定器の関連性について検討する。
- 参考スコア(独自算出の注目度): 9.76294323004155
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The notion of concept drift refers to the phenomenon that the distribution,
which is underlying the observed data, changes over time; as a consequence
machine learning models may become inaccurate and need adjustment. Many
unsupervised approaches for drift detection rely on measuring the discrepancy
between the sample distributions of two time windows. This may be done
directly, after some preprocessing (feature extraction, embedding into a latent
space, etc.), or with respect to inferred features (mean, variance, conditional
probabilities etc.). Most drift detection methods can be distinguished in what
metric they use, how this metric is estimated, and how the decision threshold
is found. In this paper, we analyze structural properties of the drift induced
signals in the context of different metrics. We compare different types of
estimators and metrics theoretically and empirically and investigate the
relevance of the single metric components. In addition, we propose new choices
and demonstrate their suitability in several experiments.
- Abstract(参考訳): 概念ドリフト(concept drift)の概念は、観測データの基礎となる分布が時間とともに変化する現象を指す。
多くの教師なしのドリフト検出手法は、2つの時間窓のサンプル分布のばらつきを測定することに依拠している。
これは、前処理(特徴抽出、潜在空間への埋め込みなど)の後に、または推定された特徴(平均、分散、条件付き確率など)について直接行うことができる。
ほとんどのドリフト検出法は、使用するメトリック、このメトリックの見積もり方法、決定しきい値の発見方法で区別することができる。
本稿では,異なるメトリクスの文脈におけるドリフト誘起信号の構造特性を解析する。
異なる種類の推定器とメトリクスを理論的および経験的に比較し、単一の計量成分の関連性について検討する。
さらに,新しい選択を提案し,いくつかの実験で適合性を示す。
関連論文リスト
- CADM: Confusion Model-based Detection Method for Real-drift in Chunk
Data Stream [3.0885191226198785]
コンセプトドリフト検出は、健康モニタリングや故障診断といった現実の多くの応用において重要であることから、かなりの注目を集めている。
本稿では,概念的混乱に基づく限定アノテーションを用いて,チャンクデータストリーム内のリアルタイムドリフトを検出する手法を提案する。
論文 参考訳(メタデータ) (2023-03-25T08:59:27Z) - Detecting Concept Drift in the Presence of Sparsity -- A Case Study of
Automated Change Risk Assessment System [0.8021979227281782]
文学におけるテクスティットパリシティ(textitsparsity)と呼ばれる欠落値は、多くの実世界のデータセットの共通の特徴である。
本研究では,異なる種類の疎性に対する様々な統計およびMLに基づくデータ計算手法の欠落した値のパターンについて検討する。
次に、異なるメトリクスに基づいて、欠落した値を持つデータセットを与えられた最良のコンセプトドリフト検出器を選択する。
論文 参考訳(メタデータ) (2022-07-27T04:27:49Z) - Precise Change Point Detection using Spectral Drift Detection [8.686667049158476]
概念ドリフト(concept drift)とは、データ生成が時間とともに変化する現象を指し、結果として機械学習モデルが不正確になり、調整が必要になる可能性がある。
本稿では,教師なし学習における変化点検出の問題について考察する。
我々は、新しい教師なしドリフト検出アルゴリズムを導き、その数学的特性を調査し、いくつかの実験でその有用性を実証する。
論文 参考訳(メタデータ) (2022-05-13T08:31:47Z) - Context-Aware Drift Detection [0.0]
均質性の2サンプル試験は、既存のドリフト検出手法が構築される基礎となる。
条件分布処理効果の2サンプル試験の基礎の上に構築した,より一般的なドリフト検出フレームワークを開発した。
論文 参考訳(メタデータ) (2022-03-16T14:23:02Z) - TACTiS: Transformer-Attentional Copulas for Time Series [76.71406465526454]
時間変化量の推定は、医療や金融などの分野における意思決定の基本的な構成要素である。
本稿では,アテンションベースデコーダを用いて関節分布を推定する多元的手法を提案する。
本研究では,本モデルが実世界の複数のデータセットに対して最先端の予測を生成することを示す。
論文 参考訳(メタデータ) (2022-02-07T21:37:29Z) - Meta Learning Low Rank Covariance Factors for Energy-Based Deterministic
Uncertainty [58.144520501201995]
ニューラルネットワーク層のBi-Lipschitz正規化は、各レイヤの特徴空間におけるデータインスタンス間の相対距離を保存する。
注意セットエンコーダを用いて,タスク固有の共分散行列を効率的に構築するために,対角的,対角的,低ランクな要素のメタ学習を提案する。
また,最終的な予測分布を達成するために,スケールしたエネルギーを利用する推論手法を提案する。
論文 参考訳(メタデータ) (2021-10-12T22:04:19Z) - Predicting with Confidence on Unseen Distributions [90.68414180153897]
ドメイン適応と予測不確実性文学を結びつけて、挑戦的な未知分布のモデル精度を予測する。
分類器の予測における信頼度(DoC)の差は,様々な変化に対して,分類器の性能変化を推定することに成功した。
具体的には, 合成分布と自然分布の区別について検討し, その単純さにもかかわらず, DoCは分布差の定量化に優れることを示した。
論文 参考訳(メタデータ) (2021-07-07T15:50:18Z) - Multivariate Probabilistic Regression with Natural Gradient Boosting [63.58097881421937]
多変量予測分布の条件パラメータを非パラメトリックにモデル化したNatural Gradient Boosting (NGBoost) 手法を提案する。
提案手法は頑健で, 広範囲なチューニングを伴わず, 推定対象分布に対してモジュール構造であり, 既存の手法と比較して競争力がある。
論文 参考訳(メタデータ) (2021-06-07T17:44:49Z) - Toward Scalable and Unified Example-based Explanation and Outlier
Detection [128.23117182137418]
我々は,試行錯誤の予測に例ベースの説明を与えることのできる,プロトタイプベースの学生ネットワークのより広範な採用を論じる。
類似カーネル以外のプロトタイプベースのネットワークは,分類精度を損なうことなく,有意義な説明と有望な外乱検出結果が得られることを示す。
論文 参考訳(メタデータ) (2020-11-11T05:58:17Z) - Concept Drift Detection: Dealing with MissingValues via Fuzzy Distance
Estimations [40.77597229122878]
データストリームでは、異なる時点に到達した観測データの分布が変化する可能性がある。
欠損値がコンセプトドリフト検出に重大な影響を与えることを示すが、ファジィ集合理論を用いて観測をモデル化することで、計算よりも信頼性の高い結果が得られる。
論文 参考訳(メタデータ) (2020-08-09T05:25:46Z) - Learning Disentangled Representations with Latent Variation
Predictability [102.4163768995288]
本稿では,潜在不整合表現の変動予測可能性について述べる。
逆生成プロセス内では、潜時変動と対応する画像対の相互情報を最大化することにより、変動予測可能性を高める。
本研究では,潜在表現の絡み合いを測るために,基礎的構造的生成因子に依存しない評価指標を開発する。
論文 参考訳(メタデータ) (2020-07-25T08:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。