論文の概要: Diagnosing Concept Drift with Visual Analytics
- arxiv url: http://arxiv.org/abs/2007.14372v3
- Date: Tue, 15 Sep 2020 04:12:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 02:02:33.264403
- Title: Diagnosing Concept Drift with Visual Analytics
- Title(参考訳): Visual Analyticsによるコンセプトドリフトの診断
- Authors: Weikai Yang, Zhen Li, Mengchen Liu, Yafeng Lu, Kelei Cao, Ross
Maciejewski, Shixia Liu
- Abstract要約: 概念ドリフトは、データストリームの分布が予期せぬ方法で時間とともに変化し、予測モデルが不正確なものになる現象である。
本稿では,ストリーミングデータにおける概念ドリフトの同定と補正において,モデル構築者やアナリストを支援する視覚解析手法DriftVisを提案する。
- 参考スコア(独自算出の注目度): 27.836419202828303
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Concept drift is a phenomenon in which the distribution of a data stream
changes over time in unforeseen ways, causing prediction models built on
historical data to become inaccurate. While a variety of automated methods have
been developed to identify when concept drift occurs, there is limited support
for analysts who need to understand and correct their models when drift is
detected. In this paper, we present a visual analytics method, DriftVis, to
support model builders and analysts in the identification and correction of
concept drift in streaming data. DriftVis combines a distribution-based drift
detection method with a streaming scatterplot to support the analysis of drift
caused by the distribution changes of data streams and to explore the impact of
these changes on the model's accuracy. A quantitative experiment and two case
studies on weather prediction and text classification have been conducted to
demonstrate our proposed tool and illustrate how visual analytics can be used
to support the detection, examination, and correction of concept drift.
- Abstract(参考訳): 概念ドリフトは、データストリームの分布が予期せぬ方法で時間とともに変化し、履歴データ上に構築された予測モデルが不正確なものになる現象である。
概念ドリフトが発生する時期を特定するために、様々な自動化手法が開発されているが、ドリフトが検出されたときにモデルを理解し修正する必要があるアナリストのサポートは限られている。
本稿では,ストリーミングデータにおける概念ドリフトの同定と修正において,モデル構築者やアナリストを支援するビジュアル分析手法であるdodowvisを提案する。
DriftVisは、分散ベースのドリフト検出方法とストリーミングスキャッタープロットを組み合わせることで、データストリームの分布変化によるドリフトの分析を支援し、これらの変更がモデルの精度に与える影響を調べる。
気象予測とテキスト分類に関する定量的実験と2つのケーススタディを実施し,提案手法を実証し,概念ドリフトの検出,検査,補正にビジュアル解析をどのように利用できるかを示した。
関連論文リスト
- Physics-guided Active Sample Reweighting for Urban Flow Prediction [75.24539704456791]
都市フロー予測は、バス、タクシー、ライド駆動モデルといった交通サービスのスループットを見積もる、微妙な時間的モデリングである。
最近の予測解は、物理学誘導機械学習(PGML)の概念による改善をもたらす。
我々は、PN(atized Physics-guided Network)を開発し、P-GASR(Physical-guided Active Sample Reweighting)を提案する。
論文 参考訳(メタデータ) (2024-07-18T15:44:23Z) - Online Drift Detection with Maximum Concept Discrepancy [13.48123472458282]
最大概念差に基づく新しい概念ドリフト検出手法であるMDD-DDを提案する。
本手法は,概念埋め込みのコントラスト学習により,様々な形態のコンセプトドリフトを適応的に同定することができる。
論文 参考訳(メタデータ) (2024-07-07T13:57:50Z) - Towards Theoretical Understandings of Self-Consuming Generative Models [56.84592466204185]
本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。
我々は,このトレーニングが将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。
カーネル密度推定の結果は,混合データトレーニングがエラー伝播に与える影響など,微妙な洞察を与える。
論文 参考訳(メタデータ) (2024-02-19T02:08:09Z) - Data Attribution for Diffusion Models: Timestep-induced Bias in Influence Estimation [53.27596811146316]
拡散モデルは、以前の文脈における瞬間的な入出力関係ではなく、一連のタイムステップで操作する。
本稿では、この時間的ダイナミクスを取り入れた拡散トラクInについて、サンプルの損失勾配ノルムが時間ステップに大きく依存していることを確認する。
そこで我々はDiffusion-ReTracを再正規化適応として導入し、興味のあるサンプルを対象にしたトレーニングサンプルの検索を可能にする。
論文 参考訳(メタデータ) (2024-01-17T07:58:18Z) - On the Change of Decision Boundaries and Loss in Learning with Concept
Drift [8.686667049158476]
概念ドリフト(concept drift)とは、観測データを生成する分布が時間とともに変化する現象を指す。
ドリフトで学習するための多くの技術は、モデル一般化誤差を近似する量としてインターリーブテストトレイン誤差(ITTE)に依存している。
論文 参考訳(メタデータ) (2022-12-02T14:58:13Z) - Autoregressive based Drift Detection Method [0.0]
我々はADDMと呼ばれる自己回帰モデルに基づく新しい概念ドリフト検出手法を提案する。
以上の結果から,新しいドリフト検出法は最先端ドリフト検出法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-03-09T14:36:16Z) - Detecting Concept Drift With Neural Network Model Uncertainty [0.0]
不確実ドリフト検出(UDD)は、真のラベルにアクセスすることなくドリフトを検出することができる。
入力データに基づくドリフト検出とは対照的に,現在の入力データが予測モデルの特性に与える影響を考察する。
UDDは2つの合成および10の実世界のデータセットにおいて、回帰処理と分類処理の両方において、他の最先端戦略よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-07-05T08:56:36Z) - Automatic Learning to Detect Concept Drift [40.69280758487987]
誤り率の変化パターンを追跡し,コンセプトドリフトの分類を学習する新しいフレームワークであるMeta-ADDを提案する。
具体的には、トレーニングフェーズにおいて、様々なコンセプトドリフトの誤差率に基づいてメタ特徴を抽出し、その後、原型ニューラルネットワークを介してメタ検出装置を開発する。
検出フェーズでは、学習したメタ検出器が微調整され、ストリームベースのアクティブラーニングを介して対応するデータストリームに適応する。
論文 参考訳(メタデータ) (2021-05-04T11:10:39Z) - Predicting traffic signals on transportation networks using
spatio-temporal correlations on graphs [56.48498624951417]
本稿では,複数の熱拡散カーネルをデータ駆動予測モデルにマージして交通信号を予測する交通伝搬モデルを提案する。
予測誤差を最小限に抑えるためにベイズ推定を用いてモデルパラメータを最適化し,2つの手法の混合率を決定する。
提案モデルでは,計算労力の少ない最先端のディープニューラルネットワークに匹敵する予測精度を示す。
論文 参考訳(メタデータ) (2021-04-27T18:17:42Z) - A Graph Convolutional Network with Signal Phasing Information for
Arterial Traffic Prediction [63.470149585093665]
動脈交通予測は 現代のインテリジェント交通システムの発展に 重要な役割を担っています
動脈交通予測に関する既存の研究の多くは、ループセンサからの流量と占有率の時間的測定のみを考慮し、上流と下流の検出器間のリッチな空間的関係を無視している。
我々は,信号タイミング計画から発生する空間情報を用いて,深層学習アプローチである拡散畳み込みリカレントニューラルネットワークを強化することで,このギャップを埋める。
論文 参考訳(メタデータ) (2020-12-25T01:40:29Z) - Uncertainty Estimation Using a Single Deep Deterministic Neural Network [66.26231423824089]
本稿では,1回のフォワードパスで,テスト時に分布データポイントの発見と拒否が可能な決定論的ディープモデルを訓練する手法を提案する。
我々は,新しい損失関数とセントロイド更新方式を用いて,これらをスケールトレーニングし,ソフトマックスモデルの精度に適合させる。
論文 参考訳(メタデータ) (2020-03-04T12:27:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。