論文の概要: Comparative Analysis of Extreme Verification Latency Learning Algorithms
- arxiv url: http://arxiv.org/abs/2011.14917v1
- Date: Thu, 26 Nov 2020 16:34:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-20 08:19:54.077298
- Title: Comparative Analysis of Extreme Verification Latency Learning Algorithms
- Title(参考訳): 極限検証レイテンシ学習アルゴリズムの比較解析
- Authors: Muhammad Umer, Robi Polikar
- Abstract要約: 本稿では、EVLアルゴリズムのいくつかの弱点と強みを指摘するための総合的な調査と比較分析を行う。
この研究は、この分野の既存のアルゴリズムのレビューを研究コミュニティに提供するための、非常に最初の取り組みである。
- 参考スコア(独自算出の注目度): 3.3439097577935213
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One of the more challenging real-world problems in computational intelligence
is to learn from non-stationary streaming data, also known as concept drift.
Perhaps even a more challenging version of this scenario is when -- following a
small set of initial labeled data -- the data stream consists of unlabeled data
only. Such a scenario is typically referred to as learning in initially labeled
nonstationary environment, or simply as extreme verification latency (EVL).
Because of the very challenging nature of the problem, very few algorithms have
been proposed in the literature up to date. This work is a very first effort to
provide a review of some of the existing algorithms (important/prominent) in
this field to the research community. More specifically, this paper is a
comprehensive survey and comparative analysis of some of the EVL algorithms to
point out the weaknesses and strengths of different approaches from three
different perspectives: classification accuracy, computational complexity and
parameter sensitivity using several synthetic and real world datasets.
- Abstract(参考訳): 計算知能における最も難しい問題の一つは、非定常ストリーミングデータ(コンセプトドリフトとも呼ばれる)から学ぶことである。
おそらくこのシナリオのもっと難しいバージョンは -- ラベル付きデータの小さなセットに従えば -- データストリームはラベルなしのデータのみで構成されます。
このようなシナリオは、通常、初期ラベル付けされた非定常環境での学習、あるいは単に極端な検証レイテンシ(EVL)と呼ばれる。
この問題の非常に困難な性質のため、これまでの文献で提案されているアルゴリズムはごくわずかである。
この研究は、この分野の既存のアルゴリズム(重要/重要)のレビューを研究コミュニティに提供するための、非常に最初の試みである。
具体的には、いくつかの合成および実世界のデータセットを用いて、分類精度、計算複雑性、パラメータ感度の3つの異なる視点から異なるアプローチの弱点と強みを指摘するために、EVLアルゴリズムの包括的および比較分析を行う。
関連論文リスト
- Can Tree Based Approaches Surpass Deep Learning in Anomaly Detection? A
Benchmarking Study [0.6291443816903801]
本稿では,機械学習に基づく異常検出アルゴリズムの多種多様さを評価する。
本論文は, 種々の異常検出アルゴリズムの非バイアス比較を行うことにより, 顕著に寄与する。
論文 参考訳(メタデータ) (2024-02-11T19:12:51Z) - A Discrepancy Aware Framework for Robust Anomaly Detection [51.710249807397695]
本稿では,DAF(Disdisrepancy Aware Framework)を提案する。
本手法は,デコーダの欠陥同定に外見に依存しないキューを利用して,その合成外観への依存を緩和する。
単純な合成戦略の下では,既存の手法を大きなマージンで上回り,また,最先端のローカライゼーション性能も達成している。
論文 参考訳(メタデータ) (2023-10-11T15:21:40Z) - Multivariate Time Series Anomaly Detection: Fancy Algorithms and Flawed
Evaluation Methodology [2.043517674271996]
本稿では、MVTS異常検出の文脈において、正常によいプロトコルが弱点を持つ可能性について論じる。
本稿では,PCA(Principal Components Analysis)に基づくシンプルな,かつ難しいベースラインを提案する。このベースラインは,最近のDeep Learning(DL)ベースのアプローチにおいて,一般的なベンチマークデータセットよりも驚くほど優れています。
論文 参考訳(メタデータ) (2023-08-24T20:24:12Z) - Autoencoder-based Anomaly Detection in Streaming Data with Incremental
Learning and Concept Drift Adaptation [10.41066461952124]
ドリフト検出(strAEm++DD)を用いた自動エンコーダに基づく漸進学習手法を提案する。
提案手法は,逐次学習とドリフト検出の両方の利点を利用する。
我々は,重度あるいは極度のクラス不均衡を持つ実世界のデータセットと合成データセットを用いて実験を行い,StraAEm++DDの実証分析を行った。
論文 参考訳(メタデータ) (2023-05-15T19:40:04Z) - A Gold Standard Dataset for the Reviewer Assignment Problem [117.59690218507565]
類似度スコア(Similarity score)とは、論文のレビューにおいて、レビュアーの専門知識を数値で見積もるものである。
私たちのデータセットは、58人の研究者による477の自己申告された専門知識スコアで構成されています。
2つの論文をレビュアーに関連付けるタスクは、簡単なケースでは12%~30%、ハードケースでは36%~43%である。
論文 参考訳(メタデータ) (2023-03-23T16:15:03Z) - Multiple Instance Learning for Detecting Anomalies over Sequential
Real-World Datasets [2.427831679672374]
MIL(Multiple Instance Learning)は、トレーニングデータセットにおけるラベルの不完全な知識に関する問題に対して有効であることが示されている。
MILに基づく定式化と,異なる設計決定に基づいて,このフレームワークの様々なアルゴリズムのインスタンス化を提案する。
このフレームワークは、さまざまな現実世界のアプリケーションドメインから生じる多様なデータセットをうまく一般化する。
論文 参考訳(メタデータ) (2022-10-04T16:02:09Z) - A Survey of Learning on Small Data: Generalization, Optimization, and
Challenge [101.27154181792567]
ビッグデータの一般化能力を近似した小さなデータについて学ぶことは、AIの究極の目的の1つである。
この調査はPACフレームワークの下でのアクティブサンプリング理論に従い、小さなデータにおける学習の一般化誤差とラベルの複雑さを分析した。
効率的な小さなデータ表現の恩恵を受けるかもしれない複数のデータアプリケーションについて調査する。
論文 参考訳(メタデータ) (2022-07-29T02:34:19Z) - A Simplicity Bubble Problem in Formal-Theoretic Learning Systems [1.7996150751268578]
機械学習への現在のアプローチは、十分に大きなデータセットによって、自然または人工的に常に騙され得ることを示す。
本稿では,この誤認現象を回避するための枠組みと追加の経験的条件について論じる。
論文 参考訳(メタデータ) (2021-12-22T23:44:47Z) - Quasi-Global Momentum: Accelerating Decentralized Deep Learning on
Heterogeneous Data [77.88594632644347]
ディープラーニングモデルの分散トレーニングは、ネットワーク上でデータプライバシとデバイス上での学習を可能にする重要な要素である。
現実的な学習シナリオでは、異なるクライアントのローカルデータセットに異質性が存在することが最適化の課題となる。
本稿では,この分散学習の難しさを軽減するために,運動量に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2021-02-09T11:27:14Z) - Semi-Supervised Learning with Meta-Gradient [123.26748223837802]
半教師付き学習における簡単なメタ学習アルゴリズムを提案する。
その結果,提案アルゴリズムは最先端の手法に対して良好に動作することがわかった。
論文 参考訳(メタデータ) (2020-07-08T08:48:56Z) - Run2Survive: A Decision-theoretic Approach to Algorithm Selection based
on Survival Analysis [75.64261155172856]
生存分析(SA)は、自然に検閲されたデータをサポートし、アルゴリズムランタイムの分散モデルを学習するためにそのようなデータを使用する適切な方法を提供する。
我々は、アルゴリズム選択に対する洗練された決定論的アプローチの基礎として、そのようなモデルを活用し、Run2Surviveを疑う。
標準ベンチマークASlibによる広範な実験では、我々のアプローチは競争力が高く、多くの場合、最先端のASアプローチよりも優れていることが示されている。
論文 参考訳(メタデータ) (2020-07-06T15:20:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。