論文の概要: A Comprehensive Survey on Rare Event Prediction
- arxiv url: http://arxiv.org/abs/2309.11356v2
- Date: Sat, 05 Oct 2024 13:12:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-08 13:38:34.889524
- Title: A Comprehensive Survey on Rare Event Prediction
- Title(参考訳): レアイベント予測に関する総合的調査
- Authors: Chathurangi Shyalika, Ruwan Wickramarachchi, Amit Sheth,
- Abstract要約: 希少なイベント予測では、機械学習(ML)とデータ分析を使用して、低い確率でイベントを特定し、予測する。
本稿は,現状の文献のギャップを把握し,稀な事象を予測することの課題を明らかにすることを目的とする。
- 参考スコア(独自算出の注目度): 1.6385815610837167
- License:
- Abstract: Rare event prediction involves identifying and forecasting events with a low probability using machine learning (ML) and data analysis. Due to the imbalanced data distributions, where the frequency of common events vastly outweighs that of rare events, it requires using specialized methods within each step of the ML pipeline, i.e., from data processing to algorithms to evaluation protocols. Predicting the occurrences of rare events is important for real-world applications, such as Industry 4.0, and is an active research area in statistical and ML. This paper comprehensively reviews the current approaches for rare event prediction along four dimensions: rare event data, data processing, algorithmic approaches, and evaluation approaches. Specifically, we consider 73 datasets from different modalities (i.e., numerical, image, text, and audio), four major categories of data processing, five major algorithmic groupings, and two broader evaluation approaches. This paper aims to identify gaps in the current literature and highlight the challenges of predicting rare events. It also suggests potential research directions, which can help guide practitioners and researchers.
- Abstract(参考訳): 希少なイベント予測では、機械学習(ML)とデータ分析を使用して、低い確率でイベントを特定し、予測する。
一般的なイベントの頻度が稀なイベントよりもはるかに多い不均衡なデータ分散のため、MLパイプラインの各ステップ、すなわちデータ処理からアルゴリズム、評価プロトコルまで、特別なメソッドを使用する必要がある。
産業4.0のような現実の応用には稀な事象の発生を予測することが重要であり、統計学やMLにおいて活発な研究領域である。
本稿では、レアイベントデータ、データ処理、アルゴリズムアプローチ、評価アプローチの4つの側面に沿って、レアイベント予測の現在のアプローチを包括的にレビューする。
具体的には、異なるモード(数値、画像、テキスト、音声)のデータセット73、データ処理の4つの主要なカテゴリ、5つの主要なアルゴリズムグループ化、そして2つのより広範な評価アプローチについて検討する。
本稿は,現状の文献のギャップを把握し,稀な事象を予測することの課題を明らかにすることを目的とする。
また、専門家や研究者をガイドする研究の方向性も示唆している。
関連論文リスト
- Evaluating the Role of Data Enrichment Approaches Towards Rare Event Analysis in Manufacturing [1.3980986259786223]
希少な出来事は、一般的な通常の出来事よりもはるかに低い頻度で起こる出来事である。
製造業では、計画外のダウンタイム、設備寿命の短縮、高エネルギー消費につながるため、このような事象を予測することが特に重要である。
本稿では,データエンリッチメント技術と教師付き機械学習技術を組み合わせて,まれな事象の検出と予測を行う役割について検討する。
論文 参考訳(メタデータ) (2024-07-01T00:05:56Z) - Event Detection in Time Series: Universal Deep Learning Approach [0.0]
時系列におけるイベント検出は、不均衡なデータセット、まれなイベント、時間間隔定義イベントの頻度のため、困難なタスクである。
本稿では,教師付き回帰に基づく深層学習手法を提案する。
当社のアプローチは、まれなイベントや不均衡なデータセットを含む、統合されたフレームワーク内で、さまざまな種類のイベントを効果的に処理できる。
論文 参考訳(メタデータ) (2023-11-27T09:33:56Z) - Towards Out-of-Distribution Sequential Event Prediction: A Causal
Treatment [72.50906475214457]
シーケンシャルなイベント予測の目標は、一連の歴史的なイベントに基づいて次のイベントを見積もることである。
実際には、次のイベント予測モデルは、一度に収集されたシーケンシャルなデータで訓練される。
文脈固有の表現を学習するための階層的な分岐構造を持つフレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-24T07:54:13Z) - Systematic Evaluation of Predictive Fairness [60.0947291284978]
バイアス付きデータセットのトレーニングにおけるバイアスの緩和は、重要なオープンな問題である。
複数のタスクにまたがる様々なデバイアス化手法の性能について検討する。
データ条件が相対モデルの性能に強い影響を与えることがわかった。
論文 参考訳(メタデータ) (2022-10-17T05:40:13Z) - Predicting Seriousness of Injury in a Traffic Accident: A New Imbalanced
Dataset and Benchmark [62.997667081978825]
本稿では,交通事故における傷害の重大性を予測するために,機械学習アルゴリズムの性能を評価する新しいデータセットを提案する。
データセットは、英国運輸省から公開されているデータセットを集約することで作成される。
論文 参考訳(メタデータ) (2022-05-20T21:15:26Z) - Robust Event Classification Using Imperfect Real-world PMU Data [58.26737360525643]
本研究では,不完全な実世界のファサー計測単位(PMU)データを用いて,ロバストな事象分類について検討する。
我々は、堅牢なイベント分類器を訓練するための新しい機械学習フレームワークを開発する。
論文 参考訳(メタデータ) (2021-10-19T17:41:43Z) - Combining Feature and Instance Attribution to Detect Artifacts [62.63504976810927]
トレーニングデータアーティファクトの識別を容易にする手法を提案する。
提案手法は,トレーニングデータのアーティファクトの発見に有効であることを示す。
我々は,これらの手法が実際にNLP研究者にとって有用かどうかを評価するために,小規模なユーザスタディを実施している。
論文 参考訳(メタデータ) (2021-07-01T09:26:13Z) - Unsupervised Event Detection, Clustering, and Use Case Exposition in
Micro-PMU Measurements [0.0]
我々はGAN(Generative Adversarial Networks)の概念に基づく教師なしイベント検出手法を開発した。
また,線形混合整数計画法に基づく2段階のアン教師なしクラスタリング手法を提案する。
結果から,本研究で広く普及している手法に勝るものであることが示唆された。
論文 参考訳(メタデータ) (2020-07-30T05:20:29Z) - Event Prediction in the Big Data Era: A Systematic Survey [7.3810864598379755]
ビッグデータ時代において、イベント予測は実行可能な選択肢になりつつある。
本稿では,イベント予測の技術,応用,評価について,体系的かつ包括的な調査を行うことを目的とする。
論文 参考訳(メタデータ) (2020-07-19T23:24:52Z) - MAVEN: A Massive General Domain Event Detection Dataset [56.00401399384715]
イベント検出(ED)は、プレーンテキストからイベント知識を抽出する最初の、最も基本的なステップである。
既存のデータセットは、EDのさらなる開発を制限する問題を示す。
我々は,4,480のウィキペディア文書,118,732のイベント参照インスタンス,168のイベントタイプを含むMAVEN(Massive eVENt detection dataset)を提案する。
論文 参考訳(メタデータ) (2020-04-28T15:25:19Z) - Multi-label Prediction in Time Series Data using Deep Neural Networks [19.950094635430048]
本稿では,多次元時系列データに対するマルチラベル予測故障分類問題に対処する。
提案アルゴリズムは2つの公開ベンチマークデータセットで検証される。
論文 参考訳(メタデータ) (2020-01-27T21:35:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。