論文の概要: A Comprehensive Survey on Rare Event Prediction
- arxiv url: http://arxiv.org/abs/2309.11356v1
- Date: Wed, 20 Sep 2023 14:36:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-21 15:51:35.938890
- Title: A Comprehensive Survey on Rare Event Prediction
- Title(参考訳): レアイベント予測に関する総合的調査
- Authors: Chathurangi Shyalika, Ruwan Wickramarachchi, Amit Sheth
- Abstract要約: 本稿は,現状の文献のギャップを把握し,稀な事象を予測することの課題を明らかにすることを目的とする。
また、専門家や研究者をガイドする研究の方向性も示唆している。
- 参考スコア(独自算出の注目度): 1.8416014644193066
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Rare event prediction involves identifying and forecasting events with a low
probability using machine learning and data analysis. Due to the imbalanced
data distributions, where the frequency of common events vastly outweighs that
of rare events, it requires using specialized methods within each step of the
machine learning pipeline, i.e., from data processing to algorithms to
evaluation protocols. Predicting the occurrences of rare events is important
for real-world applications, such as Industry 4.0, and is an active research
area in statistical and machine learning. This paper comprehensively reviews
the current approaches for rare event prediction along four dimensions: rare
event data, data processing, algorithmic approaches, and evaluation approaches.
Specifically, we consider 73 datasets from different modalities (i.e.,
numerical, image, text, and audio), four major categories of data processing,
five major algorithmic groupings, and two broader evaluation approaches. This
paper aims to identify gaps in the current literature and highlight the
challenges of predicting rare events. It also suggests potential research
directions, which can help guide practitioners and researchers.
- Abstract(参考訳): まれな事象予測は、機械学習とデータ分析を使用して、低い確率でイベントを識別および予測することを含む。
一般的なイベントの頻度が稀なイベントの頻度を大幅に上回る不均衡なデータ分布のため、機械学習パイプラインの各ステップ、すなわちデータ処理からアルゴリズム、評価プロトコルまで、特別なメソッドを使用する必要がある。
産業4.0のような現実の応用には稀な事象の発生を予測することが重要であり、統計学や機械学習において活発な研究領域である。
本稿では,レアイベントデータ,データ処理,アルゴリズム手法,評価手法という4次元のレアイベント予測手法について概説する。
具体的には、異なるモダリティ(数値、画像、テキスト、音声など)の73のデータセット、データ処理の4つの主要なカテゴリ、5つの主要なアルゴリズムのグループ化、2つの広範な評価アプローチを検討する。
本稿では,現在の文献におけるギャップを特定し,希少事象の予測の課題を浮き彫りにする。
また、実践者や研究者の指導に役立つ研究の方向性も示唆している。
関連論文リスト
- Stochastic Amortization: A Unified Approach to Accelerate Feature and
Data Attribution [67.28273187033693]
アモート化(amortization)と呼ばれる,所望の出力を直接予測するネットワークのトレーニングは安価で,驚くほど効果的であることを示す。
このアプローチは、いくつかの特徴属性とデータ評価手法を著しく加速し、しばしば既存のアプローチよりも桁違いにスピードアップする。
論文 参考訳(メタデータ) (2024-01-29T03:42:37Z) - Event Detection in Time Series: Universal Deep Learning Approach [0.0]
時系列におけるイベント検出は、不均衡なデータセット、まれなイベント、時間間隔定義イベントの頻度のため、困難なタスクである。
本稿では,教師付き回帰に基づく深層学習手法を提案する。
当社のアプローチは、まれなイベントや不均衡なデータセットを含む、統合されたフレームワーク内で、さまざまな種類のイベントを効果的に処理できる。
論文 参考訳(メタデータ) (2023-11-27T09:33:56Z) - Systematic Evaluation of Predictive Fairness [60.0947291284978]
バイアス付きデータセットのトレーニングにおけるバイアスの緩和は、重要なオープンな問題である。
複数のタスクにまたがる様々なデバイアス化手法の性能について検討する。
データ条件が相対モデルの性能に強い影響を与えることがわかった。
論文 参考訳(メタデータ) (2022-10-17T05:40:13Z) - Predicting Seriousness of Injury in a Traffic Accident: A New Imbalanced
Dataset and Benchmark [62.997667081978825]
本稿では,交通事故における傷害の重大性を予測するために,機械学習アルゴリズムの性能を評価する新しいデータセットを提案する。
データセットは、英国運輸省から公開されているデータセットを集約することで作成される。
論文 参考訳(メタデータ) (2022-05-20T21:15:26Z) - Robust Event Classification Using Imperfect Real-world PMU Data [58.26737360525643]
本研究では,不完全な実世界のファサー計測単位(PMU)データを用いて,ロバストな事象分類について検討する。
我々は、堅牢なイベント分類器を訓練するための新しい機械学習フレームワークを開発する。
論文 参考訳(メタデータ) (2021-10-19T17:41:43Z) - Deep Learning Schema-based Event Extraction: Literature Review and
Current Trends [60.29289298349322]
ディープラーニングに基づくイベント抽出技術が研究ホットスポットとなっている。
本稿では,ディープラーニングモデルに焦点をあて,最先端のアプローチを見直し,そのギャップを埋める。
論文 参考訳(メタデータ) (2021-07-05T16:32:45Z) - Event-Related Bias Removal for Real-time Disaster Events [67.2965372987723]
ソーシャルメディアは、自然災害や大量攻撃などの危機事象に関する情報を共有する重要なツールとなっている。
有用な情報を含む実行可能なポストを検出するには、大量のデータをリアルタイムに高速に分析する必要がある。
我々は、潜在事象固有のバイアスを除去し、ツイート重要度分類の性能を向上させるために、敵対的ニューラルモデルを訓練する。
論文 参考訳(メタデータ) (2020-11-02T02:03:07Z) - Exathlon: A Benchmark for Explainable Anomaly Detection over Time Series [6.085662888748731]
本稿では,高次元時系列データを用いた説明可能な異常検出のための最初のベンチマークであるExathlonを提案する。
Exathlonは、Apache Sparkクラスタ上で大規模なストリーム処理ジョブを繰り返し実行する実際のデータトレースに基づいて構築されている。
各異常事例について、根本原因区間の接地真理ラベルと、延長効果区間の接地真理ラベルとを設ける。
論文 参考訳(メタデータ) (2020-10-10T19:31:22Z) - Unsupervised Event Detection, Clustering, and Use Case Exposition in
Micro-PMU Measurements [0.0]
我々はGAN(Generative Adversarial Networks)の概念に基づく教師なしイベント検出手法を開発した。
また,線形混合整数計画法に基づく2段階のアン教師なしクラスタリング手法を提案する。
結果から,本研究で広く普及している手法に勝るものであることが示唆された。
論文 参考訳(メタデータ) (2020-07-30T05:20:29Z) - Event Prediction in the Big Data Era: A Systematic Survey [7.3810864598379755]
ビッグデータ時代において、イベント予測は実行可能な選択肢になりつつある。
本稿では,イベント予測の技術,応用,評価について,体系的かつ包括的な調査を行うことを目的とする。
論文 参考訳(メタデータ) (2020-07-19T23:24:52Z) - Multi-label Prediction in Time Series Data using Deep Neural Networks [19.950094635430048]
本稿では,多次元時系列データに対するマルチラベル予測故障分類問題に対処する。
提案アルゴリズムは2つの公開ベンチマークデータセットで検証される。
論文 参考訳(メタデータ) (2020-01-27T21:35:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。