論文の概要: Evaluating the Role of Data Enrichment Approaches Towards Rare Event Analysis in Manufacturing
- arxiv url: http://arxiv.org/abs/2407.01644v1
- Date: Mon, 1 Jul 2024 00:05:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-03 19:52:16.195942
- Title: Evaluating the Role of Data Enrichment Approaches Towards Rare Event Analysis in Manufacturing
- Title(参考訳): 製造業におけるレアイベント分析に向けたデータエンリッチメント手法の役割評価
- Authors: Chathurangi Shyalika, Ruwan Wickramarachchi, Fadi El Kalach, Ramy Harik, Amit Sheth,
- Abstract要約: 希少な出来事は、一般的な通常の出来事よりもはるかに低い頻度で起こる出来事である。
製造業では、計画外のダウンタイム、設備寿命の短縮、高エネルギー消費につながるため、このような事象を予測することが特に重要である。
本稿では,データエンリッチメント技術と教師付き機械学習技術を組み合わせて,まれな事象の検出と予測を行う役割について検討する。
- 参考スコア(独自算出の注目度): 1.3980986259786223
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Rare events are occurrences that take place with a significantly lower frequency than more common regular events. In manufacturing, predicting such events is particularly important, as they lead to unplanned downtime, shortening equipment lifespan, and high energy consumption. The occurrence of events is considered frequently-rare if observed in more than 10% of all instances, very-rare if it is 1-5%, moderately-rare if it is 5-10%, and extremely-rare if less than 1%. The rarity of events is inversely correlated with the maturity of a manufacturing industry. Typically, the rarity of events affects the multivariate data generated within a manufacturing process to be highly imbalanced, which leads to bias in predictive models. This paper evaluates the role of data enrichment techniques combined with supervised machine-learning techniques for rare event detection and prediction. To address the data scarcity, we use time series data augmentation and sampling methods to amplify the dataset with more multivariate features and data points while preserving the underlying time series patterns in the combined alterations. Imputation techniques are used in handling null values in datasets. Considering 15 learning models ranging from statistical learning to machine learning to deep learning methods, the best-performing model for the selected datasets is obtained and the efficacy of data enrichment is evaluated. Based on this evaluation, our results find that the enrichment procedure enhances up to 48% of F1 measure in rare failure event detection and prediction of supervised prediction models. We also conduct empirical and ablation experiments on the datasets to derive dataset-specific novel insights. Finally, we investigate the interpretability aspect of models for rare event prediction, considering multiple methods.
- Abstract(参考訳): 希少な出来事は、一般的な通常の出来事よりもはるかに低い頻度で起こる出来事である。
製造業では、計画外のダウンタイム、設備寿命の短縮、高エネルギー消費につながるため、このような事象を予測することが特に重要である。
イベントの発生は、すべてのインスタンスの10%以上で観測された場合、非常に稀である場合、1-5%、中程度の場合、5-10%、そして1%未満の場合、非常に希である場合、頻繁であると考えられている。
イベントの希少性は、製造業の成熟度と逆相関している。
通常、イベントの希少性は製造プロセス内で生成される多変量データに非常に不均衡を与え、予測モデルに偏りをもたらす。
本稿では,データエンリッチメント技術と教師付き機械学習技術を組み合わせて,まれな事象の検出と予測を行う役割について検討する。
データ不足に対処するために、時系列データ拡張とサンプリング手法を用いて、データセットをより多変量の特徴とデータポイントで増幅し、基礎となる時系列パターンを組み合わせて保存する。
命令手法はデータセットのnull値の処理に使用される。
統計的学習から機械学習、深層学習に至るまでの15の学習モデルを考えると、選択したデータセットの最良の性能モデルが得られ、データ豊か化の有効性が評価される。
この評価結果から, 希少な故障事象の検出および教師付き予測モデルの予測において, F1 の 48% まで濃縮が促進されることが判明した。
また、データセットに関する経験的およびアブレーション実験を行い、データセット固有の新しい洞察を導出する。
最後に,複数の手法を考慮し,まれな事象予測のためのモデルの解釈可能性について検討する。
関連論文リスト
- ReFine: Boosting Time Series Prediction of Extreme Events by Reweighting and Fine-tuning [0.0]
衝撃的な出来事を表すため、極端に重要な出来事である。
極端な出来事を正確に予測することは 困難です 希少さと不規則さのために
課題に対処するために、再重み付けと微調整という2つの戦略を提案する。
論文 参考訳(メタデータ) (2024-09-21T19:29:29Z) - Measuring and Improving Attentiveness to Partial Inputs with Counterfactuals [91.59906995214209]
我々は,新しい評価手法であるCAT(Facterfactual Attentiveness Test)を提案する。
CATは、入力の一部を別の例から別の例に置き換えることで、予測を変更する注意深いモデルを期待することで、反事実を使用する。
実験データの精度が向上する一方, GPT3 は実演回数の増加により注意力の低下がみられた。
論文 参考訳(メタデータ) (2023-11-16T06:27:35Z) - A Comprehensive Survey on Rare Event Prediction [1.6385815610837167]
希少なイベント予測では、機械学習(ML)とデータ分析を使用して、低い確率でイベントを特定し、予測する。
本稿は,現状の文献のギャップを把握し,稀な事象を予測することの課題を明らかにすることを目的とする。
論文 参考訳(メタデータ) (2023-09-20T14:36:57Z) - DeepVol: Volatility Forecasting from High-Frequency Data with Dilated Causal Convolutions [53.37679435230207]
本稿では,Dilated Causal Convolutionsに基づくDeepVolモデルを提案する。
実験結果から,提案手法は高頻度データからグローバルな特徴を効果的に学習できることが示唆された。
論文 参考訳(メタデータ) (2022-09-23T16:13:47Z) - Impact of Pretraining Term Frequencies on Few-Shot Reasoning [51.990349528930125]
事前学習された言語モデルが、事前学習データにおいてあまり頻度の低い用語でどの程度理にかなっているかを検討する。
我々は,様々な数値推論タスクにおいて,GPTに基づく言語モデルに対して,この相関関係の強さを計測する。
LMは数秒の数値推論タスクにおいて高い性能を示すが,本研究の結果は,事前学習データを超えるモデルが実際にどれだけ一般化されるのかという疑問を提起する。
論文 参考訳(メタデータ) (2022-02-15T05:43:54Z) - Monte Carlo EM for Deep Time Series Anomaly Detection [6.312089019297173]
時系列データは、しばしば外れ値や他の種類の異常によって破壊される。
異常検出と予測への最近のアプローチは、トレーニングデータの異常の割合が無視できるほど小さいと仮定している。
本稿では,既存の時系列モデルを拡張して,トレーニングデータの異常を明示的に考慮する手法を提案する。
論文 参考訳(メタデータ) (2021-12-29T07:52:36Z) - Outlier Detection as Instance Selection Method for Feature Selection in
Time Series Classification [0.0]
まれなインスタンスのための機能選択メソッドに提供されるフィルタインスタンス。
一部のデータセットでは、結果としてパフォーマンスが向上したのはわずか数パーセントだった。
他のデータセットでは、最大16%のパフォーマンス向上を実現しました。
論文 参考訳(メタデータ) (2021-11-16T14:44:33Z) - Towards Synthetic Multivariate Time Series Generation for Flare
Forecasting [5.098461305284216]
データ駆動・レアイベント予測アルゴリズムのトレーニングにおける制限要因の1つは、関心のあるイベントの不足である。
本研究では,データインフォームド・オーバーサンプリングを行う手段として,条件付き生成逆数ネットワーク(CGAN)の有用性を検討する。
論文 参考訳(メタデータ) (2021-05-16T22:23:23Z) - Ambiguity in Sequential Data: Predicting Uncertain Futures with
Recurrent Models [110.82452096672182]
逐次データによる曖昧な予測を扱うために,Multiple hypothesis Prediction(MHP)モデルの拡張を提案する。
また、不確実性を考慮するのに適した曖昧な問題に対する新しい尺度も導入する。
論文 参考訳(メタデータ) (2020-03-10T09:15:42Z) - A Multi-Channel Neural Graphical Event Model with Negative Evidence [76.51278722190607]
イベントデータセットは、タイムライン上で不規則に発生するさまざまなタイプのイベントのシーケンスである。
基礎となる強度関数を推定するために,非パラメトリックディープニューラルネットワーク手法を提案する。
論文 参考訳(メタデータ) (2020-02-21T23:10:50Z) - Transformer Hawkes Process [79.16290557505211]
本稿では,長期的依存関係を捕捉する自己認識機構を利用したTransformer Hawkes Process (THP) モデルを提案する。
THPは、有意なマージンによる可能性と事象予測の精度の両方の観点から、既存のモデルより優れている。
本稿では、THPが関係情報を組み込む際に、複数の点過程を学習する際の予測性能の改善を実現する具体例を示す。
論文 参考訳(メタデータ) (2020-02-21T13:48:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。