論文の概要: Generative Pre-Training of Time-Series Data for Unsupervised Fault Detection in Semiconductor Manufacturing
- arxiv url: http://arxiv.org/abs/2309.11427v2
- Date: Wed, 27 Mar 2024 14:02:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-28 23:02:36.336802
- Title: Generative Pre-Training of Time-Series Data for Unsupervised Fault Detection in Semiconductor Manufacturing
- Title(参考訳): 半導体製造における教師なし故障検出のための時系列データの生成前評価
- Authors: Sewoong Lee, JinKyou Choi, Min Su Kim,
- Abstract要約: 本稿では,畳み込み・生成事前学習型変換器を用いた時系列異常検出のためのTRACE-GPTを提案する。
私たちのモデルは、すべてのデータセットでEER(Equal Error Rate)が最も高いF1スコアを持ち、オープンデータセットの監督された最先端ベースラインよりわずか0.026低い。
- 参考スコア(独自算出の注目度): 20.71342655519934
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper introduces TRACE-GPT, which stands for Time-seRies Anomaly-detection with Convolutional Embedding and Generative Pre-trained Transformers. TRACE-GPT is designed to pre-train univariate time-series sensor data and detect faults on unlabeled datasets in semiconductor manufacturing. In semiconductor industry, classifying abnormal time-series sensor data from normal data is important because it is directly related to wafer defect. However, small, unlabeled, and even mixed training data without enough anomalies make classification tasks difficult. In this research, we capture features of time-series data with temporal convolutional embedding and Generative Pre-trained Transformer (GPT) to classify abnormal sequences from normal sequences using cross entropy loss. We prove that our model shows better performance than previous unsupervised models with both an open dataset, the University of California Riverside (UCR) time-series classification archive, and the process log of our Chemical Vapor Deposition (CVD) equipment. Our model has the highest F1 score at Equal Error Rate (EER) across all datasets and is only 0.026 below the supervised state-of-the-art baseline on the open dataset.
- Abstract(参考訳): 本稿では,畳み込み・生成事前学習型変換器を用いた時系列異常検出のためのTRACE-GPTを提案する。
TRACE-GPTは、単変量時系列センサデータを事前訓練し、半導体製造におけるラベルなしデータセット上の障害を検出するように設計されている。
半導体産業では、ウエハ欠陥に直接関係しているため、正常データから異常時系列センサデータを分類することが重要である。
しかし、十分な異常のない小さな、ラベルなし、さらには混合トレーニングデータさえも、分類タスクを困難にしている。
本研究では,時間的畳み込み埋め込みと生成事前学習変換器(GPT)を用いた時系列データの特徴を抽出し,クロスエントロピー損失を用いた正規シーケンスから異常シーケンスを分類する。
我々は,オープンデータセット,カリフォルニア大学リバーサイド校(UCR)時系列分類アーカイブ,CVD機器のプロセスログの両方を用いて,従来の教師なしモデルよりも優れた性能を示すことを示す。
私たちのモデルは、すべてのデータセットでEER(Equal Error Rate)が最も高いF1スコアを持ち、オープンデータセットの監督された最先端ベースラインよりわずか0.026低い。
関連論文リスト
- Leveraging Latent Diffusion Models for Training-Free In-Distribution Data Augmentation for Surface Defect Detection [9.784793380119806]
データ拡張のためのトレーニング不要な拡散型In-Distribution Anomaly GenerationパイプラインであるDIAGを紹介する。
従来の画像生成技術とは異なり、我々は、ドメインの専門家がモデルにマルチモーダルガイダンスを提供する、Human-in-the-loopパイプラインを実装している。
我々は、挑戦的なKSDD2データセットに対する最先端データ拡張アプローチに関して、DIAGの有効性と汎用性を実証する。
論文 参考訳(メタデータ) (2024-07-04T14:28:52Z) - EntropyStop: Unsupervised Deep Outlier Detection with Loss Entropy [19.154826741973277]
ロスエントロピー (Loss Entropy) と呼ばれるゼロラベルのエントロピー距離を損失分布として提案する。
また、損失エントロピーが最大モデル検出能力を示す場合、トレーニングを停止する自動早期停止アルゴリズムEntropyStopを開発した。
論文 参考訳(メタデータ) (2024-05-21T05:17:43Z) - Graph Spatiotemporal Process for Multivariate Time Series Anomaly
Detection with Missing Values [67.76168547245237]
本稿では,グラフ時間過程と異常スコアラを用いて異常を検出するGST-Proという新しいフレームワークを提案する。
実験結果から,GST-Pro法は時系列データ中の異常を効果的に検出し,最先端の手法より優れていることがわかった。
論文 参考訳(メタデータ) (2024-01-11T10:10:16Z) - LARA: A Light and Anti-overfitting Retraining Approach for Unsupervised
Time Series Anomaly Detection [49.52429991848581]
深部変分自動エンコーダに基づく時系列異常検出手法(VAE)のための光・反オーバーフィット学習手法(LARA)を提案する。
本研究の目的は,1) 再学習過程を凸問題として定式化し, 過度に収束できること,2) 履歴データを保存せずに活用するルミネートブロックを設計すること,3) 潜在ベクトルと再構成データの微調整を行うと, 線形形成が基底真実と微調整されたブロックとの誤りを最小に調整できることを数学的に証明することである。
論文 参考訳(メタデータ) (2023-10-09T12:36:16Z) - Imbalanced Aircraft Data Anomaly Detection [103.01418862972564]
航空シナリオ下でのセンサーからの時間データの異常検出は実用的だが難しい課題である。
本稿では,グラフィカル・テンポラル・データ分析フレームワークを提案する。
シリーズ・トゥ・イメージ (S2I) と呼ばれる3つのモジュール、ユークリッド距離 (CRD) を用いたクラスタ・ベース・リサンプリング・アプローチ、変数・ベース・ロス (VBL) から構成される。
論文 参考訳(メタデータ) (2023-05-17T09:37:07Z) - AnomalyBERT: Self-Supervised Transformer for Time Series Anomaly
Detection using Data Degradation Scheme [0.7216399430290167]
時系列、特にラベルなしデータに対する異常検出タスクは、難しい問題である。
自己教師型モデルトレーニングに適切なデータ劣化スキームを適用することで、この問題に対処する。
自己認識機構に触発されて、時間的文脈を認識するトランスフォーマーベースのアーキテクチャを設計する。
論文 参考訳(メタデータ) (2023-05-08T05:42:24Z) - Are we certain it's anomalous? [57.729669157989235]
時系列における異常検出は、高度に非線形な時間的相関のため、異常は稀であるため、複雑なタスクである。
本稿では,異常検出(HypAD)におけるハイパボリック不確実性の新しい利用法を提案する。
HypADは自己指導で入力信号を再構築する。
論文 参考訳(メタデータ) (2022-11-16T21:31:39Z) - DEGAN: Time Series Anomaly Detection using Generative Adversarial
Network Discriminators and Density Estimation [0.0]
我々は,GANに基づく異常検出フレームワークDEGANを提案する。
これは、適切に構成された識別器(D)をスタンドアロンの異常予測器に訓練するための入力として、通常の時系列データにのみ依存する。
論文 参考訳(メタデータ) (2022-10-05T04:32:12Z) - ALGAN: Anomaly Detection by Generating Pseudo Anomalous Data via Latent
Variables [17.53032543377636]
本稿では,GANジェネレータが偽アノマラスデータと偽正規データを生成する異常潜伏変数生成適応ネットワーク(ALGAN)を提案する。
提案した ALGAN は最先端の手法に匹敵する AUROC を示しながら予測時間を短縮した。
論文 参考訳(メタデータ) (2022-02-21T14:53:05Z) - Deep Transformer Networks for Time Series Classification: The NPP Safety
Case [59.20947681019466]
時間依存nppシミュレーションデータをモデル化するために、教師付き学習方法でトランスフォーマと呼ばれる高度なテンポラルニューラルネットワークを使用する。
トランスはシーケンシャルデータの特性を学習し、テストデータセット上で約99%の分類精度で有望な性能が得られる。
論文 参考訳(メタデータ) (2021-04-09T14:26:25Z) - TadGAN: Time Series Anomaly Detection Using Generative Adversarial
Networks [73.01104041298031]
TadGANは、GAN(Generative Adversarial Networks)上に構築された教師なしの異常検出手法である。
時系列の時間相関を捉えるために,ジェネレータと批評家のベースモデルとしてLSTMリカレントニューラルネットワークを用いる。
提案手法の性能と一般化性を示すため,いくつかの異常スコアリング手法を検証し,最も適した手法を報告する。
論文 参考訳(メタデータ) (2020-09-16T15:52:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。