論文の概要: Data-level hybrid strategy selection for disk fault prediction model
based on multivariate GAN
- arxiv url: http://arxiv.org/abs/2310.06537v1
- Date: Tue, 10 Oct 2023 11:34:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-11 15:45:43.606900
- Title: Data-level hybrid strategy selection for disk fault prediction model
based on multivariate GAN
- Title(参考訳): 多変量GANに基づくディスク故障予測モデルのデータレベルハイブリッド戦略選択
- Authors: Shuangshuang Yuan, Peng Wu and Yuehui Chen
- Abstract要約: データクラスの不均衡は、分類問題において一般的な問題であり、マイノリティクラスのサンプルは、しばしば誤分類するためにより重要でコストがかかる。
SMARTデータセットは、かなりの量の健康サンプルと比較的限られた数の欠陥サンプルからなる明らかなクラス不均衡を示す。
このデータセットは、ディスクの健康状態の信頼できる指標として機能する。
- 参考スコア(独自算出の注目度): 7.270429986841776
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data class imbalance is a common problem in classification problems, where
minority class samples are often more important and more costly to misclassify
in a classification task. Therefore, it is very important to solve the data
class imbalance classification problem. The SMART dataset exhibits an evident
class imbalance, comprising a substantial quantity of healthy samples and a
comparatively limited number of defective samples. This dataset serves as a
reliable indicator of the disc's health status. In this paper, we obtain the
best balanced disk SMART dataset for a specific classification model by mixing
and integrating the data synthesised by multivariate generative adversarial
networks (GAN) to balance the disk SMART dataset at the data level; and combine
it with genetic algorithms to obtain higher disk fault classification
prediction accuracy on a specific classification model.
- Abstract(参考訳): データクラスの不均衡は分類問題において一般的な問題であり、マイノリティクラスのサンプルは分類タスクで誤分類するのがより重要でコストがかかることが多い。
したがって、データクラス不均衡分類問題を解くことは極めて重要である。
SMARTデータセットは、かなりの量の健康サンプルと比較的限られた数の欠陥サンプルからなる明らかなクラス不均衡を示す。
このデータセットは、ディスクの健康状態の信頼できる指標として機能する。
本稿では,多変量生成逆向ネットワーク(gan)で合成されたデータを混合統合し,データレベルでのディスクスマートデータセットのバランスをとることにより,特定の分類モデルに対して最適なバランスのとれたディスクスマートデータセットを得るとともに,遺伝的アルゴリズムと組み合わせて,特定の分類モデルにおいて高いディスク障害分類予測精度を得る。
関連論文リスト
- Iterative Online Image Synthesis via Diffusion Model for Imbalanced
Classification [29.730360798234294]
医用画像分類におけるクラス不均衡問題に対処するための反復オンライン画像合成フレームワークを提案する。
このフレームワークにはオンライン画像合成(OIS)と精度適応サンプリング(AAS)という2つの重要なモジュールが組み込まれている。
不均衡な分類に対処するための提案手法の有効性を評価するため,HAM10000およびAPTOSデータセットを用いて実験を行った。
論文 参考訳(メタデータ) (2024-03-13T10:51:18Z) - A Survey of Methods for Handling Disk Data Imbalance [10.261915886145214]
本稿では、不均衡データ分類の分野における研究の概要について概観する。
Backblazeデータセットは、ハードディスクに関連する広く使用されているデータセットであり、少量の障害データと大量の健康データを持ち、深刻なクラス不均衡を示す。
論文 参考訳(メタデータ) (2023-10-13T05:35:13Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Class-Specific Distribution Alignment for Semi-Supervised Medical Image
Classification [14.343079589464994]
CSDA(Class-Specific Distribution Alignment)は、自己学習に基づく半教師付き学習フレームワークである。
本手法は, 半教師付き皮膚疾患, 胸部疾患, 内視鏡的画像分類作業において, 競争力を発揮することを示す。
論文 参考訳(メタデータ) (2023-07-29T13:38:19Z) - Class-Balancing Diffusion Models [57.38599989220613]
クラスバランシング拡散モデル(CBDM)は、分散調整正規化器をソリューションとして訓練する。
提案手法は,CIFAR100/CIFAR100LTデータセットで生成結果をベンチマークし,下流認識タスクにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2023-04-30T20:00:14Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - PLM: Partial Label Masking for Imbalanced Multi-label Classification [59.68444804243782]
長いラベルの分布を持つ実世界のデータセットで訓練されたニューラルネットワークは、頻繁なクラスに偏りがあり、頻繁なクラスでは不十分である。
本稿では,この比率を利用したPLM(Partial Label Masking)を提案する。
本手法は,マルチラベル (MultiMNIST と MSCOCO) とシングルラベル (CIFAR-10 と CIFAR-100) の2つの画像分類データセットにおいて,既存の手法と比較して高い性能を実現する。
論文 参考訳(メタデータ) (2021-05-22T18:07:56Z) - Weighted Least Squares Twin Support Vector Machine with Fuzzy Rough Set
Theory for Imbalanced Data Classification [0.483420384410068]
サポートベクトルマシン(SVM)は、分類問題を解決するために開発された強力な教師付き学習ツールである。
重み付き最小二乗支援ベクトルマシンFRLSTSVMにおけるファジィ粗集合理論を不均衡データの分類に効率的に利用する手法を提案する。
論文 参考訳(メタデータ) (2021-05-03T22:33:39Z) - RA-GCN: Graph Convolutional Network for Disease Prediction Problems with
Imbalanced Data [47.00510780034136]
クラス不均衡は疾患予測の分野でよく知られた問題である。
本稿では,グラフベースの分類器の性能を高めるために,Re-weighted Adversarial Graph Convolutional Network (RA-GCN)を提案する。
本研究では,ra-gcnの合成および3種類の医療用データセットに対する優越性を示す。
論文 参考訳(メタデータ) (2021-02-27T14:06:27Z) - Oversampling Adversarial Network for Class-Imbalanced Fault Diagnosis [12.526197448825968]
クラス不均衡問題は、データをタイムリーに予測し分類できる堅牢な学習システムを必要とする。
本稿では,同時分類と故障検出のための新しい対向ネットワークを提案する。
論文 参考訳(メタデータ) (2020-08-07T10:12:07Z) - Distribution Aligning Refinery of Pseudo-label for Imbalanced
Semi-supervised Learning [126.31716228319902]
Pseudo-label (DARP) アルゴリズムの分散アライメント・リファナリーを開発する。
DARPは最先端のSSLスキームと有効かつ効率的に互換性があることを示す。
論文 参考訳(メタデータ) (2020-07-17T09:16:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。