論文の概要: The Integrity of Machine Learning Algorithms against Software Defect
Prediction
- arxiv url: http://arxiv.org/abs/2009.02571v1
- Date: Sat, 5 Sep 2020 17:26:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-21 20:53:28.410874
- Title: The Integrity of Machine Learning Algorithms against Software Defect
Prediction
- Title(参考訳): ソフトウェア欠陥予測に対する機械学習アルゴリズムの完全性
- Authors: Param Khakhar and, Rahul Kumar Dubey, Senior Member IEEE
- Abstract要約: 本報告では,Liangらが開発したオンラインシーケンス・エクストリーム・ラーニング・マシン(OS-ELM)の性能を解析する。
OS-ELMは従来のディープニューラルネットワークよりも高速にトレーニングし、常にグローバルな最適解に収束する。
この分析は、NASAグループが実施する3つのプロジェクトKC1、PC4、PC3で実施される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The increased computerization in recent years has resulted in the production
of a variety of different software, however measures need to be taken to ensure
that the produced software isn't defective. Many researchers have worked in
this area and have developed different Machine Learning-based approaches that
predict whether the software is defective or not. This issue can't be resolved
simply by using different conventional classifiers because the dataset is
highly imbalanced i.e the number of defective samples detected is extremely
less as compared to the number of non-defective samples. Therefore, to address
this issue, certain sophisticated methods are required. The different methods
developed by the researchers can be broadly classified into Resampling based
methods, Cost-sensitive learning-based methods, and Ensemble Learning. Among
these methods. This report analyses the performance of the Online Sequential
Extreme Learning Machine (OS-ELM) proposed by Liang et.al. against several
classifiers such as Logistic Regression, Support Vector Machine, Random Forest,
and Na\"ive Bayes after oversampling the data. OS-ELM trains faster than
conventional deep neural networks and it always converges to the globally
optimal solution. A comparison is performed on the original dataset as well as
the over-sampled data set. The oversampling technique used is Cluster-based
Over-Sampling with Noise Filtering. This technique is better than several
state-of-the-art techniques for oversampling. The analysis is carried out on 3
projects KC1, PC4 and PC3 carried out by the NASA group. The metrics used for
measurement are recall and balanced accuracy. The results are higher for OS-ELM
as compared to other classifiers in both scenarios.
- Abstract(参考訳): 近年のコンピュータ化の増加により、様々なソフトウェアが生産されるようになったが、生産されたソフトウェアに欠陥がないよう対策を講じる必要がある。
多くの研究者がこの分野に取り組み、ソフトウェアが欠陥があるかどうかを予測する機械学習ベースのアプローチを開発した。
この問題は、データセットが高度に不均衡であるため、従来の分類器が異なるだけでは解決できない。
そのため、この問題に対処するためには、ある種の高度な手法が必要である。
研究者によって開発された異なる手法は、Resamplingベースの方法、コスト感受性学習ベースの方法、およびEnsemble Learningに分類される。
これらの方法の1つ。
本報告では,Liangらが開発したオンラインシーケンス・エクストリーム・ラーニング・マシン(OS-ELM)の性能を解析する。
Logistic Regression、Support Vector Machine、Random Forest、Na\"ive Bayesといったいくつかの分類子に対して、データをオーバーサンプリングする。
os-elmは従来のディープニューラルネットワークよりも高速にトレーニングし、常にグローバル最適解に収束する。
元のデータセットとオーバーサンプリングされたデータセットで比較を行う。
オーバーサンプリング技術は、ノイズフィルタを用いたクラスタベースのオーバーサンプリングである。
このテクニックは、オーバーサンプリングのための最先端技術よりも優れている。
この分析は、NASAグループが実施する3つのプロジェクトKC1、PC4、PC3で実施される。
測定に用いられるメトリクスは、リコールとバランスの取れた精度である。
どちらのシナリオにおいても,OS-ELM は他の分類器よりも高い結果が得られる。
関連論文リスト
- Generalized Oversampling for Learning from Imbalanced datasets and
Associated Theory [0.0]
教師あり学習では、実際の不均衡なデータセットに直面することが多い。
本稿では,カーネル密度推定に基づくデータ拡張手法であるGOLIATHアルゴリズムを提案する。
我々は,不均衡な回帰状況下でのGOLIATHアルゴリズムの性能を評価する。
論文 参考訳(メタデータ) (2023-08-05T23:08:08Z) - Compound Batch Normalization for Long-tailed Image Classification [77.42829178064807]
本稿では,ガウス混合に基づく複合バッチ正規化法を提案する。
機能空間をより包括的にモデル化し、ヘッドクラスの優位性を減らすことができる。
提案手法は,画像分類における既存の手法よりも優れている。
論文 参考訳(メタデータ) (2022-12-02T07:31:39Z) - Intra-class Adaptive Augmentation with Neighbor Correction for Deep
Metric Learning [99.14132861655223]
深層学習のためのクラス内適応拡張(IAA)フレームワークを提案する。
クラスごとのクラス内変動を合理的に推定し, 適応型合成試料を生成し, 硬質試料の採掘を支援する。
本手法は,検索性能の最先端手法を3%~6%向上させる。
論文 参考訳(メタデータ) (2022-11-29T14:52:38Z) - Towards Automated Imbalanced Learning with Deep Hierarchical
Reinforcement Learning [57.163525407022966]
不均衡学習はデータマイニングにおいて基本的な課題であり、各クラスにトレーニングサンプルの不均等な比率が存在する。
オーバーサンプリングは、少数民族のための合成サンプルを生成することによって、不均衡な学習に取り組む効果的な手法である。
我々は,異なるレベルの意思決定を共同で最適化できる自動オーバーサンプリングアルゴリズムであるAutoSMOTEを提案する。
論文 参考訳(メタデータ) (2022-08-26T04:28:01Z) - SreaMRAK a Streaming Multi-Resolution Adaptive Kernel Algorithm [60.61943386819384]
既存のKRRの実装では、すべてのデータがメインメモリに格納される必要がある。
KRRのストリーミング版であるStreaMRAKを提案する。
本稿では,2つの合成問題と2重振り子の軌道予測について紹介する。
論文 参考訳(メタデータ) (2021-08-23T21:03:09Z) - Memory-Based Optimization Methods for Model-Agnostic Meta-Learning and
Personalized Federated Learning [56.17603785248675]
モデルに依存しないメタラーニング (MAML) が人気のある研究分野となっている。
既存のMAMLアルゴリズムは、イテレーション毎にメタモデルを更新するためにいくつかのタスクとデータポイントをサンプリングすることで、エピソードのアイデアに依存している。
本稿では,MAMLのメモリベースアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-06-09T08:47:58Z) - DPER: Efficient Parameter Estimation for Randomly Missing Data [0.24466725954625884]
本稿では,1クラス・複数クラスのランダムに欠落したデータセットに対して,最大推定値(MLE)を求めるアルゴリズムを提案する。
我々のアルゴリズムは、データを通して複数のイテレーションを必要としないので、他の方法よりも時間のかかることを約束します。
論文 参考訳(メタデータ) (2021-06-06T16:37:48Z) - A Novel Resampling Technique for Imbalanced Dataset Optimization [1.0323063834827415]
まれなイベントの分類は、詐欺取引、マルウェアトラフィック分析、ネットワーク侵入検出など、多くのドメインで一般的な問題です。
我々は,クラス不均衡問題に対処する2種類の1-Nearest Neighbour (G1Nos)オーバーサンプリングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-12-30T17:17:08Z) - A Method for Handling Multi-class Imbalanced Data by Geometry based
Information Sampling and Class Prioritized Synthetic Data Generation (GICaPS) [15.433936272310952]
本稿では,多ラベル分類問題における不均衡データ処理の問題について考察する。
特徴ベクトル間の幾何学的関係を利用する2つの新しい手法が提案されている。
提案手法の有効性は,汎用的なマルチクラス認識問題を解くことによって解析する。
論文 参考訳(メタデータ) (2020-10-11T04:04:26Z) - Least Squares Regression with Markovian Data: Fundamental Limits and
Algorithms [69.45237691598774]
マルコフ連鎖からデータポイントが依存しサンプリングされる最小二乗線形回帰問題について検討する。
この問題を$tau_mathsfmix$という観点から、鋭い情報理論のミニマックス下限を確立する。
本稿では,経験的リプレイに基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-16T04:26:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。