論文の概要: Dazzle: Using Optimized Generative Adversarial Networks to Address
Security Data Class Imbalance Issue
- arxiv url: http://arxiv.org/abs/2203.11410v1
- Date: Tue, 22 Mar 2022 01:43:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-23 15:39:55.269888
- Title: Dazzle: Using Optimized Generative Adversarial Networks to Address
Security Data Class Imbalance Issue
- Title(参考訳): Dazzle: セキュリティデータクラスの不均衡問題に対処するために,最適化されたジェネレータネットワークを使用する
- Authors: Rui Shu, Tianpei Xia, Laurie Williams, Tim Menzies
- Abstract要約: 我々は、勾配ペナルティ付き条件付きWasserstein Generative Adrial Networks(cWGAN-GP)の最適化版であるDazzleというアプローチを導入する。
Dazzleを使ってマイノリティクラスのサンプルを生成し、元の不均衡なトレーニングデータセットを再サンプリングします。
Dazzleは実用的であり、既存の最先端のオーバーサンプリング技術よりも有望な改善を示す。
- 参考スコア(独自算出の注目度): 35.0689225703137
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Background: Machine learning techniques have been widely used and demonstrate
promising performance in many software security tasks such as software
vulnerability prediction. However, the class ratio within software
vulnerability datasets is often highly imbalanced (since the percentage of
observed vulnerability is usually very low). Goal: To help security
practitioners address software security data class imbalanced issues and
further help build better prediction models with resampled datasets. Method: We
introduce an approach called Dazzle which is an optimized version of
conditional Wasserstein Generative Adversarial Networks with gradient penalty
(cWGAN-GP). Dazzle explores the architecture hyperparameters of cWGAN-GP with a
novel optimizer called Bayesian Optimization. We use Dazzle to generate
minority class samples to resample the original imbalanced training dataset.
Results: We evaluate Dazzle with three software security datasets, i.e., Moodle
vulnerable files, Ambari bug reports, and JavaScript function code. We show
that Dazzle is practical to use and demonstrates promising improvement over
existing state-of-the-art oversampling techniques such as SMOTE (e.g., with an
average of about 60% improvement rate over SMOTE in recall among all datasets).
Conclusion: Based on this study, we would suggest the use of optimized GANs as
an alternative method for security vulnerability data class imbalanced issues.
- Abstract(参考訳): 背景: 機械学習の技術は広く使われ、ソフトウェア脆弱性予測のような多くのソフトウェアセキュリティタスクで有望なパフォーマンスを示している。
しかしながら、ソフトウェア脆弱性データセット内のクラス比率は、しばしば非常に不均衡である(観察された脆弱性の割合は通常非常に低い)。
Goal: セキュリティ実践者がソフトウェアセキュリティデータクラスの不均衡の問題に対処するのを支援し、さらにデータセットを再サンプリングした予測モデルの構築を支援します。
方法: 勾配ペナルティ付き条件付きWasserstein生成適応ネットワーク(cWGAN-GP)の最適化版であるDazzleを提案する。
Dazzleは、ベイズ最適化と呼ばれる新しい最適化器を用いて、cWGAN-GPのアーキテクチャハイパーパラメータを探索する。
Dazzleを使ってマイノリティクラスのサンプルを生成し、元の不均衡なトレーニングデータセットを再サンプリングします。
結果: dazzle は3つのソフトウェアセキュリティデータセット,すなわち moodle 脆弱性ファイル, ambari バグレポート,javascript 関数コードで評価した。
私たちは、Dazleが実用的で、SMOTEのような既存の最先端のオーバーサンプリング技術(例えば、すべてのデータセットの中で、SMOTEよりも平均約60%改善率で)よりも有望な改善を示す。
結論: 本研究に基づいて, セキュリティ脆弱性データクラス不均衡問題の代替手段として, 最適化gansの利用を提案する。
関連論文リスト
- Malicious URL Detection using optimized Hist Gradient Boosting Classifier based on grid search method [0.0]
悪意のあるウェブサイトが不正な理由で情報を収集する可能性があるため、オンラインプラットフォームで入力されたデータの正確さを信頼することは困難である。
悪意のあるWebサイトが引き起こすリスクを検出するために,機械学習(ML)ベースの手法を用いることを提案する。
使用されるデータセットには、悪意のあるWebサイトデータの1781のレコードと13の機能が含まれている。
論文 参考訳(メタデータ) (2024-06-12T11:16:30Z) - An Unbiased Transformer Source Code Learning with Semantic Vulnerability
Graph [3.3598755777055374]
現在の脆弱性スクリーニング技術は、新しい脆弱性を特定したり、開発者がコード脆弱性と分類を提供するのに効果がない。
これらの問題に対処するために,変換器 "RoBERTa" とグラフ畳み込みニューラルネットワーク (GCN) を組み合わせたマルチタスク・アンバイアス脆弱性分類器を提案する。
本稿では、逐次フロー、制御フロー、データフローからエッジを統合することで生成されたソースコードからのセマンティック脆弱性グラフ(SVG)表現と、Poacher Flow(PF)と呼ばれる新しいフローを利用したトレーニングプロセスを提案する。
論文 参考訳(メタデータ) (2023-04-17T20:54:14Z) - Uncertainty-Aware Source-Free Adaptive Image Super-Resolution with Wavelet Augmentation Transformer [60.31021888394358]
Unsupervised Domain Adaptation (UDA)は、現実世界の超解像(SR)における領域ギャップ問題に効果的に対処できる
本稿では,画像SR(SODA-SR)のためのSOurce-free Domain Adaptationフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-31T03:14:44Z) - MAPS: A Noise-Robust Progressive Learning Approach for Source-Free
Domain Adaptive Keypoint Detection [76.97324120775475]
クロスドメインキーポイント検出方法は、常に適応中にソースデータにアクセスする必要がある。
本稿では、ターゲット領域に十分に訓練されたソースモデルのみを提供する、ソースフリーなドメイン適応キーポイント検出について考察する。
論文 参考訳(メタデータ) (2023-02-09T12:06:08Z) - SRoUDA: Meta Self-training for Robust Unsupervised Domain Adaptation [25.939292305808934]
教師なしドメイン適応(UDA)は、リッチラベルデータセットから学習した知識をラベルなしターゲットデータセットに転送することができる。
本稿では,UDAモデルの対角的ロバスト性を改善するために,SRoUDAというメタ自己学習パイプラインを提案する。
論文 参考訳(メタデータ) (2022-12-12T14:25:40Z) - Gradient-based Data Subversion Attack Against Binary Classifiers [9.414651358362391]
本研究では,攻撃者がラベルのラベルに毒を盛り,システムの機能を損なうようなラベル汚染攻撃に焦点を当てる。
我々は、予測ラベルに対する微分可能凸損失関数の勾配をウォームスタートとして利用し、汚染するデータインスタンスの集合を見つけるための異なる戦略を定式化する。
本実験は,提案手法がベースラインより優れ,計算効率が高いことを示す。
論文 参考訳(メタデータ) (2021-05-31T09:04:32Z) - Negative Data Augmentation [127.28042046152954]
負のデータ拡張サンプルは、データ分散のサポートに関する情報を提供することを示す。
我々は、NDAを識別器の合成データの追加源として利用する新しいGAN訓練目標を提案する。
実験により,本手法で訓練したモデルでは,異常検出能力の向上とともに条件付き・条件付き画像生成の改善を実現している。
論文 参考訳(メタデータ) (2021-02-09T20:28:35Z) - How Robust are Randomized Smoothing based Defenses to Data Poisoning? [66.80663779176979]
我々は、トレーニングデータの品質の重要性を強調する堅牢な機械学習モデルに対して、これまで認識されていなかった脅威を提示します。
本稿では,二段階最適化に基づく新たなデータ中毒攻撃法を提案し,ロバストな分類器のロバスト性を保証する。
我々の攻撃は、被害者が最先端のロバストな訓練方法を用いて、ゼロからモデルを訓練しても効果的である。
論文 参考訳(メタデータ) (2020-12-02T15:30:21Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。