論文の概要: Cross Project Software Vulnerability Detection via Domain Adaptation and
Max-Margin Principle
- arxiv url: http://arxiv.org/abs/2209.10406v1
- Date: Mon, 19 Sep 2022 23:47:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 15:50:16.647742
- Title: Cross Project Software Vulnerability Detection via Domain Adaptation and
Max-Margin Principle
- Title(参考訳): ドメイン適応とMax-Margin原則によるクロスプロジェクトソフトウェア脆弱性検出
- Authors: Van Nguyen, Trung Le, Chakkrit Tantithamthavorn, John Grundy, Hung
Nguyen and Dinh Phung
- Abstract要約: ソフトウェア脆弱性(SV)は、コンピュータソフトウェアの普及により、一般的で深刻な問題となっている。
これら2つの重要な問題に対処するための新しいエンドツーエンドアプローチを提案する。
提案手法は, SVDにおける最重要尺度であるF1尺度の精度を, 使用データセットの2番目に高い手法と比較して1.83%から6.25%に向上させる。
- 参考スコア(独自算出の注目度): 21.684043656053106
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Software vulnerabilities (SVs) have become a common, serious and crucial
concern due to the ubiquity of computer software. Many machine learning-based
approaches have been proposed to solve the software vulnerability detection
(SVD) problem. However, there are still two open and significant issues for SVD
in terms of i) learning automatic representations to improve the predictive
performance of SVD, and ii) tackling the scarcity of labeled vulnerabilities
datasets that conventionally need laborious labeling effort by experts. In this
paper, we propose a novel end-to-end approach to tackle these two crucial
issues. We first exploit the automatic representation learning with deep domain
adaptation for software vulnerability detection. We then propose a novel
cross-domain kernel classifier leveraging the max-margin principle to
significantly improve the transfer learning process of software vulnerabilities
from labeled projects into unlabeled ones. The experimental results on
real-world software datasets show the superiority of our proposed method over
state-of-the-art baselines. In short, our method obtains a higher performance
on F1-measure, the most important measure in SVD, from 1.83% to 6.25% compared
to the second highest method in the used datasets. Our released source code
samples are publicly available at https://github.com/vannguyennd/dam2p
- Abstract(参考訳): ソフトウェア脆弱性(SV)は、コンピュータソフトウェアの普及により、一般的で深刻な問題となっている。
ソフトウェア脆弱性検出(SVD)問題を解決するために、多くの機械学習ベースのアプローチが提案されている。
しかし、SVDにはまだ2つのオープンで重要な問題がある。
一 SVDの予測性能を向上させるための自動表現の学習及び
二 専門家による精力的なラベル付け作業を必要とするラベル付き脆弱性データセットの不足に対処すること。
本稿では,これら2つの重要な課題に対処する新しいエンドツーエンドアプローチを提案する。
まず、ソフトウェア脆弱性検出に深層ドメイン適応を用いた自動表現学習を利用する。
次に,max-margin原理を応用してラベル付きプロジェクトからラベル付きプロジェクトへのソフトウェア脆弱性の転送学習プロセスを大幅に改善する新しいクロスドメインカーネル分類器を提案する。
実世界のソフトウェアデータセットに対する実験結果は,提案手法が最先端のベースラインよりも優れていることを示す。
簡単に言えば,本手法は, SVDにおいて最も重要な指標であるF1尺度の精度を, 使用データセットの2番目に高い手法と比較して1.83%から6.25%に向上させる。
リリースされたソースコードサンプルはhttps://github.com/vannguyennd/dam2pで公開しています。
関連論文リスト
- SAFE: Advancing Large Language Models in Leveraging Semantic and Syntactic Relationships for Software Vulnerability Detection [23.7268575752712]
ソフトウェア脆弱性(SV)は、安全クリティカルなセキュリティシステムにとって、一般的かつ重要な懸念事項として浮上している。
本稿では,SVDのソースコードデータから意味的・統語的関係を学習し,活用するための大規模言語モデルの能力を高める新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-02T00:49:02Z) - Using Machine Learning To Identify Software Weaknesses From Software
Requirement Specifications [49.1574468325115]
本研究は、要求仕様からソフトウェア弱点を特定するための効率的な機械学習アルゴリズムを見つけることに焦点を当てる。
ProMISE_exp. Naive Bayes、サポートベクターマシン(SVM)、決定木、ニューラルネットワーク、畳み込みニューラルネットワーク(CNN)アルゴリズムをテストした。
論文 参考訳(メタデータ) (2023-08-10T13:19:10Z) - DSHGT: Dual-Supervisors Heterogeneous Graph Transformer -- A pioneer study of using heterogeneous graph learning for detecting software vulnerabilities [12.460745260973837]
脆弱性検出はソフトウェアセキュリティにおいて重要な問題であり、学術と産業の両方から注目を集めている。
ディープラーニング、特にグラフニューラルネットワーク(GNN)の最近の進歩は、幅広いソフトウェア脆弱性の自動検出の可能性を明らかにしている。
この研究において、我々はCode Property Graphという形で異種グラフ表現を最初に探求した1人です。
論文 参考訳(メタデータ) (2023-06-02T08:57:13Z) - Vulnerability Detection Using Two-Stage Deep Learning Models [0.0]
C/C++ソースコードの脆弱性検出には,2つのディープラーニングモデルが提案されている。
最初のステージはCNNで、ソースコードに脆弱性があるかどうかを検出する。
2番目のステージは、この脆弱性を50種類の脆弱性のクラスに分類するCNN-LTSMである。
論文 参考訳(メタデータ) (2023-05-08T22:12:34Z) - An Unbiased Transformer Source Code Learning with Semantic Vulnerability
Graph [3.3598755777055374]
現在の脆弱性スクリーニング技術は、新しい脆弱性を特定したり、開発者がコード脆弱性と分類を提供するのに効果がない。
これらの問題に対処するために,変換器 "RoBERTa" とグラフ畳み込みニューラルネットワーク (GCN) を組み合わせたマルチタスク・アンバイアス脆弱性分類器を提案する。
本稿では、逐次フロー、制御フロー、データフローからエッジを統合することで生成されたソースコードからのセマンティック脆弱性グラフ(SVG)表現と、Poacher Flow(PF)と呼ばれる新しいフローを利用したトレーニングプロセスを提案する。
論文 参考訳(メタデータ) (2023-04-17T20:54:14Z) - Weakly Supervised Change Detection Using Guided Anisotropic Difusion [97.43170678509478]
我々は、このようなデータセットを変更検出の文脈で活用するのに役立つ独自のアイデアを提案する。
まず,意味的セグメンテーション結果を改善する誘導異方性拡散(GAD)アルゴリズムを提案する。
次に、変化検出に適した2つの弱い教師付き学習戦略の可能性を示す。
論文 参考訳(メタデータ) (2021-12-31T10:03:47Z) - VELVET: a noVel Ensemble Learning approach to automatically locate
VulnErable sTatements [62.93814803258067]
本稿では,ソースコード中の脆弱な文を見つけるための新しいアンサンブル学習手法であるVELVETを提案する。
我々のモデルは、グラフベースとシーケンスベースニューラルネットワークを組み合わせて、プログラムグラフの局所的およびグローバル的コンテキストを捕捉する。
VELVETは、合成データと実世界のデータに対して、それぞれ99.6%と43.6%の精度を達成している。
論文 参考訳(メタデータ) (2021-12-20T22:45:27Z) - Anomaly Detection Based on Selection and Weighting in Latent Space [73.01328671569759]
SWADと呼ばれる新しい選択および重み付けに基づく異常検出フレームワークを提案する。
ベンチマークと実世界のデータセットによる実験は、SWADの有効性と優位性を示している。
論文 参考訳(メタデータ) (2021-03-08T10:56:38Z) - Robust and Transferable Anomaly Detection in Log Data using Pre-Trained
Language Models [59.04636530383049]
クラウドのような大規模コンピュータシステムにおける異常や障害は、多くのユーザに影響を与える。
システム情報の主要なトラブルシューティングソースとして,ログデータの異常検出のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-23T09:17:05Z) - V2W-BERT: A Framework for Effective Hierarchical Multiclass
Classification of Software Vulnerabilities [7.906207218788341]
本稿では,Transformer-based learning framework(V2W-BERT)を提案する。
自然言語処理,リンク予測,転送学習のアイデアを用いることで,従来の手法よりも優れる。
ランダムに分割されたデータの予測精度は最大97%、一時分割されたデータの予測精度は最大94%です。
論文 参考訳(メタデータ) (2021-02-23T05:16:57Z) - FairMOT: On the Fairness of Detection and Re-Identification in Multiple
Object Tracking [92.48078680697311]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要な問題である。
本稿では,FairMOTと呼ばれる,アンカーフリーなオブジェクト検出アーキテクチャCenterNetをベースとした,シンプルかつ効果的なアプローチを提案する。
このアプローチは、検出と追跡の両方において高い精度を達成する。
論文 参考訳(メタデータ) (2020-04-04T08:18:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。