論文の概要: An Empirical Study of the Imbalance Issue in Software Vulnerability Detection
- arxiv url: http://arxiv.org/abs/2602.12038v1
- Date: Thu, 12 Feb 2026 15:05:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-13 21:07:25.880595
- Title: An Empirical Study of the Imbalance Issue in Software Vulnerability Detection
- Title(参考訳): ソフトウェア脆弱性検出における不均衡問題に関する実証的研究
- Authors: Yuejun Guo, Qiang Hu, Qiang Tang, Yves Le Traon,
- Abstract要約: その約束にもかかわらず、ディープラーニングベースの脆弱性検出はまだ初期段階にある。
不均衡の問題(脆弱性のあるコードの数は極めて少ない)がこの現象の核心にあると推測する。
既存の不均衡なソリューションは、データセットや評価指標によって、異なるパフォーマンスを実現していることがわかった。
- 参考スコア(独自算出の注目度): 13.82245579667704
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Vulnerability detection is crucial to protect software security. Nowadays, deep learning (DL) is the most promising technique to automate this detection task, leveraging its superior ability to extract patterns and representations within extensive code volumes. Despite its promise, DL-based vulnerability detection remains in its early stages, with model performance exhibiting variability across datasets. Drawing insights from other well-explored application areas like computer vision, we conjecture that the imbalance issue (the number of vulnerable code is extremely small) is at the core of the phenomenon. To validate this, we conduct a comprehensive empirical study involving nine open-source datasets and two state-of-the-art DL models. The results confirm our conjecture. We also obtain insightful findings on how existing imbalance solutions perform in vulnerability detection. It turns out that these solutions perform differently as well across datasets and evaluation metrics. Specifically: 1) Focal loss is more suitable to improve the precision, 2) mean false error and class-balanced loss encourages the recall, and 3) random over-sampling facilitates the F1-measure. However, none of them excels across all metrics. To delve deeper, we explore external influences on these solutions and offer insights for developing new solutions.
- Abstract(参考訳): 脆弱性検出はソフトウェアセキュリティを保護するために不可欠である。
現在、ディープラーニング(DL)は、この検出タスクを自動化する最も有望な技術であり、広範なコードボリューム内のパターンや表現を抽出する優れた能力を活用しています。
その約束にもかかわらず、DLベースの脆弱性検出は初期段階にあり、モデルパフォーマンスはデータセット間のばらつきを示している。
コンピュータビジョンのような、他のよく研究されているアプリケーション領域からの洞察を引いて、不均衡の問題(脆弱性のあるコードの数は極めて少ない)がこの現象の中核にあると推測する。
これを検証するため,9つのオープンソースデータセットと2つの最先端DLモデルを含む総合的な実証的研究を行った。
結果は我々の予想を裏付ける。
また、既存の不均衡解が脆弱性検出においてどのように機能するかについての洞察力のある知見を得る。
その結果、これらのソリューションはデータセットや評価指標によって異なるパフォーマンスを実現していることがわかった。
具体的には
1) 骨の喪失は、精度を向上させるためにより適している。
2)虚偽の誤りとクラスバランスの喪失がリコールを促し、
3) ランダムオーバーサンプリングはF1測定を容易にする。
しかしながら、いずれもすべてのメトリクスを網羅するものではない。
より深く掘り下げるために、これらのソリューションに対する外部の影響を調査し、新しいソリューションを開発するための洞察を提供する。
関連論文リスト
- Are We Learning the Right Features? A Framework for Evaluating DL-Based Software Vulnerability Detection Solutions [3.204048014949849]
本論文は,本領域における研究を適切に評価するための基盤を提供することを目的とする。
脆弱性に寄与するコードの構文的および意味的特徴に対する脆弱性データセットを分析する。
この表現は、コード内の脆弱性と突発的な機能の両方の存在を検出するのに使われます。
論文 参考訳(メタデータ) (2025-01-23T00:32:15Z) - A Comprehensive Library for Benchmarking Multi-class Visual Anomaly Detection [89.92916473403108]
本稿では,新しい手法のモジュラーフレームワークであるADerの総合的な視覚異常検出ベンチマークを提案する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-06-05T13:40:07Z) - Analyzing Adversarial Inputs in Deep Reinforcement Learning [53.3760591018817]
本稿では, 正当性検証のレンズを用いて, 逆入力の特性を包括的に解析する。
このような摂動に対する感受性に基づいてモデルを分類するために、新しい計量である逆数率(Adversarial Rate)を導入する。
本分析は, 直交入力が所定のDRLシステムの安全性にどのように影響するかを実証的に示す。
論文 参考訳(メタデータ) (2024-02-07T21:58:40Z) - VELVET: a noVel Ensemble Learning approach to automatically locate
VulnErable sTatements [62.93814803258067]
本稿では,ソースコード中の脆弱な文を見つけるための新しいアンサンブル学習手法であるVELVETを提案する。
我々のモデルは、グラフベースとシーケンスベースニューラルネットワークを組み合わせて、プログラムグラフの局所的およびグローバル的コンテキストを捕捉する。
VELVETは、合成データと実世界のデータに対して、それぞれ99.6%と43.6%の精度を達成している。
論文 参考訳(メタデータ) (2021-12-20T22:45:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。