論文の概要: When Machine Learning Meets Vulnerability Discovery: Challenges and Lessons Learned
- arxiv url: http://arxiv.org/abs/2508.15042v1
- Date: Wed, 20 Aug 2025 20:09:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-22 16:26:46.082952
- Title: When Machine Learning Meets Vulnerability Discovery: Challenges and Lessons Learned
- Title(参考訳): マシンラーニングが脆弱性発見に出会った時 - 課題と教訓
- Authors: Sima Arasteh, Christophe Hauser,
- Abstract要約: 本稿では、脆弱性発見に機械学習を適用する際の課題について考察する。
まず、研究者はトレーニングデータセットに関する具体的な統計の提供に失敗することが多い。
第二に、モデルの選択とモデルが訓練される粒度は、そのような脆弱性発見アプローチの有効性にも影響を及ぼす。
- 参考スコア(独自算出の注目度): 3.000275719116454
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, machine learning has demonstrated impressive results in various fields, including software vulnerability detection. Nonetheless, using machine learning to identify software vulnerabilities presents new challenges, especially regarding the scale of data involved, which was not a factor in traditional methods. Consequently, in spite of the rise of new machine-learning-based approaches in that space, important shortcomings persist regarding their evaluation. First, researchers often fail to provide concrete statistics about their training datasets, such as the number of samples for each type of vulnerability. Moreover, many methods rely on training with semantically similar functions rather than directly on vulnerable programs. This leads to uncertainty about the suitability of the datasets currently used for training. Secondly, the choice of a model and the level of granularity at which models are trained also affect the effectiveness of such vulnerability discovery approaches. In this paper, we explore the challenges of applying machine learning to vulnerability discovery. We also share insights from our two previous research papers, Bin2vec and BinHunter, which could enhance future research in this field.
- Abstract(参考訳): 近年,ソフトウェア脆弱性検出など,さまざまな分野で機械学習が注目されている。
それでも、ソフトウェア脆弱性を特定するために機械学習を使用することで、特に関連するデータのスケールに関して、新たな課題が浮かび上がっている。
その結果、その領域で新しい機械学習ベースのアプローチが出現したにもかかわらず、その評価に関して重要な欠点が続いている。
まず、研究者は、各タイプの脆弱性のサンプル数など、トレーニングデータセットに関する具体的な統計情報の提供に失敗することが多い。
さらに、多くの手法は、脆弱なプログラムに直接依存するのではなく、意味的に類似した関数によるトレーニングに依存している。
これにより、現在トレーニングに使用されているデータセットの適合性に関する不確実性が生じる。
第二に、モデルの選択とモデルが訓練される粒度は、そのような脆弱性発見アプローチの有効性にも影響を及ぼす。
本稿では、脆弱性発見に機械学習を適用する際の課題について考察する。
また、この分野での今後の研究を促進する可能性のある、Bin2vecとBinHunterという2つの研究論文からの洞察も共有しています。
関連論文リスト
- RESTOR: Knowledge Recovery in Machine Unlearning [71.75834077528305]
Webスケールコーパスでトレーニングされた大規模な言語モデルは、プライベートまたはセンシティブな情報を含むことができる。
このようなデータポイントの効果を排除するために、いくつかの機械学習アルゴリズムが提案されている。
機械学習評価のためのRESTORフレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-31T20:54:35Z) - Instance-Level Difficulty: A Missing Perspective in Machine Unlearning [13.052520843129363]
完全インスタンスレベルのアンラーニング性能分析により,機械学習を困難にさせる難易度について検討する。
特に,データポイントの学習を困難にする4つの要因を要約する。
機械学習の研究は、未学習のインスタンスレベルの難しさに注意を払うべきだと我々は主張する。
論文 参考訳(メタデータ) (2024-10-03T23:41:42Z) - Verification of Machine Unlearning is Fragile [48.71651033308842]
両タイプの検証戦略を回避できる2つの新しい非学習プロセスを導入する。
この研究は、機械学習検証の脆弱性と限界を強調し、機械学習の安全性に関するさらなる研究の道を開く。
論文 参考訳(メタデータ) (2024-08-01T21:37:10Z) - Interpretable Machine Learning for Discovery: Statistical Challenges \&
Opportunities [1.2891210250935146]
我々は、解釈可能な機械学習の分野について議論し、レビューする。
解釈可能な機械学習を用いて行うことができる発見の種類について概説する。
我々は、これらの発見をデータ駆動方式でどのように検証するかという大きな課題に焦点をあてる。
論文 参考訳(メタデータ) (2023-08-02T23:57:31Z) - Few-shot Weakly-supervised Cybersecurity Anomaly Detection [1.179179628317559]
本稿では,既存の弱教師付きディープラーニング異常検出フレームワークの強化を提案する。
このフレームワークには、データ拡張、表現学習、順序回帰が含まれている。
そして、3つのベンチマークデータセット上で実装したフレームワークの性能を評価した。
論文 参考訳(メタデータ) (2023-04-15T04:37:54Z) - Machine Learning Security against Data Poisoning: Are We There Yet? [23.809841593870757]
この記事では、機械学習モデル学習に使用されるトレーニングデータを侵害するデータ中毒攻撃についてレビューする。
基本的なセキュリティ原則を用いてこれらの攻撃を緩和するか、あるいはML指向の防御機構をデプロイするかについて議論する。
論文 参考訳(メタデータ) (2022-04-12T17:52:09Z) - Knowledge as Invariance -- History and Perspectives of
Knowledge-augmented Machine Learning [69.99522650448213]
機械学習の研究は転換点にある。
研究の関心は、高度にパラメータ化されたモデルのパフォーマンス向上から、非常に具体的なタスクへとシフトしている。
このホワイトペーパーは、機械学習研究におけるこの新興分野の紹介と議論を提供する。
論文 参考訳(メタデータ) (2020-12-21T15:07:19Z) - Dos and Don'ts of Machine Learning in Computer Security [74.1816306998445]
大きな可能性にもかかわらず、セキュリティにおける機械学習は、パフォーマンスを損なう微妙な落とし穴を引き起こす傾向がある。
我々は,学習ベースのセキュリティシステムの設計,実装,評価において共通の落とし穴を特定する。
我々は,落とし穴の回避や軽減を支援するために,研究者を支援するための実用的な勧告を提案する。
論文 参考訳(メタデータ) (2020-10-19T13:09:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。