論文の概要: Automated Mapping of CVE Vulnerability Records to MITRE CWE Weaknesses
- arxiv url: http://arxiv.org/abs/2304.11130v1
- Date: Thu, 13 Apr 2023 19:46:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-30 07:46:23.662238
- Title: Automated Mapping of CVE Vulnerability Records to MITRE CWE Weaknesses
- Title(参考訳): MITRE CWE弱さに対するCVE脆弱性記録の自動マッピング
- Authors: Ashraf Haddad, Najwa Aaraj, Preslav Nakov, Septimiu Fabian Mare
- Abstract要約: 我々は、CVEレコードをMITRE CWE Weaknessesにマッピングするための4,012レコードのデータセットをリリースする。
人為的なループ型フレームワークを念頭に置いて,課題をランキングタスクとしてアプローチし,今後の作業で人的フィードバックを活用するために強化学習を取り入れることを目指す。
Sentence-BERT と rankT5 の微調整深層学習モデルによる実験結果から,BM25,BERT,RoBERTa よりも大きな性能向上を示した。
- 参考スコア(独自算出の注目度): 19.233111194953622
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, a proliferation of cyber-security threats and diversity has
been on the rise culminating in an increase in their reporting and analysis. To
counter that, many non-profit organizations have emerged in this domain, such
as MITRE and OSWAP, which have been actively tracking vulnerabilities, and
publishing defense recommendations in standardized formats. As producing data
in such formats manually is very time-consuming, there have been some proposals
to automate the process. Unfortunately, a major obstacle to adopting supervised
machine learning for this problem has been the lack of publicly available
specialized datasets. Here, we aim to bridge this gap. In particular, we focus
on mapping CVE records into MITRE CWE Weaknesses, and we release to the
research community a manually annotated dataset of 4,012 records for this task.
With a human-in-the-loop framework in mind, we approach the problem as a
ranking task and aim to incorporate reinforced learning to make use of the
human feedback in future work. Our experimental results using fine-tuned deep
learning models, namely Sentence-BERT and rankT5, show sizable performance
gains over BM25, BERT, and RoBERTa, which demonstrates the need for an
architecture capable of good semantic understanding for this task.
- Abstract(参考訳): 近年、サイバーセキュリティの脅威と多様性が増加し、レポートや分析が増加している。
これに対抗するために、MITREやOSWAPのような多くの非営利団体がこの領域に現れ、脆弱性を積極的に追跡し、標準化されたフォーマットで防衛勧告を発行している。
このようなフォーマットでデータを生成するのは非常に時間がかかるため、プロセスを自動化するための提案がいくつかあった。
残念ながら、この問題に教師付き機械学習を採用する上での大きな障害は、公開可能な特別なデータセットがないことである。
ここではこのギャップを埋めることを目指しています。
特に,CVEレコードをMITRE CWE Weaknessesにマッピングすることに集中し,手動で注記した4,012レコードのデータセットを研究コミュニティにリリースする。
人為的なループ型フレームワークを念頭に置いて,課題をランキングタスクとしてアプローチし,今後の作業で人的フィードバックを活用するために強化学習を取り入れることを目指す。
Sentence-BERT や rankT5 といった微調整深層学習モデルを用いた実験結果から,BM25 や BERT ,RoBERTa よりも大きな性能向上を示した。
関連論文リスト
- Outside the Comfort Zone: Analysing LLM Capabilities in Software Vulnerability Detection [9.652886240532741]
本稿では,ソースコードの脆弱性検出における大規模言語モデルの機能について,徹底的に解析する。
我々は6つの汎用LCMに対して脆弱性検出を特別に訓練した6つのオープンソースモデルの性能を評価する。
論文 参考訳(メタデータ) (2024-08-29T10:00:57Z) - SIaM: Self-Improving Code-Assisted Mathematical Reasoning of Large Language Models [54.78329741186446]
本稿では,コードに基づく批判モデルを用いて,質問コードデータ構築,品質管理,補完的評価などのステップをガイドする新しいパラダイムを提案する。
英語と中国語におけるドメイン内ベンチマークとドメイン外ベンチマークの両方の実験は、提案したパラダイムの有効性を実証している。
論文 参考訳(メタデータ) (2024-08-28T06:33:03Z) - Self-Training with Pseudo-Label Scorer for Aspect Sentiment Quad Prediction [54.23208041792073]
Aspect Sentiment Quad Prediction (ASQP) は、与えられたレビューに対して全てのクワッド(アスペクト項、アスペクトカテゴリー、意見項、感情極性)を予測することを目的としている。
ASQPタスクにおける重要な課題はラベル付きデータの不足であり、既存のメソッドのパフォーマンスを制限している。
そこで我々は,擬似ラベルスコアラーを用いた自己学習フレームワークを提案し,レビューと擬似ラベルの一致をスコアラーが評価する。
論文 参考訳(メタデータ) (2024-06-26T05:30:21Z) - Re-thinking Data Availablity Attacks Against Deep Neural Networks [53.64624167867274]
本稿では、未学習例の概念を再検討し、既存のロバストな誤り最小化ノイズが不正確な最適化目標であることを示す。
本稿では,計算時間要件の低減による保護性能の向上を図った新しい最適化パラダイムを提案する。
論文 参考訳(メタデータ) (2023-05-18T04:03:51Z) - OutCenTR: A novel semi-supervised framework for predicting exploits of
vulnerabilities in high-dimensional datasets [0.0]
私たちは、悪用される可能性のある脆弱性を予測するために、外れ値検出技術を使用しています。
本稿では,ベースライン外乱検出モデルを強化する次元削減手法であるOutCenTRを提案する。
実験の結果,F1スコアの5倍の精度向上が得られた。
論文 参考訳(メタデータ) (2023-04-03T00:34:41Z) - Privacy Adhering Machine Un-learning in NLP [66.17039929803933]
現実の業界では、機械学習を使ってユーザデータに基づくモデルを構築します。
このような委任事項には、データだけでなく、モデルの再トレーニングにも労力が要る。
データの継続的な削除と モデル再訓練のステップはスケールしません
この課題に対処するために、textitMachine Unlearningを提案する。
論文 参考訳(メタデータ) (2022-12-19T16:06:45Z) - CausalAgents: A Robustness Benchmark for Motion Forecasting using Causal
Relationships [8.679073301435265]
既存のデータに摂動を適用することにより、モデルロバスト性の評価と改善のための新しいベンチマークを構築する。
我々はこれらのラベルを使用して、現場から非因果的エージェントを削除することでデータを摂動する。
非因果摂動下では, minADE の相対的な変化は, 原型と比較して25$-$38%である。
論文 参考訳(メタデータ) (2022-07-07T21:28:23Z) - V2W-BERT: A Framework for Effective Hierarchical Multiclass
Classification of Software Vulnerabilities [7.906207218788341]
本稿では,Transformer-based learning framework(V2W-BERT)を提案する。
自然言語処理,リンク予測,転送学習のアイデアを用いることで,従来の手法よりも優れる。
ランダムに分割されたデータの予測精度は最大97%、一時分割されたデータの予測精度は最大94%です。
論文 参考訳(メタデータ) (2021-02-23T05:16:57Z) - Bandit Data-Driven Optimization [62.01362535014316]
機械学習パイプラインが設定で有用になるためには、克服しなければならない大きな問題点が4つある。
これらの問題点に対処する最初の反復予測記述フレームワークであるBanditデータ駆動最適化を導入する。
本稿では,このフレームワークの新しいアルゴリズム PROOF を提案する。
論文 参考訳(メタデータ) (2020-08-26T17:50:49Z) - Social Adaptive Module for Weakly-supervised Group Activity Recognition [143.68241396839062]
本稿では、弱教師付きグループ活動認識(GAR)と呼ばれる新しいタスクを提案する。
従来のGARタスクとは違い、ビデオレベルラベルのみが利用可能であるが、トレーニングデータにおいても、各フレーム内の重要人物は提供されない。
これにより、大規模なNBAデータセットの収集とアノテートが容易になり、GARに新たな課題が生まれます。
論文 参考訳(メタデータ) (2020-07-18T16:40:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。