論文の概要: Security Bug Report Prediction Within and Across Projects: A Comparative Study of BERT and Random Forest
- arxiv url: http://arxiv.org/abs/2504.21037v1
- Date: Mon, 28 Apr 2025 06:09:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-10 00:12:19.150832
- Title: Security Bug Report Prediction Within and Across Projects: A Comparative Study of BERT and Random Forest
- Title(参考訳): プロジェクト内外のセキュリティバグの報告予測:BERTとランダムフォレストの比較研究
- Authors: Farnaz Soltaniani, Mohammad Ghafari, Mohammed Sayagh,
- Abstract要約: セキュリティバグレポート(SBR)の早期検出は、脆弱性の防止とシステムの信頼性確保に不可欠である。
本研究では,SBR予測のための競争基準であるBERTとRandom Forest(RF)を比較した。
プロジェクト間SBR予測では、BERTはRFよりもかなり高い62%のG測定を達成している。
- 参考スコア(独自算出の注目度): 0.08192907805418582
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Early detection of security bug reports (SBRs) is crucial for preventing vulnerabilities and ensuring system reliability. While machine learning models have been developed for SBR prediction, their predictive performance still has room for improvement. In this study, we conduct a comprehensive comparison between BERT and Random Forest (RF), a competitive baseline for predicting SBRs. The results show that RF outperforms BERT with a 34% higher average G-measure for within-project predictions. Adding only SBRs from various projects improves both models' average performance. However, including both security and nonsecurity bug reports significantly reduces RF's average performance to 46%, while boosts BERT to its best average performance of 66%, surpassing RF. In cross-project SBR prediction, BERT achieves a remarkable 62% G-measure, which is substantially higher than RF.
- Abstract(参考訳): セキュリティバグレポート(SBR)の早期検出は、脆弱性の防止とシステムの信頼性確保に不可欠である。
機械学習モデルはSBR予測のために開発されたが、予測性能は依然として改善の余地がある。
本研究では,SBR 予測のための競争基準である BERT とランダムフォレスト (RF) の総合比較を行った。
その結果,RF は BERT よりも 34% 高い平均 G 測定値で高い性能を示した。
さまざまなプロジェクトからSBRのみを追加することで、両方のモデルの平均パフォーマンスが向上する。
しかし、セキュリティと非セキュリティのバグレポートを含むと、RFの平均性能は46%に大幅に低下し、BERTの最高パフォーマンスは66%に向上し、RFを上回っている。
プロジェクト間SBR予測では、BERTはRFよりもかなり高い62%のG測定を達成している。
関連論文リスト
- UncertaintyRAG: Span-Level Uncertainty Enhanced Long-Context Modeling for Retrieval-Augmented Generation [93.38604803625294]
IncertaintyRAG, a novel approach for long-context Retrieval-Augmented Generation (RAG)について紹介する。
我々は、SNR(Signal-to-Noise Ratio)ベースのスパン不確実性を用いて、テキストチャンク間の類似性を推定する。
不確かさRAGはLLaMA-2-7Bでベースラインを2.03%上回り、最先端の結果を得る。
論文 参考訳(メタデータ) (2024-10-03T17:39:38Z) - CBAM-SwinT-BL: Small Rail Surface Defect Detection Method Based on Swin Transformer with Block Level CBAM Enhancement [2.48550866840644]
本研究では, Swin Transformer (SwinT) をベースラインとして, Convolutional Block Attention Module (CBAM) を組み込んで拡張する。
提案手法は,スウィントランスブロックにCBAMを組み込むことにより,レール欠陥検出の性能を著しく向上させる。
実験およびアブレーション研究は、このフレームワークの有効性を証明した。
論文 参考訳(メタデータ) (2024-09-30T09:11:13Z) - Benchmarking and Improving Bird's Eye View Perception Robustness in Autonomous Driving [55.93813178692077]
本稿では,BEVアルゴリズムのレジリエンスを評価するためのベンチマークスイートであるRoboBEVを紹介する。
検出,マップセグメンテーション,深さ推定,占有予測といったタスクにまたがる33の最先端のBEVベースの知覚モデルを評価する。
また, 事前学習や深度自由なBEVトランスフォーメーションなどの戦略が, アウト・オブ・ディストリビューションデータに対するロバスト性を高める上で有効であることを示す。
論文 参考訳(メタデータ) (2024-05-27T17:59:39Z) - BIRD: A Trustworthy Bayesian Inference Framework for Large Language Models [52.46248487458641]
予測モデルは、現実世界のタスクで不完全な情報を扱う必要があることが多い。
現在の大規模言語モデル(LLM)は正確な推定には不十分である。
本稿では,新しい確率的推論フレームワークBIRDを提案する。
論文 参考訳(メタデータ) (2024-04-18T20:17:23Z) - BEA: Revisiting anchor-based object detection DNN using Budding Ensemble
Architecture [8.736601342033431]
Budding Ensemble Architecture(BEA)は、アンカーベースのオブジェクト検出モデルのための、新しい縮小アンサンブルアーキテクチャである。
BEAにおける損失関数は、信頼性スコアの校正を改善し、不確かさを低減させる。
論文 参考訳(メタデータ) (2023-09-14T21:54:23Z) - Free Lunch for Generating Effective Outlier Supervision [46.37464572099351]
本稿では, ほぼ現実的な外乱監視を実現するための超効率的な手法を提案する。
提案したtextttBayesAug は,従来の方式に比べて偽陽性率を 12.50% 以上削減する。
論文 参考訳(メタデータ) (2023-01-17T01:46:45Z) - Beyond S-curves: Recurrent Neural Networks for Technology Forecasting [60.82125150951035]
我々は機械学習と時系列予測の最近の進歩を生かしたオートコーダアプローチを開発した。
S曲線予測は、単純なARIMAベースラインに匹敵する平均パーセンテージ誤差(MAPE)を示す。
我々のオートエンコーダアプローチは、2番目に高い結果に対して平均13.5%改善する。
論文 参考訳(メタデータ) (2022-11-28T14:16:22Z) - Restricted Bernoulli Matrix Factorization: Balancing the trade-off
between prediction accuracy and coverage in classification based
collaborative filtering [45.335821132209766]
本稿では,Restricted Bernoulli Matrix Factorization (ResBeMF) を提案する。
提案モデルでは,他のレコメンデーションモデルと比較して,品質指標のバランスが良好である。
論文 参考訳(メタデータ) (2022-10-05T13:48:19Z) - SmOOD: Smoothness-based Out-of-Distribution Detection Approach for
Surrogate Neural Networks in Aircraft Design [8.51442063220981]
ハイブリッドサロゲート最適化は、高速な設計評価を提供しながら、高い結果の品質を維持する。
フィードフォワードニューラルネットワーク(FNN)は、高度に非線形な入力出力マッピングをキャプチャし、航空機の性能要因に対する効率的なサロゲートを生成する。
我々は,モデル依存型OODインジケータに最適化されたFNNサロゲートを符号化し,選択的だが信頼性の高いサロゲートモデルを生成することを提案する。
論文 参考訳(メタデータ) (2022-09-07T19:44:58Z) - Certified Adversarial Defenses Meet Out-of-Distribution Corruptions:
Benchmarking Robustness and Simple Baselines [65.0803400763215]
この研究は、最先端のロバストモデルがアウト・オブ・ディストリビューションデータに遭遇した場合、敵のロバスト性がどのように変化を保証しているかを批判的に検証する。
本稿では,トレーニングデータのスペクトルカバレッジを改善するために,新たなデータ拡張方式であるFourierMixを提案する。
また,FourierMixの拡張により,様々なOODベンチマークにおいて,より優れたロバスト性保証を実現することが可能となる。
論文 参考訳(メタデータ) (2021-12-01T17:11:22Z) - Discriminative Jackknife: Quantifying Uncertainty in Deep Learning via
Higher-Order Influence Functions [121.10450359856242]
我々は、モデル損失関数の影響関数を利用して、予測信頼区間のジャックニフェ(または、アウト・ワン・アウト)推定器を構築する頻繁な手順を開発する。
1)および(2)を満たすDJは、幅広いディープラーニングモデルに適用可能であり、実装が容易であり、モデルトレーニングに干渉したり、精度を妥協したりすることなく、ポストホックな方法で適用することができる。
論文 参考訳(メタデータ) (2020-06-29T13:36:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。