論文の概要: XGV-BERT: Leveraging Contextualized Language Model and Graph Neural
Network for Efficient Software Vulnerability Detection
- arxiv url: http://arxiv.org/abs/2309.14677v1
- Date: Tue, 26 Sep 2023 05:05:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-27 14:55:21.490320
- Title: XGV-BERT: Leveraging Contextualized Language Model and Graph Neural
Network for Efficient Software Vulnerability Detection
- Title(参考訳): XGV-BERT:効率的なソフトウェア脆弱性検出のための文脈言語モデルとグラフニューラルネットワークの活用
- Authors: Vu Le Anh Quan, Chau Thuan Phat, Kiet Van Nguyen, Phan The Duy,
Van-Hau Pham
- Abstract要約: XGV-BERTは、トレーニング済みのCodeBERTモデルとGraph Neural Network(GCN)を組み合わせて、ソフトウェアの脆弱性を検出するフレームワークである。
XGV-BERTは、VulDeePeckerやSySeVRといった既存の2つの方法と比較して、脆弱性検出の精度が大幅に向上している。
- 参考スコア(独自算出の注目度): 0.964547614383472
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: With the advancement of deep learning (DL) in various fields, there are many
attempts to reveal software vulnerabilities by data-driven approach.
Nonetheless, such existing works lack the effective representation that can
retain the non-sequential semantic characteristics and contextual relationship
of source code attributes. Hence, in this work, we propose XGV-BERT, a
framework that combines the pre-trained CodeBERT model and Graph Neural Network
(GCN) to detect software vulnerabilities. By jointly training the CodeBERT and
GCN modules within XGV-BERT, the proposed model leverages the advantages of
large-scale pre-training, harnessing vast raw data, and transfer learning by
learning representations for training data through graph convolution. The
research results demonstrate that the XGV-BERT method significantly improves
vulnerability detection accuracy compared to two existing methods such as
VulDeePecker and SySeVR. For the VulDeePecker dataset, XGV-BERT achieves an
impressive F1-score of 97.5%, significantly outperforming VulDeePecker, which
achieved an F1-score of 78.3%. Again, with the SySeVR dataset, XGV-BERT
achieves an F1-score of 95.5%, surpassing the results of SySeVR with an
F1-score of 83.5%.
- Abstract(参考訳): さまざまな分野におけるディープラーニング(DL)の進歩により、データ駆動アプローチによるソフトウェア脆弱性を明らかにする試みが数多く行われている。
それにもかかわらず、既存の作品には、非系列的な意味的特徴とソースコード属性の文脈的関係を保持できる効果的な表現が欠けている。
そこで本研究では,事前学習したCodeBERTモデルとGCN(Graph Neural Network)を組み合わせたソフトウェア脆弱性検出フレームワークであるXGV-BERTを提案する。
XGV-BERT内でCodeBERTとGCNモジュールを共同でトレーニングすることにより、大規模な事前学習、膨大な生データの利用、グラフ畳み込みによるデータトレーニングのための学習表現による伝達学習の利点を活用することができる。
その結果,xgv-bert法はvuldeepecker法やsysevr法に比べて脆弱性検出精度が著しく向上した。
VulDeePeckerデータセットでは、XGV-BERTは97.5%の印象的なF1スコアを達成した。
また、SySeVRデータセットでは、XGV-BERTは95.5%のF1スコアを獲得し、SySeVRの結果を83.5%のF1スコアで上回っている。
関連論文リスト
- Strengthening Fake News Detection: Leveraging SVM and Sophisticated Text Vectorization Techniques. Defying BERT? [0.0]
本研究では,機械学習と自然言語処理,具体的にはSVM(Support Vector Machines)とBERTを用いて,偽ニュースを検出する。
実ニュースと偽ニュースを区別する上での有効性を評価するために, TF-IDF(Term Frequency Inverse Document Frequency), Word2Vec(Word2Vec), Bag of Words(BoW)の3つの異なるテキストベクトル化手法を用いる。
論文 参考訳(メタデータ) (2024-11-19T18:15:46Z) - EffiSegNet: Gastrointestinal Polyp Segmentation through a Pre-Trained EfficientNet-based Network with a Simplified Decoder [0.8892527836401773]
EffiSegNetは、トレーニング済みの畳み込みニューラルネットワーク(CNN)をバックボーンとして、トランスファーラーニングを活用する新しいセグメンテーションフレームワークである。
Kvasir-SEGデータセットを用いて消化管ポリープセグメンテーションタスクの評価を行い,その成果を得た。
論文 参考訳(メタデータ) (2024-07-23T08:54:55Z) - GOODAT: Towards Test-time Graph Out-of-Distribution Detection [103.40396427724667]
グラフニューラルネットワーク(GNN)は、さまざまな領域にわたるグラフデータのモデリングに広く応用されている。
近年の研究では、特定のモデルのトレーニングや、よく訓練されたGNN上でのデータ修正に重点を置いて、OOD検出のグラフを調査している。
本稿では、GNNアーキテクチャのトレーニングデータと修正から独立して動作する、データ中心、教師なし、プラグアンドプレイのソリューションを提案する。
論文 参考訳(メタデータ) (2024-01-10T08:37:39Z) - Challenging the Myth of Graph Collaborative Filtering: a Reasoned and Reproducibility-driven Analysis [50.972595036856035]
本稿では,6つの人気グラフと最近のグラフ推薦モデルの結果を再現するコードを提案する。
これらのグラフモデルと従来の協調フィルタリングモデルを比較する。
ユーザの近所からの情報フローを調べることにより,データセット構造における内在的特徴にどのようなモデルが影響するかを同定することを目的とする。
論文 参考訳(メタデータ) (2023-08-01T09:31:44Z) - Learning Strong Graph Neural Networks with Weak Information [64.64996100343602]
我々は、弱い情報(GLWI)を用いたグラフ学習問題に対する原則的アプローチを開発する。
非完全構造を持つ入力グラフ上で長距離情報伝搬を行うデュアルチャネルGNNフレームワークであるD$2$PTを提案するが、グローバルな意味的類似性を符号化するグローバルグラフも提案する。
論文 参考訳(メタデータ) (2023-05-29T04:51:09Z) - Sequential Graph Neural Networks for Source Code Vulnerability
Identification [5.582101184758527]
我々は,C/C++ソースコードの脆弱性データセットを適切にキュレートし,モデルの開発を支援する。
また,多数のコード意味表現を学習するための連続グラフニューラルネットワーク(SEGNN)という,グラフニューラルネットワークに基づく学習フレームワークを提案する。
グラフ分類設定における2つのデータセットと4つのベースライン手法による評価は、最先端の結果を示している。
論文 参考訳(メタデータ) (2023-05-23T17:25:51Z) - Convolutional Neural Networks for the classification of glitches in
gravitational-wave data streams [52.77024349608834]
我々は、高度LIGO検出器のデータから過渡ノイズ信号(グリッチ)と重力波を分類する。
どちらも、Gravity Spyデータセットを使用して、スクラッチからトレーニングされた、教師付き学習アプローチのモデルを使用します。
また、擬似ラベルの自動生成による事前学習モデルの自己教師型アプローチについても検討する。
論文 参考訳(メタデータ) (2023-03-24T11:12:37Z) - Energy-based Out-of-Distribution Detection for Graph Neural Networks [76.0242218180483]
我々は,GNNSafeと呼ばれるグラフ上での学習のための,シンプルで強力で効率的なOOD検出モデルを提案する。
GNNSafeは、最先端技術に対するAUROCの改善を最大17.0%で達成しており、そのような未開発領域では単純だが強力なベースラインとして機能する可能性がある。
論文 参考訳(メタデータ) (2023-02-06T16:38:43Z) - Unlearning Graph Classifiers with Limited Data Resources [39.29148804411811]
制御されたデータ削除は、データに敏感なWebアプリケーションのための機械学習モデルの重要機能になりつつある。
グラフニューラルネットワーク(GNN)の効率的な機械学習を実現する方法はまだほとんど知られていない。
我々の主な貢献は GST に基づく非線形近似グラフアンラーニング法である。
第2の貢献は、提案した未学習機構の計算複雑性の理論解析である。
第3のコントリビューションは広範囲なシミュレーションの結果であり、削除要求毎のGNNの完全再トレーニングと比較して、新しいGSTベースのアプローチは平均10.38倍のスピードアップを提供する。
論文 参考訳(メタデータ) (2022-11-06T20:46:50Z) - Data-Free Adversarial Knowledge Distillation for Graph Neural Networks [62.71646916191515]
グラフ構造化データ(DFAD-GNN)を用いたデータフリー逆知識蒸留のための第1のエンドツーエンドフレームワークを提案する。
具体的には、DFAD-GNNは、教師モデルと学生モデルとを2つの識別器とみなし、教師モデルから学生モデルに知識を抽出するために学習グラフを導出するジェネレータという、主に3つの成分からなる生成的対向ネットワークを採用している。
我々のDFAD-GNNは、グラフ分類タスクにおける最先端のデータフリーベースラインを大幅に上回っている。
論文 参考訳(メタデータ) (2022-05-08T08:19:40Z) - ReGVD: Revisiting Graph Neural Networks for Vulnerability Detection [20.65271290295621]
本稿では,脆弱性検出のためのグラフネットワークモデルReGVDを提案する。
特にReGVDは、あるソースコードをフラットなトークンのシーケンスと見なしている。
我々は、脆弱性検出のためのCodeXGLUEから、実世界のベンチマークデータセット上で最も高い精度を得る。
論文 参考訳(メタデータ) (2021-10-14T12:44:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。