論文の概要: Learning to map source code to software vulnerability using
code-as-a-graph
- arxiv url: http://arxiv.org/abs/2006.08614v1
- Date: Mon, 15 Jun 2020 16:05:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-21 05:25:49.305557
- Title: Learning to map source code to software vulnerability using
code-as-a-graph
- Title(参考訳): code-as-a-graphを用いたソフトウェア脆弱性へのソースコードマップの学習
- Authors: Sahil Suneja, Yunhui Zheng, Yufan Zhuang, Jim Laredo, Alessandro
Morari
- Abstract要約: セキュリティの観点からソースコードのニュアンス学習におけるグラフニューラルネットワークの適用性について検討する。
我々は,既存のコード・アズ・フォトや線形シーケンスの符号化手法よりも,脆弱性検出に有効なコード・アズ・グラフの符号化法を示す。
- 参考スコア(独自算出の注目度): 67.62847721118142
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We explore the applicability of Graph Neural Networks in learning the nuances
of source code from a security perspective. Specifically, whether signatures of
vulnerabilities in source code can be learned from its graph representation, in
terms of relationships between nodes and edges. We create a pipeline we call
AI4VA, which first encodes a sample source code into a Code Property Graph. The
extracted graph is then vectorized in a manner which preserves its semantic
information. A Gated Graph Neural Network is then trained using several such
graphs to automatically extract templates differentiating the graph of a
vulnerable sample from a healthy one. Our model outperforms static analyzers,
classic machine learning, as well as CNN and RNN-based deep learning models on
two of the three datasets we experiment with. We thus show that a code-as-graph
encoding is more meaningful for vulnerability detection than existing
code-as-photo and linear sequence encoding approaches. (Submitted Oct 2019,
Paper #28, ICST)
- Abstract(参考訳): セキュリティの観点からソースコードのニュアンス学習におけるグラフニューラルネットワークの適用性について検討する。
具体的には、ノードとエッジの関係の観点から、ソースコードの脆弱性のシグネチャをグラフ表現から学ぶことができる。
AI4VAと呼ばれるパイプラインを作成し、まずサンプルソースコードをコードプロパティグラフにエンコードします。
抽出されたグラフは、その意味情報を保持する方法でベクトル化される。
Gated Graph Neural Networkは、このようなグラフを使用してトレーニングされ、脆弱なサンプルのグラフを正常なグラフから識別するテンプレートを自動的に抽出する。
私たちのモデルは、静的アナライザ、古典的な機械学習、CNNとRNNベースのディープラーニングモデルよりも優れています。
したがって,コード・アズ・グラフエンコーディングは,既存のコード・アズ・フォトおよび線形シーケンスエンコーディングアプローチよりも脆弱性検出に有意であることを示す。
(2019年10月発行、第28号、ICST)
関連論文リスト
- Source Code Vulnerability Detection: Combining Code Language Models and Code Property Graphs [5.953617559607503]
Vul-LMGNNは、事前訓練されたコード言語モデルとコードプロパティグラフを組み合わせた統一モデルである。
Vul-LMGNNは、様々なコード属性を統一的なグラフ構造に統合するコードプロパティグラフを構築する。
属性間の依存性情報を効果的に保持するために,ゲートコードグラフニューラルネットワークを導入する。
論文 参考訳(メタデータ) (2024-04-23T03:48:18Z) - Rethinking Tokenizer and Decoder in Masked Graph Modeling for Molecules [81.05116895430375]
マスク付きグラフモデリングは、分子グラフの自己教師付き表現学習において優れている。
サブグラフレベルのトークン化器とremaskデコーディングを備えた十分表現力のあるデコーダがエンコーダの表現学習に大きな影響を与えることを示す。
我々は,単純なGNNベースのTokenizer(SGT)と効果的な復号化戦略を備えた,新しいMGM手法SimSGTを提案する。
論文 参考訳(メタデータ) (2023-10-23T09:40:30Z) - Sequential Graph Neural Networks for Source Code Vulnerability
Identification [5.582101184758527]
我々は,C/C++ソースコードの脆弱性データセットを適切にキュレートし,モデルの開発を支援する。
また,多数のコード意味表現を学習するための連続グラフニューラルネットワーク(SEGNN)という,グラフニューラルネットワークに基づく学習フレームワークを提案する。
グラフ分類設定における2つのデータセットと4つのベースライン手法による評価は、最先端の結果を示している。
論文 参考訳(メタデータ) (2023-05-23T17:25:51Z) - ReGVD: Revisiting Graph Neural Networks for Vulnerability Detection [20.65271290295621]
本稿では,脆弱性検出のためのグラフネットワークモデルReGVDを提案する。
特にReGVDは、あるソースコードをフラットなトークンのシーケンスと見なしている。
我々は、脆弱性検出のためのCodeXGLUEから、実世界のベンチマークデータセット上で最も高い精度を得る。
論文 参考訳(メタデータ) (2021-10-14T12:44:38Z) - Software Vulnerability Detection via Deep Learning over Disaggregated
Code Graph Representation [57.92972327649165]
この研究は、コードコーパスから安全でないパターンを自動的に学習するためのディープラーニングアプローチを探求する。
コードには解析を伴うグラフ構造が自然に認められるため,プログラムの意味的文脈と構造的規則性の両方を利用する新しいグラフニューラルネットワーク(GNN)を開発する。
論文 参考訳(メタデータ) (2021-09-07T21:24:36Z) - deGraphCS: Embedding Variable-based Flow Graph for Neural Code Search [15.19181807445119]
ソースコードを変数ベースのフローグラフに変換する学習可能なDeGraph for Code Search(deGraphCSと呼ばれる)を提案する。
C言語で記述された41,152のコードスニペットを含む大規模なデータセットをGitHubから収集しています。
論文 参考訳(メタデータ) (2021-03-24T06:57:44Z) - Heuristic Semi-Supervised Learning for Graph Generation Inspired by
Electoral College [80.67842220664231]
本稿では,新たなノードやエッジを自動的に拡張して,高密度サブグラフ内のラベル類似性を向上する,新しい前処理手法であるElectoral College(ELCO)を提案する。
テストされたすべての設定において、我々の手法はベースモデルの平均スコアを4.7ポイントの広いマージンで引き上げるとともに、常に最先端のモデルよりも優れています。
論文 参考訳(メタデータ) (2020-06-10T14:48:48Z) - Auto-decoding Graphs [91.3755431537592]
生成モデルは、潜在コードからグラフを合成することを学ぶ自動デコーダである。
グラフは、おそらく接続パターンを特定するためにトレーニングされた自己アテンションモジュールを使用して合成される。
論文 参考訳(メタデータ) (2020-06-04T14:23:01Z) - Improved Code Summarization via a Graph Neural Network [96.03715569092523]
一般に、ソースコード要約技術はソースコードを入力として使用し、自然言語記述を出力する。
これらの要約を生成するために、ASTのデフォルト構造によくマッチするグラフベースのニューラルアーキテクチャを使用するアプローチを提案する。
論文 参考訳(メタデータ) (2020-04-06T17:36:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。