論文の概要: DSHGT: Dual-Supervisors Heterogeneous Graph Transformer -- A pioneer
study of using heterogeneous graph learning for detecting software
vulnerabilities
- arxiv url: http://arxiv.org/abs/2306.01376v1
- Date: Fri, 2 Jun 2023 08:57:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-05 16:05:42.384523
- Title: DSHGT: Dual-Supervisors Heterogeneous Graph Transformer -- A pioneer
study of using heterogeneous graph learning for detecting software
vulnerabilities
- Title(参考訳): DSHGT: Dual-Supervisors Heterogeneous Graph Transformer -- ソフトウェア脆弱性検出のための異種グラフ学習の先駆的研究
- Authors: Tiehua Zhang, Rui Xu, Jianping Zhang, Yuzhe Tian, Xin Chen, Xiaowei
Huang, Jun Yin, Xi Zheng
- Abstract要約: 脆弱性検出はソフトウェアセキュリティにおいて重要な問題であり、学術と産業の両方から注目を集めている。
ディープラーニング、特にグラフニューラルネットワーク(GNN)の最近の進歩は、幅広いソフトウェア脆弱性の自動検出の可能性を明らかにしている。
この研究において、我々はCode Property Graphという形で異種グラフ表現を最初に探求した1人です。
- 参考スコア(独自算出の注目度): 17.47875830028395
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Vulnerability detection is a critical problem in software security and
attracts growing attention both from academia and industry. Traditionally,
software security is safeguarded by designated rule-based detectors that
heavily rely on empirical expertise, requiring tremendous effort from software
experts to generate rule repositories for large code corpus. Recent advances in
deep learning, especially Graph Neural Networks (GNN), have uncovered the
feasibility of automatic detection of a wide range of software vulnerabilities.
However, prior learning-based works only break programs down into a sequence of
word tokens for extracting contextual features of codes, or apply GNN largely
on homogeneous graph representation (e.g., AST) without discerning complex
types of underlying program entities (e.g., methods, variables). In this work,
we are one of the first to explore heterogeneous graph representation in the
form of Code Property Graph and adapt a well-known heterogeneous graph network
with a dual-supervisor structure for the corresponding graph learning task.
Using the prototype built, we have conducted extensive experiments on both
synthetic datasets and real-world projects. Compared with the state-of-the-art
baselines, the results demonstrate promising effectiveness in this research
direction in terms of vulnerability detection performance (average F1
improvements over 10\% in real-world projects) and transferability from C/C++
to other programming languages (average F1 improvements over 11%).
- Abstract(参考訳): 脆弱性検出はソフトウェアセキュリティにおける重要な問題であり、学界と業界の両方から注目を集めている。
伝統的に、ソフトウェアセキュリティは、経験的な専門知識に大きく依存する、指定されたルールベースの検出器によって保護されている。
ディープラーニング、特にグラフニューラルネットワーク(GNN)の最近の進歩は、幅広いソフトウェア脆弱性の自動検出の可能性を明らかにしている。
しかしながら、事前学習に基づく作業は、コードの文脈的特徴を抽出するためにプログラムを単語トークンのシーケンスに分割するか、あるいはgnnを基礎となるプログラムエンティティ(例えばメソッド、変数)の複雑なタイプを識別せずに、均質なグラフ表現(例えばast)に主に適用するだけである。
本研究では、コードプロパティグラフの形で異種グラフ表現を初めて探求し、対応するグラフ学習タスクのための二重スーパーバイザ構造を持つよく知られた異種グラフネットワークを適用する。
構築したプロトタイプを用いて,人工データセットと実世界のプロジェクトの両方について広範な実験を行った。
最先端のベースラインと比較すると、脆弱性検出性能(実世界のプロジェクトでは平均10\%以上のf1改善)やc/c++から他のプログラミング言語への移植性(平均11%以上のf1改善)といった点で、この研究の方向性において有望な効果を示している。
関連論文リスト
- KnowGraph: Knowledge-Enabled Anomaly Detection via Logical Reasoning on Graph Data [13.510494408303536]
KnowGraphは、グラフベースの異常検出を強化するために、ドメイン知識とデータ駆動学習を統合する。
テストでは、KnowGraphはトランスダクティブとインダクティブの両方で、最先端のベースラインを一貫して上回っている。
その結果は、高レベルのグラフベースのセキュリティアプリケーションのためのデータ駆動モデルにドメイン知識を統合する可能性を強調している。
論文 参考訳(メタデータ) (2024-10-10T21:53:33Z) - Dynamic Neural Control Flow Execution: An Agent-Based Deep Equilibrium Approach for Binary Vulnerability Detection [4.629503670145618]
ソフトウェア脆弱性はサイバーセキュリティの課題だ。
DeepEXEはエージェントベースの暗黙のニューラルネットワークで、プログラムの実行パスを模倣する。
DeepEXEは正確かつ効率的な手法であり、最先端の脆弱性検出方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-04-03T22:07:50Z) - SimTeG: A Frustratingly Simple Approach Improves Textual Graph Learning [131.04781590452308]
テキストグラフ学習におけるフラストレーションに富んだアプローチであるSimTeGを提案する。
まず、下流タスクで予め訓練されたLM上で、教師付きパラメータ効率の微調整(PEFT)を行う。
次に、微調整されたLMの最後の隠れ状態を用いてノード埋め込みを生成する。
論文 参考訳(メタデータ) (2023-08-03T07:00:04Z) - Learning Strong Graph Neural Networks with Weak Information [64.64996100343602]
我々は、弱い情報(GLWI)を用いたグラフ学習問題に対する原則的アプローチを開発する。
非完全構造を持つ入力グラフ上で長距離情報伝搬を行うデュアルチャネルGNNフレームワークであるD$2$PTを提案するが、グローバルな意味的類似性を符号化するグローバルグラフも提案する。
論文 参考訳(メタデータ) (2023-05-29T04:51:09Z) - Sequential Graph Neural Networks for Source Code Vulnerability
Identification [5.582101184758527]
我々は,C/C++ソースコードの脆弱性データセットを適切にキュレートし,モデルの開発を支援する。
また,多数のコード意味表現を学習するための連続グラフニューラルネットワーク(SEGNN)という,グラフニューラルネットワークに基づく学習フレームワークを提案する。
グラフ分類設定における2つのデータセットと4つのベースライン手法による評価は、最先端の結果を示している。
論文 参考訳(メタデータ) (2023-05-23T17:25:51Z) - Benchmarking Node Outlier Detection on Graphs [90.29966986023403]
グラフの外れ値検出は、多くのアプリケーションにおいて、新しいが重要な機械学習タスクである。
UNODと呼ばれるグラフに対して、最初の包括的教師なしノード外乱検出ベンチマークを示す。
論文 参考訳(メタデータ) (2022-06-21T01:46:38Z) - ReGVD: Revisiting Graph Neural Networks for Vulnerability Detection [20.65271290295621]
本稿では,脆弱性検出のためのグラフネットワークモデルReGVDを提案する。
特にReGVDは、あるソースコードをフラットなトークンのシーケンスと見なしている。
我々は、脆弱性検出のためのCodeXGLUEから、実世界のベンチマークデータセット上で最も高い精度を得る。
論文 参考訳(メタデータ) (2021-10-14T12:44:38Z) - Deep Fraud Detection on Non-attributed Graph [61.636677596161235]
グラフニューラルネットワーク(GNN)は不正検出に強い性能を示している。
ラベル付きデータは大規模な産業問題、特に不正検出には不十分である。
よりラベルのないデータを活用するための新しいグラフ事前学習戦略を提案する。
論文 参考訳(メタデータ) (2021-10-04T03:42:09Z) - Software Vulnerability Detection via Deep Learning over Disaggregated
Code Graph Representation [57.92972327649165]
この研究は、コードコーパスから安全でないパターンを自動的に学習するためのディープラーニングアプローチを探求する。
コードには解析を伴うグラフ構造が自然に認められるため,プログラムの意味的文脈と構造的規則性の両方を利用する新しいグラフニューラルネットワーク(GNN)を開発する。
論文 参考訳(メタデータ) (2021-09-07T21:24:36Z) - Graph Representation Learning via Graphical Mutual Information
Maximization [86.32278001019854]
本稿では,入力グラフとハイレベルな隠蔽表現との相関を測る新しい概念であるGMIを提案する。
我々は,グラフニューラルエンコーダの入力と出力の間でGMIを最大化することで訓練された教師なし学習モデルを開発する。
論文 参考訳(メタデータ) (2020-02-04T08:33:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。