論文の概要: DCDetector: An IoT terminal vulnerability mining system based on
distributed deep ensemble learning under source code representation
- arxiv url: http://arxiv.org/abs/2211.16235v1
- Date: Tue, 29 Nov 2022 14:19:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 17:17:25.306797
- Title: DCDetector: An IoT terminal vulnerability mining system based on
distributed deep ensemble learning under source code representation
- Title(参考訳): DCDetector: ソースコード表現に基づく分散深層アンサンブル学習に基づくIoT端末脆弱性マイニングシステム
- Authors: Wen Zhou
- Abstract要約: この研究の目的は、C/C++のような高レベルの言語のソースコードの脆弱性をインテリジェントに検出することである。
これにより、ソースコードのセンシティブな文関連スライスをコード表現し、分散深層学習モデルの設計により脆弱性を検出することができる。
実験により,従来の静的解析の偽陽性率を低減し,機械学習の性能と精度を向上させることができることがわかった。
- 参考スコア(独自算出の注目度): 2.561778620560749
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Context: The IoT system infrastructure platform facility vulnerability attack
has become the main battlefield of network security attacks. Most of the
traditional vulnerability mining methods rely on vulnerability detection tools
to realize vulnerability discovery. However, due to the inflexibility of tools
and the limitation of file size, its scalability It is relatively low and
cannot be applied to large-scale power big data fields. Objective: The goal of
the research is to intelligently detect vulnerabilities in source codes of
high-level languages such as C/C++. This enables us to propose a code
representation of sensitive sentence-related slices of source code, and to
detect vulnerabilities by designing a distributed deep ensemble learning model.
Method: In this paper, a new directional vulnerability mining method of
parallel ensemble learning is proposed to solve the problem of large-scale data
vulnerability mining. By extracting sensitive functions and statements, a
sensitive statement library of vulnerable codes is formed. The AST stream-based
vulnerability code slice with higher granularity performs doc2vec sentence
vectorization on the source code through the random sampling module, obtains
different classification results through distributed training through the
Bi-LSTM trainer, and obtains the final classification result by voting.
Results: This method designs and implements a distributed deep ensemble
learning system software vulnerability mining system called DCDetector. It can
make accurate predictions by using the syntactic information of the code, and
is an effective method for analyzing large-scale vulnerability data.
Conclusion: Experiments show that this method can reduce the false positive
rate of traditional static analysis and improve the performance and accuracy of
machine learning.
- Abstract(参考訳): コンテキスト: IoTシステムインフラストラクチャプラットフォーム機能脆弱性攻撃は、ネットワークセキュリティ攻撃の主要な戦場となっている。
従来の脆弱性マイニング手法のほとんどは、脆弱性発見を実現するための脆弱性検出ツールに依存している。
しかし、ツールの柔軟性の欠如とファイルサイズが制限されているため、スケーラビリティは比較的低く、大規模なビッグデータフィールドには適用できない。
目的:研究の目的は、C/C++のような高レベルの言語のソースコードの脆弱性をインテリジェントに検出することである。
これにより、ソースコードのセンシティブな文関連スライスをコード表現し、分散深層学習モデルの設計により脆弱性を検出することができる。
方法:本稿では,大規模データ脆弱性マイニングの課題を解決するために,並列アンサンブル学習による指向性脆弱性マイニング手法を提案する。
センシティブな関数とステートメントを抽出することにより、脆弱なコードのセンシティブなステートメントライブラリを形成する。
高粒度ASTストリームベースの脆弱性コードスライスは、ランダムサンプリングモジュールを介してソースコード上でdoc2vec文ベクトル化を行い、Bi-LSTMトレーナーを介して分散トレーニングにより異なる分類結果を取得し、投票により最終分類結果を得る。
結果: 本手法はDCDetectorと呼ばれる分散深層アンサンブル学習システムソフトウェア脆弱性マイニングシステムの設計と実装を行う。
コードの構文情報を用いて正確な予測を行うことができ、大規模な脆弱性データを分析する効果的な方法である。
結論: この手法は従来の静的解析の偽陽性率を減少させ、機械学習の性能と精度を向上させることができる。
関連論文リスト
- Enhancing Code Vulnerability Detection via Vulnerability-Preserving Data Augmentation [29.72520866016839]
ソースコードの脆弱性検出は、潜在的な攻撃からソフトウェアシステムを保護するための固有の脆弱性を特定することを目的としている。
多くの先行研究は、様々な脆弱性の特徴を見落とし、問題をバイナリ(0-1)分類タスクに単純化した。
FGVulDetは、さまざまな脆弱性タイプの特徴を識別するために複数の分類器を使用し、その出力を組み合わせて特定の脆弱性タイプを特定する。
FGVulDetはGitHubの大規模なデータセットでトレーニングされており、5種類の脆弱性を含んでいる。
論文 参考訳(メタデータ) (2024-04-15T09:10:52Z) - An Unbiased Transformer Source Code Learning with Semantic Vulnerability
Graph [3.3598755777055374]
現在の脆弱性スクリーニング技術は、新しい脆弱性を特定したり、開発者がコード脆弱性と分類を提供するのに効果がない。
これらの問題に対処するために,変換器 "RoBERTa" とグラフ畳み込みニューラルネットワーク (GCN) を組み合わせたマルチタスク・アンバイアス脆弱性分類器を提案する。
本稿では、逐次フロー、制御フロー、データフローからエッジを統合することで生成されたソースコードからのセマンティック脆弱性グラフ(SVG)表現と、Poacher Flow(PF)と呼ばれる新しいフローを利用したトレーニングプロセスを提案する。
論文 参考訳(メタデータ) (2023-04-17T20:54:14Z) - VMCDL: Vulnerability Mining Based on Cascaded Deep Learning Under Source
Control Flow [2.561778620560749]
本稿では,主にSARDデータセットのc/c++ソースコードデータを用いて,CWE476,CWE469,CWE516,CWE570の脆弱性型のソースコードを処理する。
本稿では,ソースコード制御フローに基づく新しいカスケード深層学習モデルVMCDLを提案し,脆弱性を効果的に検出する。
論文 参考訳(メタデータ) (2023-03-13T13:58:39Z) - A Hierarchical Deep Neural Network for Detecting Lines of Codes with
Vulnerabilities [6.09170287691728]
ソースコードの意図しない欠陥によって引き起こされるソフトウェア脆弱性は、サイバー攻撃の根本原因である。
本稿では,自然言語処理で使用されている手法に基づいて,LLVM IR表現から脆弱性を検出するためのディープラーニング手法を提案する。
論文 参考訳(メタデータ) (2022-11-15T21:21:27Z) - Improving robustness of jet tagging algorithms with adversarial training [56.79800815519762]
本研究では,フレーバータグ付けアルゴリズムの脆弱性について,敵攻撃による検証を行った。
シミュレーション攻撃の影響を緩和する対人訓練戦略を提案する。
論文 参考訳(メタデータ) (2022-03-25T19:57:19Z) - VELVET: a noVel Ensemble Learning approach to automatically locate
VulnErable sTatements [62.93814803258067]
本稿では,ソースコード中の脆弱な文を見つけるための新しいアンサンブル学習手法であるVELVETを提案する。
我々のモデルは、グラフベースとシーケンスベースニューラルネットワークを組み合わせて、プログラムグラフの局所的およびグローバル的コンテキストを捕捉する。
VELVETは、合成データと実世界のデータに対して、それぞれ99.6%と43.6%の精度を達成している。
論文 参考訳(メタデータ) (2021-12-20T22:45:27Z) - Software Vulnerability Detection via Deep Learning over Disaggregated
Code Graph Representation [57.92972327649165]
この研究は、コードコーパスから安全でないパターンを自動的に学習するためのディープラーニングアプローチを探求する。
コードには解析を伴うグラフ構造が自然に認められるため,プログラムの意味的文脈と構造的規則性の両方を利用する新しいグラフニューラルネットワーク(GNN)を開発する。
論文 参考訳(メタデータ) (2021-09-07T21:24:36Z) - Multi-context Attention Fusion Neural Network for Software Vulnerability
Identification [4.05739885420409]
ソースコードのセキュリティ脆弱性の共通カテゴリのいくつかを効率的に検出することを学ぶディープラーニングモデルを提案する。
モデルは、学習可能なパラメータの少ないコードセマンティクスの正確な理解を構築します。
提案したAIは、ベンチマークされたNIST SARDデータセットから特定のCWEに対して98.40%のF1スコアを達成する。
論文 参考訳(メタデータ) (2021-04-19T11:50:36Z) - Increasing the Confidence of Deep Neural Networks by Coverage Analysis [71.57324258813674]
本稿では、異なる安全でない入力に対してモデルを強化するために、カバレッジパラダイムに基づく軽量な監視アーキテクチャを提案する。
実験結果から,提案手法は強力な対向例とアウト・オブ・ディストリビューション・インプットの両方を検出するのに有効であることが示唆された。
論文 参考訳(メタデータ) (2021-01-28T16:38:26Z) - Information Obfuscation of Graph Neural Networks [96.8421624921384]
本稿では,グラフ構造化データを用いた学習において,情報難読化による機密属性保護の問題について検討する。
本稿では,全変動量とワッサーシュタイン距離を交互に学習することで,事前決定された機密属性を局所的にフィルタリングするフレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-28T17:55:04Z) - Bayesian Optimization with Machine Learning Algorithms Towards Anomaly
Detection [66.05992706105224]
本稿では,ベイズ最適化手法を用いた効果的な異常検出フレームワークを提案する。
ISCX 2012データセットを用いて検討したアルゴリズムの性能を評価する。
実験結果から, 精度, 精度, 低コストアラームレート, リコールの観点から, 提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-08-05T19:29:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。