論文の概要: Efficient Software Vulnerability Detection Using Transformer-based Models
- arxiv url: http://arxiv.org/abs/2604.00112v1
- Date: Tue, 31 Mar 2026 18:23:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:31.676662
- Title: Efficient Software Vulnerability Detection Using Transformer-based Models
- Title(参考訳): 変圧器モデルを用いた効率的なソフトウェア脆弱性検出
- Authors: Sameer Shaik, Zhen Huang, Daniela Stan Raicu, Jacob Furst,
- Abstract要約: ディープニューラルネットワークは脆弱性検出に有望な結果を示しているが、脆弱なコードに関するグローバルなコンテキスト情報をキャプチャする能力は欠如している。
API関数呼び出し,配列利用,ポインタ操作,演算式など,プログラムコードの主要な構文的特徴と意味的特徴をカプセル化するプログラムスライスを使用する。
私たちの仕事は、脆弱なコードを適度なリソース使用量とトレーニング時間で識別する、堅牢で効率的なアプローチを提供します。
- 参考スコア(独自算出の注目度): 4.786839591214602
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Detecting software vulnerabilities is critical to ensuring the security and reliability of modern computer systems. Deep neural networks have shown promising results on vulnerability detection, but they lack the capability to capture global contextual information on vulnerable code. To address this limitation, we explore the application of transformers for C/C++ vulnerability detection. We use program slices that encapsulate key syntactic and semantic features of program code, such as API function calls, array usage, pointer manipulations, and arithmetic expressions. By leveraging transformers' capability to capture both local and global contextual information on vulnerable code, our work can identify vulnerabilities accurately. Combined with data balancing and hyperparameter fine-tuning, our work offers a robust and efficient approach to identifying vulnerable code with moderate resource usage and training time.
- Abstract(参考訳): ソフトウェア脆弱性の検出は、現代のコンピュータシステムのセキュリティと信頼性を確保するために重要である。
ディープニューラルネットワークは脆弱性検出に有望な結果を示しているが、脆弱なコードに関するグローバルなコンテキスト情報をキャプチャする能力は欠如している。
この制限に対処するため、C/C++脆弱性検出のためのトランスフォーマーの適用について検討する。
API関数呼び出し,配列利用,ポインタ操作,演算式など,プログラムコードの主要な構文的特徴と意味的特徴をカプセル化するプログラムスライスを使用する。
脆弱性のあるコードのローカルとグローバルの両方のコンテキスト情報をキャプチャするトランスフォーマーの機能を活用することで、当社の作業は脆弱性を正確に識別することができる。
データバランシングとハイパーパラメータの微調整を組み合わせることで、脆弱なコードを適度なリソース使用量とトレーニング時間で識別する、堅牢で効率的なアプローチを提供します。
関連論文リスト
- Weakly Supervised Vulnerability Localization via Multiple Instance Learning [46.980136742826836]
WeAkly によるマルチプルインスタンス学習による脆弱性ローカライゼーションのための WAVES という新しい手法を提案する。
WAVESは、ある関数が脆弱かどうか(すなわち脆弱性検出)を判定し、脆弱なステートメントをピンポイントする機能を持っている。
提案手法は,文レベルの脆弱性ローカライゼーションにおいて,脆弱性検出と最先端のパフォーマンスにおいて同等のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-09-14T15:11:39Z) - CyberGym: Evaluating AI Agents' Real-World Cybersecurity Capabilities at Scale [45.97598662617568]
我々は188のソフトウェアプロジェクトにわたる1,507の実際の脆弱性を特徴とする大規模ベンチマークであるCyberGymを紹介した。
我々はCyberGymが35のゼロデイ脆弱性と17の歴史的不完全なパッチを発見できることを示した。
これらの結果は、CyberGymは、サイバーセキュリティにおけるAIの進歩を測定するための堅牢なベンチマークであるだけでなく、直接的な現実世界のセキュリティ効果を生み出すためのプラットフォームでもあることを強調している。
論文 参考訳(メタデータ) (2025-06-03T07:35:14Z) - Automating the Detection of Code Vulnerabilities by Analyzing GitHub Issues [6.6681265451722895]
我々は、脆弱性検出に関連するGitHubの問題を分類するために特別に設計された新しいデータセットを紹介します。
結果は、早期脆弱性検出における現実世界のアプリケーションに対するこのアプローチの可能性を示している。
この作業は、オープンソースのソフトウェアエコシステムのセキュリティを強化する可能性がある。
論文 参考訳(メタデータ) (2025-01-09T14:13:39Z) - Line-level Semantic Structure Learning for Code Vulnerability Detection [44.29771620061153]
ラインレベルのセマンティックラーニングを通じて,コード構造認識ネットワークを導入する。
コード前処理、グローバルセマンティック認識、ラインセマンティック認識、ラインセマンティック構造認識の4つのコンポーネントから構成される。
CSLSモデルは、コード脆弱性検出における最先端のベースラインを上回り、Devignデータセットで70.57%、Revealデータセットで49.59%のF1スコアを達成している。
論文 参考訳(メタデータ) (2024-07-26T17:15:58Z) - SliceLocator: Locating Vulnerable Statements with Graph-based Detectors [33.395068754566935]
SliceLocatorは、すべての潜在的な脆弱性トリガリングステートメントから、最も重み付けされたフローパスを選択することで、最も関連性の高いテントフローを特定する。
SliceLocatorは、最先端の4つのGNNベースの脆弱性検知器で一貫して動作することを示す。
論文 参考訳(メタデータ) (2024-01-05T10:15:04Z) - VELVET: a noVel Ensemble Learning approach to automatically locate
VulnErable sTatements [62.93814803258067]
本稿では,ソースコード中の脆弱な文を見つけるための新しいアンサンブル学習手法であるVELVETを提案する。
我々のモデルは、グラフベースとシーケンスベースニューラルネットワークを組み合わせて、プログラムグラフの局所的およびグローバル的コンテキストを捕捉する。
VELVETは、合成データと実世界のデータに対して、それぞれ99.6%と43.6%の精度を達成している。
論文 参考訳(メタデータ) (2021-12-20T22:45:27Z) - Software Vulnerability Detection via Deep Learning over Disaggregated
Code Graph Representation [57.92972327649165]
この研究は、コードコーパスから安全でないパターンを自動的に学習するためのディープラーニングアプローチを探求する。
コードには解析を伴うグラフ構造が自然に認められるため,プログラムの意味的文脈と構造的規則性の両方を利用する新しいグラフニューラルネットワーク(GNN)を開発する。
論文 参考訳(メタデータ) (2021-09-07T21:24:36Z) - Multi-context Attention Fusion Neural Network for Software Vulnerability
Identification [4.05739885420409]
ソースコードのセキュリティ脆弱性の共通カテゴリのいくつかを効率的に検出することを学ぶディープラーニングモデルを提案する。
モデルは、学習可能なパラメータの少ないコードセマンティクスの正確な理解を構築します。
提案したAIは、ベンチマークされたNIST SARDデータセットから特定のCWEに対して98.40%のF1スコアを達成する。
論文 参考訳(メタデータ) (2021-04-19T11:50:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。