論文の概要: ISC4DGF: Enhancing Directed Grey-box Fuzzing with LLM-Driven Initial Seed Corpus Generation
- arxiv url: http://arxiv.org/abs/2409.14329v1
- Date: Sun, 22 Sep 2024 06:27:28 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-06 23:04:03.989778
- Title: ISC4DGF: Enhancing Directed Grey-box Fuzzing with LLM-Driven Initial Seed Corpus Generation
- Title(参考訳): ISC4DGF: LLM駆動初期種子コーパス生成による直接グレーボックスファジリングの強化
- Authors: Yijiang Xu, Hongrui Jia, Liguo Chen, Xin Wang, Zhengran Zeng, Yidong Wang, Qing Gao, Jindong Wang, Wei Ye, Shikun Zhang, Zhonghai Wu,
- Abstract要約: ディレクトグレーボックスファジィング(DGF)は、特定の脆弱性に焦点を絞って必須となっている。
ISC4DGFはLarge Language Models (LLMs) を用いてDGFのための最適化された初期シードコーパスを生成する
ISC4DGFは35.63倍のスピードアップと616.10倍の目標到達を達成した。
- 参考スコア(独自算出の注目度): 32.6118621456906
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fuzz testing is crucial for identifying software vulnerabilities, with coverage-guided grey-box fuzzers like AFL and Angora excelling in broad detection. However, as the need for targeted detection grows, directed grey-box fuzzing (DGF) has become essential, focusing on specific vulnerabilities. The initial seed corpus, which consists of carefully selected input samples that the fuzzer uses as a starting point, is fundamental in determining the paths that the fuzzer explores. A well-designed seed corpus can guide the fuzzer more effectively towards critical areas of the code, improving the efficiency and success of the fuzzing process. Even with its importance, many works concentrate on refining guidance mechanisms while paying less attention to optimizing the initial seed corpus. In this paper, we introduce ISC4DGF, a novel approach to generating optimized initial seed corpus for DGF using Large Language Models (LLMs). By leveraging LLMs' deep software understanding and refined user inputs, ISC4DGF creates precise seed corpus that efficiently trigger specific vulnerabilities. Implemented on AFL and tested against state-of-the-art fuzzers like AFLGo, FairFuzz, and Entropic using the Magma benchmark, ISC4DGF achieved a 35.63x speedup and 616.10x fewer target reaches. Moreover, ISC4DGF focused on more effectively detecting target vulnerabilities, enhancing efficiency while operating with reduced code coverage.
- Abstract(参考訳): ファズテストはソフトウェア脆弱性の特定に不可欠であり、AFLやAngoraのようなカバレッジガイド付きグレーボックスファズーは広範な検出に優れています。
しかし、ターゲット検出の必要性が高まるにつれて、特定の脆弱性に焦点を当てたディレクトグレーボックスファジング(DGF)が不可欠になっている。
最初のシードコーパスは、ファザーが出発点として使用する、慎重に選択された入力サンプルで構成され、ファザーが探索する経路を決定するのに基本的なものである。
十分に設計されたシードコーパスは、ファッザをより効果的にコードの重要な領域へ誘導し、ファッザリングプロセスの効率と成功を改善することができる。
その重要性にもかかわらず、多くの研究は、初期種子コーパスの最適化に注意を払わずに指導機構の精錬に集中している。
本稿では,Large Language Models (LLMs) を用いた DGF の初期シードコーパス生成手法である ISC4DGF を紹介する。
LLMの深いソフトウェア理解と洗練されたユーザー入力を活用することで、ISC4DGFは特定の脆弱性を効率的に引き起こす正確なシードコーパスを生成する。
AFLに実装され、AFLGo、FairFuzz、Entropicといった最先端のファジターに対してMagmaベンチマークを用いてテストを行い、ISC4DGFは35.63倍のスピードアップと616.10倍の目標到達を達成した。
さらに、ISC4DGFは、より効果的にターゲットの脆弱性を検知し、コードカバレッジを減らし操作しながら効率を向上させることに重点を置いている。
関連論文リスト
- Generator-Based Fuzzers with Type-Based Targeted Mutation [1.4507298892594764]
以前の研究では、カバレッジ誘導型ファジィザは静的解析、テイント解析、制約解法を混合してこの問題に対処していた。
本稿では,Java GBFの文字列検索とともに,型ベースの突然変異を導入する。
ベースラインのGBFツールと比較すると、アプリケーションカバレッジは平均20%改善しており、サードパーティのコードを含めると、より大きく改善されている。
論文 参考訳(メタデータ) (2024-06-04T07:20:13Z) - SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - WGAN-AFL: Seed Generation Augmented Fuzzer with Wasserstein-GAN [25.908940995229248]
WGAN-AFLはGAN(agenerative adversarial network)であり、特徴を学習し、高品質な初期入力シードを生成する。
WGAN-AFLは、コードカバレッジ、新しいパス、脆弱性発見の点で、元のAFLよりも大幅に優れています。
論文 参考訳(メタデータ) (2024-01-30T12:20:21Z) - NLP-based Cross-Layer 5G Vulnerabilities Detection via Fuzzing Generated
Run-Time Profiling [4.893416946078254]
本稿では,5Gスタックにおける脆弱性,意図しない創発的動作,および性能劣化を自動的に検出する革新的な手法を提案する。
srsRANをパイロットとして、ファジィテストによって生成されたログ情報(LogInfo)を介して、実行時のプロファイリングをまず高次元距離空間にマッピングする。
さらに、ロジスティック回帰(Logistic Regression)、K-Nearest Neighbors(K-Nearest Neighbors)、ランダムフォレスト(Random Forest)といった機械学習ベースの分類アルゴリズムを活用して、パフォーマンスとセキュリティ特性への影響を分類します。
論文 参考訳(メタデータ) (2023-05-14T19:07:21Z) - Efficient Decoder-free Object Detection with Transformers [75.00499377197475]
視覚変換器(ViT)は、物体検出アプローチのランドスケープを変化させている。
本稿では,デコーダフリー完全トランス(DFFT)オブジェクト検出器を提案する。
DFFT_SMALLは、トレーニングおよび推論段階で高い効率を達成する。
論文 参考訳(メタデータ) (2022-06-14T13:22:19Z) - Efficient Few-Shot Object Detection via Knowledge Inheritance [62.36414544915032]
Few-shot Object Detection (FSOD) は、未確認のタスクに少ないトレーニングサンプルで適応できるジェネリック検出器を学習することを目的としている。
計算量の増加を伴わない効率的なプレトレイン・トランスファー・フレームワーク(PTF)のベースラインを提案する。
また,予測された新しいウェイトと事前訓練されたベースウェイトとのベクトル長の不整合を軽減するために,適応長再スケーリング(ALR)戦略を提案する。
論文 参考訳(メタデータ) (2022-03-23T06:24:31Z) - Anchor-free Oriented Proposal Generator for Object Detection [59.54125119453818]
オブジェクト指向物体検出はリモートセンシング画像解釈において実用的で困難な課題である。
今日では、指向性検出器は主に水平方向の箱を中間体として使用し、それらから指向性のある箱を導出している。
本稿では,ネットワークアーキテクチャから水平ボックス関連操作を放棄する,AOPG(Anchor-free Oriented Proposal Generator)を提案する。
論文 参考訳(メタデータ) (2021-10-05T10:45:51Z) - Camouflaged Object Segmentation with Distraction Mining [23.77915054363188]
camouflaged object segmentation (cos) は、周囲に「完全に」同化している物体を識別することを目的としている。
本研究では,自然界における捕食の過程を模倣したバイオインスパイアされたPFNet(Placeing and Focus Network)を開発した。
当社のPFNetは、リアルタイム(72 FPS)で動作し、3つの挑戦的なデータセットで18の最先端のモデルを大幅に上回ります。
論文 参考訳(メタデータ) (2021-04-21T11:47:59Z) - Bayesian Optimization with Machine Learning Algorithms Towards Anomaly
Detection [66.05992706105224]
本稿では,ベイズ最適化手法を用いた効果的な異常検出フレームワークを提案する。
ISCX 2012データセットを用いて検討したアルゴリズムの性能を評価する。
実験結果から, 精度, 精度, 低コストアラームレート, リコールの観点から, 提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-08-05T19:29:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。