論文の概要: RandSet: Randomized Corpus Reduction for Fuzzing Seed Scheduling
- arxiv url: http://arxiv.org/abs/2602.22729v1
- Date: Thu, 26 Feb 2026 08:11:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-27 18:41:22.588843
- Title: RandSet: Randomized Corpus Reduction for Fuzzing Seed Scheduling
- Title(参考訳): RandSet: ファジィシードスケジューリングのためのランダム化されたコーパス削減
- Authors: Yuchong Xie, Kaikai Zhang, Yu Liu, Rundong Yang, Ping Chen, Shuai Wang, Dongdong She,
- Abstract要約: RandSetは、新しいランダム化されたコーパス削減技術で、コーパスのサイズを小さくし、最小限のオーバーヘッドで多様な種選択を同時に得る。
我々は、AFL++、LibAFL、Centipedeの3つの人気ファザにRandSetを実装し、スタンドアロンプログラム、FuzzBench、Magmaで評価する。
- 参考スコア(独自算出の注目度): 11.633448650254577
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Seed explosion is a fundamental problem in fuzzing seed scheduling, where a fuzzer maintains a huge corpus and fails to choose promising seeds. Existing works focus on seed prioritization but still suffer from seed explosion since corpus size remains huge. We tackle this from a new perspective: corpus reduction, i.e., computing a seed corpus subset. However, corpus reduction could lead to poor seed diversity and large runtime overhead. Prior techniques like cull_queue, AFL-Cmin, and MinSet suffer from poor diversity or prohibitive overhead, making them unsuitable for high-frequency seed scheduling. We propose RandSet, a novel randomized corpus reduction technique that reduces corpus size and yields diverse seed selection simultaneously with minimal overhead. Our key insight is introducing randomness into corpus reduction to enjoy two benefits of a randomized algorithm: randomized output (diverse seed selection) and low runtime cost. Specifically, we formulate corpus reduction as a set cover problem and compute a randomized subset covering all features of the entire corpus. We then schedule seeds from this small, randomized subset rather than the entire corpus, effectively mitigating seed explosion. We implement RandSet on three popular fuzzers: AFL++, LibAFL, and Centipede, and evaluate it on standalone programs, FuzzBench, and Magma. Results show RandSet achieves significantly more diverse seed selection than other reduction techniques, with average subset ratios of 4.03% and 5.99% on standalone and FuzzBench programs. RandSet achieves a 16.58% coverage gain on standalone programs and up to 3.57% on FuzzBench in AFL++, triggers up to 7 more ground-truth bugs than the state-of-the-art on Magma, while introducing only 1.17%-3.93% overhead.
- Abstract(参考訳): 種子爆発は、ファジッターが巨大なコーパスを保持し、有望な種子を選択するのに失敗する、ファジィ種子スケジューリングの基本的な問題である。
既存の研究は、種子の優先順位付けに重点を置いているが、コーパスのサイズが巨大であるため、依然として種子の爆発に悩まされている。
コーパス削減、すなわち、シードコーパスサブセットの計算という新しい視点から、この問題に取り組む。
しかし、コーパスの減少は種子の多様性の低下と実行時のオーバーヘッドの増大につながる可能性がある。
cull_queue、AFL-Cmin、MinSetといった以前のテクニックは多様性の低さや制限的なオーバーヘッドに悩まされており、高周波のシードスケジューリングには適さない。
ランダム化コーパス削減手法であるRandSetを提案する。
我々の重要な洞察は、ランダム化されたアルゴリズムの2つの利点を享受するために、コーパスリダクションにランダム性を導入することである。
具体的には、コーパスの削減を集合被覆問題として定式化し、コーパス全体の全特徴をカバーするランダム化されたサブセットを算出する。
そして、この小さなランダム化されたサブセットから種子をスケジュールし、種子の爆発を効果的に軽減する。
我々は、AFL++、LibAFL、Centipedeの3つの人気ファザにRandSetを実装し、スタンドアロンプログラム、FuzzBench、Magmaで評価する。
その結果、RandSetは他の還元技術よりもはるかに多様な種選択を実現しており、平均サブセット比は4.03%と5.99%である。
RandSetはスタンドアローンのプログラムで16.58%、AFL++でFuzzBenchで3.57%のカバレッジ向上を実現し、Magmaの最先端のバグよりも7つの根本的なバグを引き起こし、オーバーヘッドは1.17%-3.93%に過ぎなかった。
関連論文リスト
- Fuzzwise: Intelligent Initial Corpus Generation for Fuzzing [14.734454356396157]
突然変異ベースのグレーボックスファジングでは、初期コーパスのための高品質な入力シードを生成することが不可欠である。
FuzzyWiseは、大きなコーパスを生成し、その後最小化するために、別々のフェーズを統合する。
FuzzyWiseは高いコードカバレッジを実現し、ベースラインと比較してランタイムエラーを発生させる。
論文 参考訳(メタデータ) (2025-12-24T22:17:29Z) - DiNo and RanBu: Lightweight Predictions from Shallow Random Forests [2.2080796858692575]
DiNoとRanBuは、小さな深度制限木を効率的な距離重み付き予測子に変換する。
RanBuは、ハイノイズ設定で、完全奥行きのランダムな森の精度を一致または超過する。
どちらの手法も量子レグレッションに直接拡張し、精度を相当なスピードゲインで維持する。
論文 参考訳(メタデータ) (2025-10-23T20:12:08Z) - Fuzzing: Randomness? Reasoning! Efficient Directed Fuzzing via Large Language Models [16.184295639574835]
ランダム性はファジングの効率を著しく低下させ、バグを暴露するのに数日や数週間かかる。
我々は,大言語モデル (LLM) を提案し, 種子のランダム性を除去し, ミュータのランダム性を低減した。
LLMは、事前に決定された場所をターゲットにしたリーチ可能な種を生成し、特定のバグに適したバグ特異的ミュータを構築するために使用することができる。
論文 参考訳(メタデータ) (2025-06-30T04:33:52Z) - Rising Rested Bandits: Lower Bounds and Efficient Algorithms [15.390680055166769]
本論文は、連続マルチアーマッドバンド(MAB)の分野である。
我々は,腕の期待される報酬が単調に非減少性であり,結束する残留包帯の特定の症例について検討した。
我々は,本アルゴリズムを実世界のデータセットに対するオンラインモデル選択問題や,複数の合成されたタスクに対する非定常MABの最先端手法と経験的に比較した。
論文 参考訳(メタデータ) (2024-11-06T22:00:46Z) - Perturb-and-Project: Differentially Private Similarities and Marginals [73.98880839337873]
差分プライバシーのための入力摂動フレームワークを再検討し、入力にノイズを付加する。
まず、ペアワイズ・コサイン類似性をプライベートにリリースするための新しい効率的なアルゴリズムを設計する。
我々は,$k$の辺縁クエリを$n$の機能に対して計算する新しいアルゴリズムを導出する。
論文 参考訳(メタデータ) (2024-06-07T12:07:16Z) - Low-Rank Bandits via Tight Two-to-Infinity Singular Subspace Recovery [45.601316850669406]
本稿では,政策評価,最良政策識別,後悔の最小化のための効率的なアルゴリズムを提案する。
政策評価と最良の政策識別のために,我々のアルゴリズムは最小限に最適であることを示す。
提案アルゴリズムは、まずスペクトル法を利用して、低ランク報酬行列の左特異部分空間と右特異部分空間を推定する。
論文 参考訳(メタデータ) (2024-02-24T06:36:08Z) - Nearly Minimax Optimal Regret for Learning Linear Mixture Stochastic
Shortest Path [80.60592344361073]
線形混合遷移カーネルを用いた最短経路(SSP)問題について検討する。
エージェントは繰り返し環境と対話し、累積コストを最小化しながら特定の目標状態に到達する。
既存の作業は、イテレーションコスト関数の厳密な下限や、最適ポリシーに対する期待長の上限を仮定することが多い。
論文 参考訳(メタデータ) (2024-02-14T07:52:00Z) - Combinatorial Stochastic-Greedy Bandit [79.1700188160944]
我々は,選択した$n$のアームセットのジョイント報酬以外の余分な情報が観測されない場合に,マルチアームのバンディット問題に対する新規グリーディ・バンディット(SGB)アルゴリズムを提案する。
SGBは最適化された拡張型コミットアプローチを採用しており、ベースアームの大きなセットを持つシナリオ用に特別に設計されている。
論文 参考訳(メタデータ) (2023-12-13T11:08:25Z) - Recurrent Submodular Welfare and Matroid Blocking Bandits [22.65352007353614]
最近の研究は、マルチアームバンディット問題(MAB)の研究に焦点をあてている。
我々は、任意のマトロイドに対して$ (1 - frac1e)$-approximation を得ることのできる新しいアルゴリズムのアイデアを開発した。
鍵となる要素は、相関的な(インターリーブされた)スケジューリング技術である。
論文 参考訳(メタデータ) (2021-01-30T21:51:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。