論文の概要: S$^2$F: Principled Hybrid Testing With Fuzzing, Symbolic Execution, and Sampling
- arxiv url: http://arxiv.org/abs/2601.10068v1
- Date: Thu, 15 Jan 2026 04:48:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-16 19:43:18.991886
- Title: S$^2$F: Principled Hybrid Testing With Fuzzing, Symbolic Execution, and Sampling
- Title(参考訳): S$^2$F: ファジィ、シンボリック実行、サンプリングによる原則付きハイブリッドテスト
- Authors: Lianjing Wang, Yufeng Zhang, Kenli Li, Zhenbang Chen, Xu Zhou, Pengfei Wang, Guangning Song, Ji Wang,
- Abstract要約: 本稿では,従来のシンボル実行の精度と最適化されたシンボル実行エンジンのスケーラビリティを併用した新しいハイブリッドテストアーキテクチャを提案する。
このアーキテクチャに基づいて,ファジィ,シンボル実行,サンプリングを組み合わせたいくつかの原理を提案する。
私たちのツールは、現実世界のプログラムでこれまで知られていなかった3つのクラッシュを明らかにします。
- 参考スコア(独自算出の注目度): 23.68545255466412
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Hybrid testing that integrates fuzzing, symbolic execution, and sampling has demonstrated superior testing efficiency compared to individual techniques. However, the state-of-the-art (SOTA) hybrid testing tools do not fully exploit the capabilities of symbolic execution and sampling in two key aspects. First, the SOTA hybrid testing tools employ tailored symbolic execution engines that tend to over-prune branches, leading to considerable time wasted waiting for seeds from the fuzzer and missing opportunities to discover crashes. Second, existing methods do not apply sampling to the appropriate branches and therefore cannot utilize the full capability of sampling. To address these two limitations, we propose a novel hybrid testing architecture that combines the precision of conventional symbolic execution with the scalability of tailored symbolic execution engines. Based on this architecture, we propose several principles for combining fuzzing, symbolic execution, and sampling. We implement our method in a hybrid testing tool S$^2$F. To evaluate its effectiveness, we conduct extensive experiments on 15 real-world programs. Experimental results demonstrate that S$^2$F outperforms the SOTA tool, achieving an average improvement of 6.14% in edge coverage and 32.6% in discovered crashes. Notably, our tool uncovers three previously unknown crashes in real-world programs.
- Abstract(参考訳): ファジィング、シンボリック実行、サンプリングを統合するハイブリッドテストは、個々の技術よりも優れたテスト効率を示している。
しかし、最先端(SOTA)ハイブリッドテストツールは、2つの重要な側面において、シンボル実行とサンプリングの能力を十分に活用していない。
第一に、SOTAハイブリッドテストツールは、枝を過負荷にしがちな、調整された象徴的な実行エンジンを使用しており、ファザーからの種を待ち、クラッシュを発見する機会を欠くかなりの時間を無駄にしている。
第二に、既存のメソッドはサンプリングを適切なブランチに適用しないため、サンプリングの全機能を利用することはできない。
これら2つの制約に対処するために,従来のシンボル実行の精度と,最適化されたシンボル実行エンジンのスケーラビリティを組み合わせた,新しいハイブリッドテストアーキテクチャを提案する。
このアーキテクチャに基づいて,ファジィ,シンボル実行,サンプリングを組み合わせたいくつかの原理を提案する。
本手法をハイブリッドテストツールS$2$Fに実装する。
その有効性を評価するために,15の実世界のプログラムについて広範な実験を行った。
実験の結果、S$^2$FはSOTAツールより優れており、エッジカバレッジは6.14%、クラッシュは32.6%向上した。
特に、我々のツールは、現実世界のプログラムでこれまで知られていなかった3つのクラッシュを発見した。
関連論文リスト
- TUMIX: Multi-Agent Test-Time Scaling with Tool-Use Mixture [60.945393748584316]
本稿では,複数のエージェントを並列に実行するアンサンブルフレームワークを提案する。
TUmixは、最先端のツール拡張およびテストタイムスケーリングメソッドよりも大幅に向上する。
エージェントの多様性と品質は重要であり,LLMを用いてエージェント設計を自動最適化することで向上することができる。
論文 参考訳(メタデータ) (2025-09-30T19:19:56Z) - Hybrid Approach to Directed Fuzzing [0.0]
そこで本研究では,新しいシードスケジューリングアルゴリズムを用いた双方向ファジリングのハイブリッド手法を提案する。
LibAFL-DiFuzz を有向ファザとして,Sydr-Fuzz を動的シンボリックエグゼキュータとして,Sydr-Fuzz ツールに実装した。
論文 参考訳(メタデータ) (2025-07-07T10:29:16Z) - R2E-Gym: Procedural Environments and Hybrid Verifiers for Scaling Open-Weights SWE Agents [32.06393076572057]
AgentGymは、現実世界のSWEエージェントを訓練するための、手続き的に計算された最大のジム環境である。
Syngen、合成データキュレーションのレシピ、ハイブリッドテストタイムスケーリングの2つの主要なコントリビューションによって実現されている。
提案手法は,SWE-Bench Verifiedベンチマークで51%を達成し,オープンウェイトSWEエージェントの新たな最先端性を反映した。
論文 参考訳(メタデータ) (2025-04-09T17:55:19Z) - FR-Spec: Accelerating Large-Vocabulary Language Models via Frequency-Ranked Speculative Sampling [59.8051705468084]
投機的サンプリングは,大規模言語モデルの自己回帰生成プロセスを促進する重要な手法として登場した。
本稿では、語彙空間圧縮によるドラフト候補選択を最適化する周波数ランクの投機的サンプリングフレームワークFR-Specを提案する。
論文 参考訳(メタデータ) (2025-02-20T18:58:10Z) - AxBench: Steering LLMs? Even Simple Baselines Outperform Sparse Autoencoders [73.37603699731329]
ステアリングと概念検出のための大規模ベンチマークであるAxBenchを紹介する。
ステアリングでは、すべての既存のメソッドを高速に処理し、次いで微調整する。
概念検出では、差分のような表現に基づく手法が最善を尽くす。
論文 参考訳(メタデータ) (2025-01-28T18:51:24Z) - SAFLITE: Fuzzing Autonomous Systems via Large Language Models [5.652209612560521]
本稿では,自律システムにおけるファジテストの効率化を目的とした普遍的な枠組みを提案する。
コアとなるSaFliTeは、テストケースが事前に定義された安全基準を満たすかどうかを評価する予測コンポーネントである。
GPT-3.5, Mistral-7B, Llama2-7B など様々な LLM を用いて SaFliTe をインスタンス化し, PGFuzz, DeepHyperion-UAV, CAMBA, TUMB の4つのファジテストツールに統合することにより, SaFliTe の評価を行った。
論文 参考訳(メタデータ) (2024-12-25T01:00:05Z) - Are Negative Samples Necessary in Entity Alignment? An Approach with
High Performance, Scalability and Robustness [26.04006507181558]
本稿では,高パフォーマンス,高スケーラビリティ,高ロバスト性を実現する3つの新しいコンポーネントを持つ新しいEA手法を提案する。
提案手法の有効性と有効性を検討するために,いくつかの公開データセットについて詳細な実験を行った。
論文 参考訳(メタデータ) (2021-08-11T15:20:41Z) - Disentangle Your Dense Object Detector [82.22771433419727]
深層学習に基づく高密度物体検出器はここ数年で大きな成功を収め、ビデオ理解などのマルチメディアアプリケーションにも応用されてきた。
しかし、現在の高密度検出器の訓練パイプラインは、保持できない多くの接続に妥協されている。
そこで本研究では, 簡易かつ効果的な遠心分離機構を設計し, 現在の最先端検出器に統合するDED(Disentangled Dense Object Detector)を提案する。
論文 参考訳(メタデータ) (2021-07-07T00:52:16Z) - Legion: Best-First Concolic Testing [12.566008895024176]
Legionは、自動テスト生成を不確実性の下でのシーケンシャルな意思決定の問題として扱うために、AI文献からMonte Carlo Tree Search (MCTS)フレームワークを再設計する。
その最優先の検索戦略は、前回の反復で観測された報酬に基づいて、最も有望なプログラム状態から各検索について調査する、原則化された方法を提供する。
APPFuzzingはモンテカルロシミュレーション技術として機能し、制約サンプリングの事前作業を拡張することで実装されている。
論文 参考訳(メタデータ) (2020-02-15T03:35:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。