論文の概要: Risk Estimation in Differential Fuzzing via Extreme Value Theory
- arxiv url: http://arxiv.org/abs/2511.02927v1
- Date: Tue, 04 Nov 2025 19:19:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-06 18:19:32.216986
- Title: Risk Estimation in Differential Fuzzing via Extreme Value Theory
- Title(参考訳): 極値理論によるファジィファジィのリスク推定
- Authors: Rafael Baez, Alejandro Olivas, Nathan K. Diamond, Marcelo Frias, Yannic Noller, Saeid Tizpaz-Niari,
- Abstract要約: 本稿では,差分ファズリングにおけるバグの欠落や過小評価のリスクに対するEVT(Extreme Value Theory)の適用について検討する。
実世界のJavaライブラリのセットで実験を行い、ディファジィファジィを用いてサイドチャネルを介して情報漏洩を検出する。
- 参考スコア(独自算出の注目度): 38.81349131810439
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Differential testing is a highly effective technique for automatically detecting software bugs and vulnerabilities when the specifications involve an analysis over multiple executions simultaneously. Differential fuzzing, in particular, operates as a guided randomized search, aiming to find (similar) inputs that lead to a maximum difference in software outputs or their behaviors. However, fuzzing, as a dynamic analysis, lacks any guarantees on the absence of bugs: from a differential fuzzing campaign that has observed no bugs (or a minimal difference), what is the risk of observing a bug (or a larger difference) if we run the fuzzer for one or more steps? This paper investigates the application of Extreme Value Theory (EVT) to address the risk of missing or underestimating bugs in differential fuzzing. The key observation is that differential fuzzing as a random process resembles the maximum distribution of observed differences. Hence, EVT, a branch of statistics dealing with extreme values, is an ideal framework to analyze the tail of the differential fuzzing campaign to contain the risk. We perform experiments on a set of real-world Java libraries and use differential fuzzing to find information leaks via side channels in these libraries. We first explore the feasibility of EVT for this task and the optimal hyperparameters for EVT distributions. We then compare EVT-based extrapolation against baseline statistical methods like Markov's as well as Chebyshev's inequalities, and the Bayes factor. EVT-based extrapolations outperform the baseline techniques in 14.3% of cases and tie with the baseline in 64.2% of cases. Finally, we evaluate the accuracy and performance gains of EVT-enabled differential fuzzing in real-world Java libraries, where we reported an average saving of tens of millions of bytecode executions by an early stop.
- Abstract(参考訳): 差分テストは、複数の実行を同時に分析する場合に、ソフトウェアバグや脆弱性を自動的に検出する、非常に効果的なテクニックである。
微分ファジィングは、特に、ソフトウェア出力やその振る舞いの最大差につながる(類似した)入力を見つけることを目的とした、ガイド付きランダム化検索として機能する。
しかしながら、ファジィングは動的解析として、バグの欠如に関する保証を欠いている。バグ(または最小限の違い)を観測した差分ファジィングキャンペーンから、ファジィアを1つ以上のステップで実行する場合、バグ(または大きな違い)を観察するリスクは何か?
本稿では,差分ファズリングにおけるバグの欠落や過小評価のリスクに対するEVT(Extreme Value Theory)の適用について検討する。
重要な観察は、ランダムな過程としての微分ファジィングが観測された差の最大分布に類似していることである。
したがって、極端な値を扱う統計学の分野であるEVTは、リスクを抑えるために差動ファジィングキャンペーンのテールを分析するのに理想的なフレームワークである。
実世界のJavaライブラリのセットで実験を行い、差分ファジィを用いてこれらのライブラリのサイドチャネルを介して情報漏洩を検出する。
まず,この課題に対するEVTの実現可能性とEVT分布に対する最適ハイパーパラメータについて検討する。
次に、EVTに基づく外挿法を、マルコフやチェビシェフの不等式、ベイズ因子といったベースライン統計手法と比較する。
EVTベースの外挿は、14.3%のケースでベースライン技術より優れ、64.2%のケースではベースラインと結びついている。
最後に,実世界のJavaライブラリにおけるEVT対応ディファジィファジィの精度と性能向上を評価した。
関連論文リスト
- Risk-Sensitive Diffusion: Robustly Optimizing Diffusion Models with Noisy Samples [58.68233326265417]
非画像データは実際のアプリケーションで広く使われており、ノイズが多い傾向にある。
リスク感受性SDEは、リスクベクトルによってパラメータ化された微分方程式(SDE)の一種である。
我々はガウス雑音分布と非ガウス雑音分布の両方について系統的研究を行う。
論文 参考訳(メタデータ) (2024-02-03T08:41:51Z) - Uncertainty Modeling for Out-of-Distribution Generalization [56.957731893992495]
特徴統計を適切に操作することで、ディープラーニングモデルの一般化能力を向上させることができると論じる。
一般的な手法では、特徴統計を学習した特徴から測定された決定論的値とみなすことが多い。
我々は、学習中に合成された特徴統計を用いて、領域シフトの不確かさをモデル化することにより、ネットワークの一般化能力を向上させる。
論文 参考訳(メタデータ) (2022-02-08T16:09:12Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Learnable Locality-Sensitive Hashing for Video Anomaly Detection [44.19433917039249]
ビデオ異常検出(英語: Video Anomaly Detection, VAD)とは、通常サンプルのみが利用可能なトレーニングセットで発生していない異常事象を特定することを指す。
本稿では,すべての標準データを効率よく,かつ柔軟に活用するための,距離に基づく新しいVAD手法を提案する。
論文 参考訳(メタデータ) (2021-11-15T15:25:45Z) - RIFLE: Imputation and Robust Inference from Low Order Marginals [10.082738539201804]
我々は,不備なデータの存在下での回帰と分類のための統計的推論フレームワークを開発する。
我々のフレームワークであるRIFLEは、基礎となるデータ分布の低次モーメントを対応する信頼区間で推定し、分布的に堅牢なモデルを学ぶ。
実験の結果,RIFLEは,欠落値の割合が高い場合や,データポイント数が比較的小さい場合には,他のベンチマークアルゴリズムよりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-09-01T23:17:30Z) - Examining and Combating Spurious Features under Distribution Shift [94.31956965507085]
我々は、最小限の統計量という情報理論の概念を用いて、ロバストで刺激的な表現を定義し、分析する。
入力分布のバイアスしか持たない場合でも、モデルはトレーニングデータから急激な特徴を拾い上げることができることを証明しています。
分析から着想を得た結果,グループDROは,グループ同士の相関関係を直接考慮しない場合に失敗する可能性が示唆された。
論文 参考訳(メタデータ) (2021-06-14T05:39:09Z) - Reducing the Amortization Gap in Variational Autoencoders: A Bayesian
Random Function Approach [38.45568741734893]
GPモデルの推論は、セミアモタイズ法よりもはるかに高速な1つのフィードフォワードパスによって行われる。
提案手法は,複数のベンチマークデータセットの最先端データよりも高い確率でテストデータが得られることを示す。
論文 参考訳(メタデータ) (2021-02-05T13:01:12Z) - Towards Discriminability and Diversity: Batch Nuclear-norm Maximization
under Label Insufficient Situations [154.51144248210338]
Batch Nuclear-norm Maximization (BNM) は、学習シナリオのラベルが不十分な場合の学習を促進するために提案されている。
BNMはライバルより優れており、既存のよく知られた手法でうまく機能する。
論文 参考訳(メタデータ) (2020-03-27T05:04:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。