論文の概要: Psyzkaller: Learning from Historical and On-the-Fly Execution Data for Smarter Seed Generation in OS kernel Fuzzing
- arxiv url: http://arxiv.org/abs/2510.08918v1
- Date: Fri, 10 Oct 2025 02:01:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 00:38:47.998533
- Title: Psyzkaller: Learning from Historical and On-the-Fly Execution Data for Smarter Seed Generation in OS kernel Fuzzing
- Title(参考訳): Psyzkaller: OSカーネルファジィングにおけるよりスマートな種子生成のための履歴およびオンザフライ実行データから学ぶ
- Authors: Boyu Liu, Yang Zhang, Liang Cheng, Yi Zhang, Junjie Fan, Yu Fu,
- Abstract要約: 事実上標準のSyzkallerを含む最先端のカーネルファズーは、暗黙のSyscall Dependency Relations(SDR)を尊重する有効なsyscallシーケンスを生成するのに苦労している。
我々は,N-gramモデルを用いてDongtingデータセットからSDRをマイニングする手法を提案する。
実験の結果、Psyzkallerは48時間のファジングでSyzkallerのコードカバレッジを4.6%-7.0%改善し、110.4%-187.2%のクラッシュを引き起こした。
- 参考スコア(独自算出の注目度): 12.3054061941269
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Fuzzing has become a cornerstone technique for uncovering vulnerabilities and enhancing the security of OS kernels. However, state-of-the-art kernel fuzzers, including the de facto standard Syzkaller, struggle to generate valid syscall sequences that respect implicit Syscall Dependency Relations (SDRs). Consequently, many generated seeds either fail kernel validation or cannot penetrate deep execution paths, resulting in significant inefficiency. We hypothesize that SDRs can be effectively learned from both historic and present kernel execution data, and that incorporating these learned relations into fuzzing can substantially improve seed validity and diversity. To validate this, we propose an approach that utilizes the N-gram model to mine SDRs from the Dongting dataset-one of the largest Linux kernel execution datasets available-as well as from execution traces collected on the fly during fuzzing. The resulting model is used to continuously augment the Choice Table of Syzkaller to improve its seed generation and demonstrably increases the Shannon Entropy of the Choice Table throughout fuzzing, reflecting more empirically-grounded choices in expanding syscall sequences into valid and diverse seeds. In addition, we introduce a Random Walk strategy that instructs Syzkaller to construct seeds in a bidirectional manner to further diversify the generated seeds. We implement our approach in a prototype, Psyzkaller, built on top of Syzkaller. Experiments on three representative Linux kernel versions show that Psyzkaller improves Syzkaller's code coverage by 4.6%-7.0% in 48-hour fuzzing, while triggering 110.4%-187.2% more crashes. Moreover, our investigation shows that Psyzkaller discovered eight previously unknown kernel vulnerabilities, compared to only one found by Syzkaller.
- Abstract(参考訳): ファジィングは脆弱性を発見し、OSカーネルのセキュリティを強化するための基盤となる技術となっている。
しかし、事実上標準のSyzkallerを含む最先端のカーネルファズーは、暗黙のSyscall Dependency Relations (SDR)を尊重する有効なsyscallシーケンスを生成するのに苦労している。
その結果、多くの生成された種子は、カーネルの検証に失敗するか、深い実行経路を貫くことができないか、大きな非効率をもたらす。
我々は、SDRは、歴史的および現在のカーネル実行データから効果的に学習できると仮定し、これらの学習関係をファジングに組み込むことで、種子の有効性と多様性を大幅に改善できると仮定する。
そこで本研究では,N-gramモデルを用いてLinuxカーネル実行データセットのDongtingデータセットからSDRをマイニングする手法を提案する。
結果として得られるモデルは、SyzkallerのChoice Tableを継続的に増強し、シード生成を改善し、ファジングを通してChoice TableのShannon Entropyを実証的に増加させ、シスコール配列を有効で多様なシードに拡張する経験的な選択を反映させる。
さらに,Syzkallerが生成した種子をさらに多様化させるために,双方向で種子を構築するように指示するランダムウォーク戦略を導入する。
当社のアプローチは,Syzkaller上に構築されたプロトタイプであるPsyzkallerに実装されています。
Psyzkallerは48時間のファジィングで4.6%-7.0%改善し、110.4%-187.2%のクラッシュを引き起こした。
さらに、我々の調査によると、PsyzkallerはSyzkallerが発見したカーネルの脆弱性を8つ発見している。
関連論文リスト
- DiffuGuard: How Intrinsic Safety is Lost and Found in Diffusion Large Language Models [50.21378052667732]
我々は、ステップ内およびステップ間ダイナミクスという2つの異なる次元にわたるジェイルブレイク攻撃に対して、dLLM脆弱性の詳細な分析を行う。
デュアルステージアプローチによる脆弱性に対処する,トレーニング不要な防御フレームワークであるDiffuGuardを提案する。
論文 参考訳(メタデータ) (2025-09-29T05:17:10Z) - LLAMA: Multi-Feedback Smart Contract Fuzzing Framework with LLM-Guided Seed Generation [56.84049855266145]
進化的突然変異戦略とハイブリッドテスト技術を統合したマルチフィードバックスマートコントラクトファジリングフレームワーク(LLAMA)を提案する。
LLAMAは、91%の命令カバレッジと90%のブランチカバレッジを達成すると同時に、148の既知の脆弱性のうち132が検出される。
これらの結果は、現実のスマートコントラクトセキュリティテストシナリオにおけるLAMAの有効性、適応性、実用性を強調している。
論文 参考訳(メタデータ) (2025-07-16T09:46:58Z) - Demystifying OS Kernel Fuzzing with a Novel Taxonomy [42.56259589772939]
本研究はOSカーネルファジィングに関する最初の体系的研究である。
2017年から2024年にかけて、トップレベルの会場から99の学術研究の進捗状況をまとめることから始まる。
本稿では,カーネルファジングに特有の9つのコア機能に着目した,ステージベースファジングモデルとファジング分類法を提案する。
論文 参考訳(メタデータ) (2025-01-27T16:03:14Z) - Osiris: A Systolic Approach to Accelerating Fully Homomorphic Encryption [3.16990548935142]
本稿では, シストリックアーキテクチャを用いて, 完全同型暗号(FHE)をいかに高速化できるかを示す。
我々は手足インターリービングと呼ばれる新しいデータタイリング手法を提案する。
Osirisの評価は、すべての標準ベンチマークにおいて、従来の最先端アクセラレータよりも優れていることを示す。
論文 参考訳(メタデータ) (2024-08-18T20:58:54Z) - RLTrace: Synthesizing High-Quality System Call Traces for OS Fuzz Testing [10.644829779197341]
ファズOSカーネルのシードとして多種多様なシステムコールトレースを合成するために,RLTraceと呼ばれる深層強化学習ベースのソリューションを提案する。
モデルトレーニング中、ディープラーニングモデルはOSカーネルと相互作用し、最適なシステムコールトレースを推論する。
RLTraceは,より包括的なシステムコールトレースを生成することにより,他のシードジェネレータよりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-10-04T06:46:00Z) - Diffusion Augmentation for Sequential Recommendation [47.43402785097255]
本稿では,より高品質な生成のためのDiffuASR(Diffusion Augmentation for Sequential Recommendation)を提案する。
DiffuASRによる強化データセットは、複雑なトレーニング手順なしで、シーケンシャルレコメンデーションモデルを直接トレーニングするために使用することができる。
3つの逐次レコメンデーションモデルを用いた3つの実世界のデータセットに関する広範な実験を行った。
論文 参考訳(メタデータ) (2023-09-22T13:31:34Z) - model-based script synthesis for fuzzing [10.739464605434977]
既存のアプローチは、トレースからのsyscallシーケンスやシステムコードの静的解析をモデル化することでカーネルを混乱させる。
我々は、異なるカーネル状態に到達するために、トレースされたsyscallシーケンスを学習し、変更するためのWinkFuzzを提案する。
論文 参考訳(メタデータ) (2023-08-08T08:07:50Z) - Kernel Identification Through Transformers [54.3795894579111]
カーネル選択はガウス過程(GP)モデルの性能決定において中心的な役割を果たす。
この研究は、高次元GP回帰モデルのためのカスタムカーネル関数を構築するという課題に対処する。
KITT: Kernel Identification through Transformersを提案する。
論文 参考訳(メタデータ) (2021-06-15T14:32:38Z) - Improved, Deterministic Smoothing for L1 Certified Robustness [119.86676998327864]
分割雑音を伴う非加法的決定論的平滑化法(dssn)を提案する。
一様加法平滑化とは対照的に、ssn認証は無作為なノイズコンポーネントを独立に必要としない。
これは、規範ベースの敵対的脅威モデルに対して決定論的「ランダム化平滑化」を提供する最初の仕事である。
論文 参考訳(メタデータ) (2021-03-17T21:49:53Z) - The Signature Kernel is the solution of a Goursat PDE [11.107838656561766]
連続的な微分可能パスに対して、シグネチャカーネルは双曲型PDEを解き、文献でよく知られる微分方程式のクラスとの接続をグールサット問題として認識する。
このGoursat PDEは入力シーケンスの増分にのみ依存し、シグネチャの明示的な計算を必要としない。
我々は、シーケンシャルデータを扱う機械学習アプリケーションにおいて、機械学習ツールとしてのPDEカーネルの有効性を実証的に実証した。
論文 参考訳(メタデータ) (2020-06-26T04:36:50Z) - Learning Deep Kernels for Non-Parametric Two-Sample Tests [50.92621794426821]
2組のサンプルが同じ分布から引き出されるかどうかを判定するカーネルベースの2サンプルテストのクラスを提案する。
私たちのテストは、テストパワーを最大化するためにトレーニングされたディープニューラルネットワークによってパラメータ化されたカーネルから構築されます。
論文 参考訳(メタデータ) (2020-02-21T03:54:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。