論文の概要: FormatFuzzer: Effective Fuzzing of Binary File Formats
- arxiv url: http://arxiv.org/abs/2109.11277v3
- Date: Wed, 27 Sep 2023 12:57:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 15:48:09.498849
- Title: FormatFuzzer: Effective Fuzzing of Binary File Formats
- Title(参考訳): formatfuzzer:バイナリファイルフォーマットの効率的なファジング
- Authors: Rafael Dutra, Rahul Gopinath, Andreas Zeller
- Abstract要約: FormatFuzzerはフォーマット固有のファズーのジェネレータである。
フォーマット固有のファジターは、ブラックボックス設定でスタンドアロンのプロデューサまたはミューテータとして使用することができる。
- 参考スコア(独自算出の注目度): 11.201540907330436
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Effective fuzzing of programs that process structured binary inputs, such as
multimedia files, is a challenging task, since those programs expect a very
specific input format. Existing fuzzers, however, are mostly format-agnostic,
which makes them versatile, but also ineffective when a specific format is
required. We present FormatFuzzer, a generator for format-specific fuzzers.
FormatFuzzer takes as input a binary template (a format specification used by
the 010 Editor) and compiles it into C++ code that acts as parser, mutator, and
highly efficient generator of inputs conforming to the rules of the language.
The resulting format-specific fuzzer can be used as a standalone producer or
mutator in black-box settings, where no guidance from the program is available.
In addition, by providing mutable decision seeds, it can be easily integrated
with arbitrary format-agnostic fuzzers such as AFL to make them format-aware.
In our evaluation on complex formats such as MP4 or ZIP, FormatFuzzer showed to
be a highly effective producer of valid inputs that also detected previously
unknown memory errors in ffmpeg and timidity.
- Abstract(参考訳): マルチメディアファイルなどの構造化バイナリ入力を処理するプログラムの効果的なファジングは、非常に特定の入力フォーマットを期待するので、難しい課題である。
しかし、既存のファザーはほとんどフォーマットに依存しないため、汎用性があるが、特定のフォーマットが必要な場合には有効ではない。
FormatFuzzerはフォーマット固有のファズーのジェネレータである。
FormatFuzzerはバイナリテンプレート(010 Editorで使用されるフォーマット仕様)を入力として、パーサ、ミューテータ、および言語の規則に準拠した入力の高効率なジェネレータとして機能するC++コードにコンパイルする。
結果として生成されたフォーマット固有のファジターは、プログラムからのガイダンスがないブラックボックス設定でスタンドアロンのプロデューサまたはミューテータとして使用できる。
さらに、変更可能な決定種を提供することで、aflのような任意のフォーマットに依存しないファザーと簡単に統合でき、フォーマットを認識できる。
また,MP4 や ZIP などの複雑なフォーマットを評価したところ,FormatFuzzer は従来未知のメモリエラーを検出できる有効な入力のプロデューサであることがわかった。
関連論文リスト
- FuzzCoder: Byte-level Fuzzing Test via Large Language Model [46.18191648883695]
我々は,攻撃を成功させることで,入力ファイルのパターンを学習するために,微調整された大言語モデル(FuzzCoder)を採用することを提案する。
FuzzCoderは、プログラムの異常な動作を引き起こすために、入力ファイル内の突然変異位置と戦略位置を予測することができる。
論文 参考訳(メタデータ) (2024-09-03T14:40:31Z) - Compressed-Language Models for Understanding Compressed File Formats: a JPEG Exploration [82.88166538896331]
我々は、圧縮における鍵概念の共通性と代表性を考慮して、JPEGフォーマットを代表的CFFとして重視する。
我々は、CLMがJPEGフォーマットを理解するかどうかを、固有のファイルプロパティの認識、異常のあるファイルの扱い、新しいファイルの生成という、3つの軸に沿って実行する能力を調べて検証する。
結果から,CFFが生成するファイルのバイトストリームを直接操作する場合,圧縮データのセマンティクスをCLMで理解できることが示唆された。
論文 参考訳(メタデータ) (2024-05-27T13:09:23Z) - 3DGen: AI-Assisted Generation of Provably Correct Binary Format Parsers [5.102523342662388]
3DGenは、AIエージェントを使用して、混合非公式入力を3Dと呼ばれる言語でフォーマット仕様に変換するフレームワークである。
3DGenはテストスイートに準拠した3D仕様を生成する。
論文 参考訳(メタデータ) (2024-04-16T07:53:28Z) - Beyond Language Models: Byte Models are Digital World Simulators [68.91268999567473]
bGPTは、デジタルワールドをシミュレートする次のバイト予測モデルである。
これは、テキスト、オーディオ、画像など、様々なモダリティにわたるパフォーマンスの特殊なモデルと一致している。
シンボリックな音楽データを変換する過程をほぼ完璧に再現し、1バイトあたり0.0011ビットの誤り率を達成した。
論文 参考訳(メタデータ) (2024-02-29T13:38:07Z) - SparseCoder: Identifier-Aware Sparse Transformer for File-Level Code
Summarization [51.67317895094664]
本稿では,大規模なソースコードプロジェクトの理解と維持を支援するファイルレベルのコード要約について検討する。
長いコードシーケンスを効果的に処理するための識別子対応スパース変換器であるSparseCoderを提案する。
論文 参考訳(メタデータ) (2024-01-26T09:23:27Z) - MambaByte: Token-free Selective State Space Model [71.90159903595514]
マンババイト(英: MambaByte)は、マンバSSMがバイト配列で自己回帰的に訓練したトークンレス適応である。
MambaByteは、言語モデリングタスクにおいて、最先端のサブワードトランスフォーマーよりも優れています。
論文 参考訳(メタデータ) (2024-01-24T18:53:53Z) - Augmenting Greybox Fuzzing with Generative AI [0.0]
生成AIによって強化されたグレーボックスファジィであるChatFuzzを提案する。
生成LDMモデルのパワーを収穫するためのベストプラクティスを探るため、広範囲にわたる実験を行った。
実験の結果,SOTAグレーボックスファザよりも12.77%のエッジカバレッジが向上した。
論文 参考訳(メタデータ) (2023-06-11T21:44:47Z) - Diffsound: Discrete Diffusion Model for Text-to-sound Generation [78.4128796899781]
本稿では,テキストエンコーダ,ベクトル量子化変分自動符号化(VQ-VAE),デコーダ,ボコーダからなる新しいテキスト音声生成フレームワークを提案する。
フレームワークは、まず、デコーダを使用して、テキストエンコーダから抽出したテキスト特徴をVQ-VAEの助けを借りてメルスペクトルに転送し、次いで、ボコーダを使用して生成されたメルスペクトルを波形に変換する。
論文 参考訳(メタデータ) (2022-07-20T15:41:47Z) - Toward the Detection of Polyglot Files [2.7402733069180996]
複数のファイルフォーマットで有効なファイルを作成することで、標準化されたファイルフォーマットを悪用することができる。
結果として生成されるポリグロット(多言語)ファイルは、ファイルフォーマットの識別を混乱させ、ファイルの要素が解析を回避できる。
これは、特徴抽出のためにファイルフォーマットの識別に依存するマルウェア検出システムにおいて特に問題となる。
論文 参考訳(メタデータ) (2022-03-14T23:48:22Z) - Leader: Prefixing a Length for Faster Word Vector Serialization [11.112281331309939]
事前訓練された単語の埋め込みを配布するために2つのファイル形式が使用される。
GloVeフォーマットはテキストベースのフォーマットで、ファイルサイズが大きく、読み込みが遅い。
word2vecフォーマットは、単語のテキスト表現とベクトル自体のバイナリ表現を混ぜた、より小さなバイナリフォーマットである。
論文 参考訳(メタデータ) (2020-09-29T00:25:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。