論文の概要: FormatFuzzer: Effective Fuzzing of Binary File Formats
- arxiv url: http://arxiv.org/abs/2109.11277v3
- Date: Wed, 27 Sep 2023 12:57:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 15:48:09.498849
- Title: FormatFuzzer: Effective Fuzzing of Binary File Formats
- Title(参考訳): formatfuzzer:バイナリファイルフォーマットの効率的なファジング
- Authors: Rafael Dutra, Rahul Gopinath, Andreas Zeller
- Abstract要約: FormatFuzzerはフォーマット固有のファズーのジェネレータである。
フォーマット固有のファジターは、ブラックボックス設定でスタンドアロンのプロデューサまたはミューテータとして使用することができる。
- 参考スコア(独自算出の注目度): 11.201540907330436
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Effective fuzzing of programs that process structured binary inputs, such as
multimedia files, is a challenging task, since those programs expect a very
specific input format. Existing fuzzers, however, are mostly format-agnostic,
which makes them versatile, but also ineffective when a specific format is
required. We present FormatFuzzer, a generator for format-specific fuzzers.
FormatFuzzer takes as input a binary template (a format specification used by
the 010 Editor) and compiles it into C++ code that acts as parser, mutator, and
highly efficient generator of inputs conforming to the rules of the language.
The resulting format-specific fuzzer can be used as a standalone producer or
mutator in black-box settings, where no guidance from the program is available.
In addition, by providing mutable decision seeds, it can be easily integrated
with arbitrary format-agnostic fuzzers such as AFL to make them format-aware.
In our evaluation on complex formats such as MP4 or ZIP, FormatFuzzer showed to
be a highly effective producer of valid inputs that also detected previously
unknown memory errors in ffmpeg and timidity.
- Abstract(参考訳): マルチメディアファイルなどの構造化バイナリ入力を処理するプログラムの効果的なファジングは、非常に特定の入力フォーマットを期待するので、難しい課題である。
しかし、既存のファザーはほとんどフォーマットに依存しないため、汎用性があるが、特定のフォーマットが必要な場合には有効ではない。
FormatFuzzerはフォーマット固有のファズーのジェネレータである。
FormatFuzzerはバイナリテンプレート(010 Editorで使用されるフォーマット仕様)を入力として、パーサ、ミューテータ、および言語の規則に準拠した入力の高効率なジェネレータとして機能するC++コードにコンパイルする。
結果として生成されたフォーマット固有のファジターは、プログラムからのガイダンスがないブラックボックス設定でスタンドアロンのプロデューサまたはミューテータとして使用できる。
さらに、変更可能な決定種を提供することで、aflのような任意のフォーマットに依存しないファザーと簡単に統合でき、フォーマットを認識できる。
また,MP4 や ZIP などの複雑なフォーマットを評価したところ,FormatFuzzer は従来未知のメモリエラーを検出できる有効な入力のプロデューサであることがわかった。
関連論文リスト
- Beyond Language Models: Byte Models are Digital World Simulators [68.91268999567473]
bGPTは、デジタルワールドをシミュレートする次のバイト予測モデルである。
これは、テキスト、オーディオ、画像など、様々なモダリティにわたるパフォーマンスの特殊なモデルと一致している。
シンボリックな音楽データを変換する過程をほぼ完璧に再現し、1バイトあたり0.0011ビットの誤り率を達成した。
論文 参考訳(メタデータ) (2024-02-29T13:38:07Z) - SparseCoder: Identifier-Aware Sparse Transformer for File-Level Code
Summarization [51.67317895094664]
本稿では,大規模なソースコードプロジェクトの理解と維持を支援するファイルレベルのコード要約について検討する。
長いコードシーケンスを効果的に処理するための識別子対応スパース変換器であるSparseCoderを提案する。
論文 参考訳(メタデータ) (2024-01-26T09:23:27Z) - Towards General-Purpose Text-Instruction-Guided Voice Conversion [84.78206348045428]
本稿では,「深い声調でゆっくり発声する」や「陽気な少年声で話す」といったテキスト指示によって導かれる,新しい音声変換モデルを提案する。
提案したVCモデルは、離散コード列を処理するニューラルネットワークモデルであり、変換された音声のコード列を生成する。
論文 参考訳(メタデータ) (2023-09-25T17:52:09Z) - Guess & Sketch: Language Model Guided Transpilation [61.24102712913847]
学習されたトランスパイレーションは、手作業による書き直しやエンジニアリングの取り組みに代わるものだ。
確率的ニューラルネットワークモデル(LM)は、入力毎に可塑性出力を生成するが、正確性を保証するコストがかかる。
Guess & Sketch は LM の特徴からアライメントと信頼性情報を抽出し、意味的等価性を解決するためにシンボリック・ソルバに渡す。
論文 参考訳(メタデータ) (2023-09-25T15:42:18Z) - Augmenting Greybox Fuzzing with Generative AI [0.0]
生成AIによって強化されたグレーボックスファジィであるChatFuzzを提案する。
生成LDMモデルのパワーを収穫するためのベストプラクティスを探るため、広範囲にわたる実験を行った。
実験の結果,SOTAグレーボックスファザよりも12.77%のエッジカバレッジが向上した。
論文 参考訳(メタデータ) (2023-06-11T21:44:47Z) - Type Prediction With Program Decomposition and Fill-in-the-Type Training [2.7998963147546143]
大規模な言語モデルを活用する型予測のための検索ベースのアプローチであるOpenTauを構築した。
TypeScriptの型予測のための新しいデータセットで作業を評価し、ファイルタイプチェックの47.4%(14.5%の絶対的改善)とファイル毎の3.3型のエラー率を示している。
論文 参考訳(メタデータ) (2023-05-25T21:16:09Z) - InstructVid2Vid: Controllable Video Editing with Natural Language
Instructions [106.6740407795944]
人間の言語命令で動画を編集するエンドツーエンド拡散方式,すなわち $textbfInstructVid2Vid$ を提案する。
提案手法では,自然言語命令に基づく入力ビデオの編集を,例ごとの微調整や逆変換を行なわずに行うことができる。
実験によると、InstructVid2Vidは高品質で時間的に整合したビデオを生成し、編集、背景の変更、スタイル転送など様々な編集を行うことができる。
論文 参考訳(メタデータ) (2023-05-21T03:28:13Z) - Verified Reversible Programming for Verified Lossless Compression [11.020543186794459]
ロスレス圧縮の実装は通常、エンコーダとデコーダの2つのプログラムを含む。
我々は、非対称数値システム(ANS)に基づく圧縮手法のかなりのクラスが、エンコーダとデコーダの間で共有構造を持つことを観察する。
私たちはAgdaに埋め込まれた小さな可逆言語「Flipper」を実装しました。
論文 参考訳(メタデータ) (2022-11-02T16:39:41Z) - Diffsound: Discrete Diffusion Model for Text-to-sound Generation [78.4128796899781]
本稿では,テキストエンコーダ,ベクトル量子化変分自動符号化(VQ-VAE),デコーダ,ボコーダからなる新しいテキスト音声生成フレームワークを提案する。
フレームワークは、まず、デコーダを使用して、テキストエンコーダから抽出したテキスト特徴をVQ-VAEの助けを借りてメルスペクトルに転送し、次いで、ボコーダを使用して生成されたメルスペクトルを波形に変換する。
論文 参考訳(メタデータ) (2022-07-20T15:41:47Z) - Toward the Detection of Polyglot Files [2.7402733069180996]
複数のファイルフォーマットで有効なファイルを作成することで、標準化されたファイルフォーマットを悪用することができる。
結果として生成されるポリグロット(多言語)ファイルは、ファイルフォーマットの識別を混乱させ、ファイルの要素が解析を回避できる。
これは、特徴抽出のためにファイルフォーマットの識別に依存するマルウェア検出システムにおいて特に問題となる。
論文 参考訳(メタデータ) (2022-03-14T23:48:22Z) - Leader: Prefixing a Length for Faster Word Vector Serialization [11.112281331309939]
事前訓練された単語の埋め込みを配布するために2つのファイル形式が使用される。
GloVeフォーマットはテキストベースのフォーマットで、ファイルサイズが大きく、読み込みが遅い。
word2vecフォーマットは、単語のテキスト表現とベクトル自体のバイナリ表現を混ぜた、より小さなバイナリフォーマットである。
論文 参考訳(メタデータ) (2020-09-29T00:25:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。