Fugu-MT 論文翻訳(概要): FormatFuzzer: Effective Fuzzing of Binary File Formats

論文の概要: FormatFuzzer: Effective Fuzzing of Binary File Formats

arxiv url: http://arxiv.org/abs/2109.11277v3
Date: Wed, 27 Sep 2023 12:57:33 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-24 15:48:09.498849
Title: FormatFuzzer: Effective Fuzzing of Binary File Formats
Title（参考訳）: formatfuzzer:バイナリファイルフォーマットの効率的なファジング
Authors: Rafael Dutra, Rahul Gopinath, Andreas Zeller
Abstract要約: FormatFuzzerはフォーマット固有のファズーのジェネレータである。フォーマット固有のファジターは、ブラックボックス設定でスタンドアロンのプロデューサまたはミューテータとして使用することができる。
参考スコア（独自算出の注目度）: 11.201540907330436
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Effective fuzzing of programs that process structured binary inputs, such as multimedia files, is a challenging task, since those programs expect a very specific input format. Existing fuzzers, however, are mostly format-agnostic, which makes them versatile, but also ineffective when a specific format is required. We present FormatFuzzer, a generator for format-specific fuzzers. FormatFuzzer takes as input a binary template (a format specification used by the 010 Editor) and compiles it into C++ code that acts as parser, mutator, and highly efficient generator of inputs conforming to the rules of the language. The resulting format-specific fuzzer can be used as a standalone producer or mutator in black-box settings, where no guidance from the program is available. In addition, by providing mutable decision seeds, it can be easily integrated with arbitrary format-agnostic fuzzers such as AFL to make them format-aware. In our evaluation on complex formats such as MP4 or ZIP, FormatFuzzer showed to be a highly effective producer of valid inputs that also detected previously unknown memory errors in ffmpeg and timidity.
Abstract（参考訳）: マルチメディアファイルなどの構造化バイナリ入力を処理するプログラムの効果的なファジングは、非常に特定の入力フォーマットを期待するので、難しい課題である。しかし、既存のファザーはほとんどフォーマットに依存しないため、汎用性があるが、特定のフォーマットが必要な場合には有効ではない。 FormatFuzzerはフォーマット固有のファズーのジェネレータである。 FormatFuzzerはバイナリテンプレート(010 Editorで使用されるフォーマット仕様)を入力として、パーサ、ミューテータ、および言語の規則に準拠した入力の高効率なジェネレータとして機能するC++コードにコンパイルする。結果として生成されたフォーマット固有のファジターは、プログラムからのガイダンスがないブラックボックス設定でスタンドアロンのプロデューサまたはミューテータとして使用できる。さらに、変更可能な決定種を提供することで、aflのような任意のフォーマットに依存しないファザーと簡単に統合でき、フォーマットを認識できる。また,MP4 や ZIP などの複雑なフォーマットを評価したところ,FormatFuzzer は従来未知のメモリエラーを検出できる有効な入力のプロデューサであることがわかった。

関連論文リスト

Transformers from Compressed Representations [74.48571451824569]
TEMPEST (TransformErs froM comPressed rEpreSenTations) は、圧縮されたファイルのバイトストリーム構造を利用して効果的なトークン化と符号化戦略を設計する手法である。本提案では,意味分類に必要なトークン数を大幅に削減し,計算複雑性とメモリ使用量の両方を削減する。
論文参考訳（メタデータ） (2025-10-26T13:48:03Z)
Format-Adapter: Improving Reasoning Capability of LLMs by Adapting Suitable Format [93.99600697438079]
以前の研究では、複数の推論フォーマットが複数の回答を生成する場合、単一のフォーマットより優れていることが示されている。与えられたタスクに適切なフォーマットを適応させ、フォーマットを生成して選択する。 Format-Adapterは,従来の作業よりも平均4.3%の性能向上を実現している。
論文参考訳（メタデータ） (2025-06-29T08:11:52Z)
Low-Cost and Comprehensive Non-textual Input Fuzzing with LLM-Synthesized Input Generators [25.199440800244442]
非テキスト入力に対する文法認識ファジィ化を実現するための新しい手法を提案する。 LLMは入力ジェネレータの合成と変更に長け、ローカルオプティマからのジャンプを可能にする。 G2FUZZはAFL++、Fuzztruction、FormatFuzzerといったSOTAツールよりもコードカバレッジとバグ発見の点で優れている。
論文参考訳（メタデータ） (2025-01-31T16:45:16Z)
FuzzCoder: Byte-level Fuzzing Test via Large Language Model [46.18191648883695]
我々は,攻撃を成功させることで,入力ファイルのパターンを学習するために,微調整された大言語モデル(FuzzCoder)を採用することを提案する。 FuzzCoderは、プログラムの異常な動作を引き起こすために、入力ファイル内の突然変異位置と戦略位置を予測することができる。
論文参考訳（メタデータ） (2024-09-03T14:40:31Z)
Compressed-Language Models for Understanding Compressed File Formats: a JPEG Exploration [82.88166538896331]
我々は、圧縮における鍵概念の共通性と代表性を考慮して、JPEGフォーマットを代表的CFFとして重視する。我々は、CLMがJPEGフォーマットを理解するかどうかを、固有のファイルプロパティの認識、異常のあるファイルの扱い、新しいファイルの生成という、3つの軸に沿って実行する能力を調べて検証する。結果から,CFFが生成するファイルのバイトストリームを直接操作する場合,圧縮データのセマンティクスをCLMで理解できることが示唆された。
論文参考訳（メタデータ） (2024-05-27T13:09:23Z)
3DGen: AI-Assisted Generation of Provably Correct Binary Format Parsers [5.102523342662388]
3DGenは、AIエージェントを使用して、混合非公式入力を3Dと呼ばれる言語でフォーマット仕様に変換するフレームワークである。 3DGenはテストスイートに準拠した3D仕様を生成する。
論文参考訳（メタデータ） (2024-04-16T07:53:28Z)
Beyond Language Models: Byte Models are Digital World Simulators [68.91268999567473]
bGPTは、デジタルワールドをシミュレートする次のバイト予測モデルである。これは、テキスト、オーディオ、画像など、様々なモダリティにわたるパフォーマンスの特殊なモデルと一致している。シンボリックな音楽データを変換する過程をほぼ完璧に再現し、1バイトあたり0.0011ビットの誤り率を達成した。
論文参考訳（メタデータ） (2024-02-29T13:38:07Z)
SparseCoder: Identifier-Aware Sparse Transformer for File-Level Code Summarization [51.67317895094664]
本稿では,大規模なソースコードプロジェクトの理解と維持を支援するファイルレベルのコード要約について検討する。長いコードシーケンスを効果的に処理するための識別子対応スパース変換器であるSparseCoderを提案する。
論文参考訳（メタデータ） (2024-01-26T09:23:27Z)
MambaByte: Token-free Selective State Space Model [71.90159903595514]
マンババイト(英: MambaByte)は、マンバSSMがバイト配列で自己回帰的に訓練したトークンレス適応である。 MambaByteは、言語モデリングタスクにおいて、最先端のサブワードトランスフォーマーよりも優れています。
論文参考訳（メタデータ） (2024-01-24T18:53:53Z)
Augmenting Greybox Fuzzing with Generative AI [0.0]
生成AIによって強化されたグレーボックスファジィであるChatFuzzを提案する。生成LDMモデルのパワーを収穫するためのベストプラクティスを探るため、広範囲にわたる実験を行った。実験の結果,SOTAグレーボックスファザよりも12.77%のエッジカバレッジが向上した。
論文参考訳（メタデータ） (2023-06-11T21:44:47Z)
Diffsound: Discrete Diffusion Model for Text-to-sound Generation [78.4128796899781]
本稿では,テキストエンコーダ,ベクトル量子化変分自動符号化(VQ-VAE),デコーダ,ボコーダからなる新しいテキスト音声生成フレームワークを提案する。フレームワークは、まず、デコーダを使用して、テキストエンコーダから抽出したテキスト特徴をVQ-VAEの助けを借りてメルスペクトルに転送し、次いで、ボコーダを使用して生成されたメルスペクトルを波形に変換する。
論文参考訳（メタデータ） (2022-07-20T15:41:47Z)
Toward the Detection of Polyglot Files [2.7402733069180996]
複数のファイルフォーマットで有効なファイルを作成することで、標準化されたファイルフォーマットを悪用することができる。結果として生成されるポリグロット(多言語)ファイルは、ファイルフォーマットの識別を混乱させ、ファイルの要素が解析を回避できる。これは、特徴抽出のためにファイルフォーマットの識別に依存するマルウェア検出システムにおいて特に問題となる。
論文参考訳（メタデータ） (2022-03-14T23:48:22Z)
Leader: Prefixing a Length for Faster Word Vector Serialization [11.112281331309939]
事前訓練された単語の埋め込みを配布するために2つのファイル形式が使用される。 GloVeフォーマットはテキストベースのフォーマットで、ファイルサイズが大きく、読み込みが遅い。 word2vecフォーマットは、単語のテキスト表現とベクトル自体のバイナリ表現を混ぜた、より小さなバイナリフォーマットである。
論文参考訳（メタデータ） (2020-09-29T00:25:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。