Fugu-MT 論文翻訳(概要): Fuzzing MLIR Compilers with Custom Mutation Synthesis

論文の概要: Fuzzing MLIR Compilers with Custom Mutation Synthesis

arxiv url: http://arxiv.org/abs/2404.16947v2
Date: Tue, 27 Aug 2024 16:08:52 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-28 19:19:38.435215
Title: Fuzzing MLIR Compilers with Custom Mutation Synthesis
Title（参考訳）: カスタムミューテーション合成によるファジングMLIRコンパイラ
Authors: Ben Limpanukorn, Jiyuan Wang, Hong Jin Kang, Eric Zitong Zhou, Miryung Kim,
Abstract要約: 我々は、文法に基づくファジィとカスタム合成突然変異を組み合わせたSynTHFUZZと呼ばれる新しいテストジェネレータを開発した。各方言のカスタム突然変異演算子を手動で定義する必要がなくなる。評価の結果,SynTHFUZはMLIRの方言対のカバレッジを1.75倍に改善し,ブランチのカバレッジを1.22倍に向上させることがわかった。
参考スコア（独自算出の注目度）: 6.617861009996863
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Compiler technologies in deep learning and domain-specific hardware acceleration are increasingly adopting extensible compiler frameworks such as Multi-Level Intermediate Representation (MLIR) to facilitate more efficient development. With MLIR, compiler developers can easily define their own custom IRs in the form of MLIR dialects. However, the diversity and rapid evolution of such custom IRs make it impractical to manually write a custom test generator for each dialect. To address this problem, we design a new test generator called SYNTHFUZZ that combines grammar-based fuzzing with custom mutation synthesis. The key essence of SYNTHFUZZ is two fold: (1) It automatically infers parameterized context-dependent custom mutations from existing test cases. (2) It then concretizes the mutation's content depending on the target context and reduces the chance of inserting invalid edits by performing k-ancestor and pre(post)fix matching. SYNTHFUZZ obviates the need to manually define custom mutation operators for each dialect. We compare SYNTHFUZZ to three baselines: Grammarinator, MLIRSmith, and NeuRI. We conduct this comprehensive comparison on four different MLIR projects. Each project defines a new set of MLIR dialects where manually writing a custom test generator would take weeks of effort. Our evaluation shows that SYNTHFUZZ on average improves MLIR dialect pair coverage by 1.75 times, which increases branch coverage by 1.22 times. Further, we show that our context dependent custom mutation increases the proportion of valid tests by up to 1.11 times, indicating that SYNTHFUZZ correctly concretizes its parameterized mutations with respect to the target context. Parameterization of the mutations reduces the fraction of tests violating the base MLIR constraints by 0.57 times, increasing the time spent fuzzing dialect-specific code.
Abstract（参考訳）: ディープラーニングとドメイン固有のハードウェアアクセラレーションにおけるコンパイラ技術は、より効率的な開発を容易にするために、MLIR(Multi-Level Intermediate Representation)のような拡張可能なコンパイラフレームワークの採用が増えている。 MLIRを使用すると、コンパイラ開発者は独自のカスタムIRをMLIR方言として簡単に定義できる。しかし、そのようなカスタムIRの多様性と急速な進化により、各方言のカスタムテストジェネレータを手作業で書くことは不可能である。この問題に対処するために,文法ベースのファジィとカスタム突然変異合成を組み合わせたSynTHFUZZと呼ばれる新しいテストジェネレータを設計する。 SynTHFUZZの重要な内容は2つある: 1) パラメータ化されたコンテキスト依存のカスタム突然変異を既存のテストケースから自動的に推論する。 2)k-ancestorおよびpre(post)fix matchingを実行することで、ターゲットコンテキストに応じて変異の内容が増加し、無効な編集を挿入する可能性を低減する。 SynTHFUZZは、各方言のカスタム突然変異演算子を手動で定義する必要がない。我々はSynTHFUZをGrammarinator, MLIRSmith, NeuRIの3つのベースラインと比較する。 4つの異なるMLIRプロジェクトについて包括的な比較を行う。各プロジェクトはMLIR方言の新たなセットを定義しており、手動でカスタムテストジェネレータを書くのに数週間かかる。評価の結果,SynTHFUZはMLIRの方言対のカバレッジを1.75倍改善し,ブランチのカバレッジを1.22倍向上させることがわかった。さらに、我々の文脈依存的なカスタム突然変異は有効検査の割合を最大1.11倍に増加させ、SynTHFUZはターゲットの文脈に関してパラメータ化された突然変異を正しく増加させることを示す。突然変異のパラメータ化は、基本MLIRの制約に違反するテストの比率を0.57倍に減らし、方言固有のコードに時間を費やす。

関連論文リスト

Words & Weights: Streamlining Multi-Turn Interactions via Co-Adaptation [55.938648534942665]
マルチターンインタラクション(T2PAM)に対するテスト時ポリシー適応は,大規模言語モデル(LLM)と動的ユーザニーズとの整合に不可欠である。本稿では,単語と重みの不均一な空間上での相互作用を協調最適化問題として再構成するフレームワークであるROSA2を提案する。
論文参考訳（メタデータ） (2026-03-02T02:16:20Z)
Targeted Testing of Compiler Optimizations via Grammar-Level Composition Styles [8.598686284546773]
既存のファズナーは、コンパイラの最適化を効果的にテストするのに苦労している。パイプラインベーステストの補完として,個別最適化のファジィ化を提案する。 LLVM と MLIR による評価の結果,TargetFuzz のカバレッジは8% と 11% 向上した。
論文参考訳（メタデータ） (2025-12-04T00:13:25Z)
Hybrid Fuzzing with LLM-Guided Input Mutation and Semantic Feedback [0.0]
本稿では,静的および動的解析をLarge Language Model(LLM)誘導入力変異と意味フィードバックと統合したハイブリッドファジリングフレームワークを提案する。本手法は,最先端のファジィよりも高速な時間対第一のバグ,意味的多様性の向上,およびユニークなバグの競合数を実現する。
論文参考訳（メタデータ） (2025-11-06T02:38:24Z)
Semantic-Aware Fuzzing: An Empirical Framework for LLM-Guided, Reasoning-Driven Input Mutation [0.5336076422485075]
インターネット・オブ・Thingsデバイス、モバイル・プラットフォーム、自律システムのセキュリティ上の脆弱性は依然として重要だ。従来の突然変異ベースのファジィザは、主に意味論的推論なしでバイトやビットレベルの編集を行う。本稿では,Google の FuzzBench 上で LLM を AFL++ に統合するオープンソースフレームワークを提案する。
論文参考訳（メタデータ） (2025-09-23T19:57:29Z)
Boosting Skeleton-Driven SMT Solver Fuzzing by Leveraging LLM to Produce Formula Generators [5.527936960933817]
満足度・モデュロ理論 (Satifiability Modulo Theory, SMT) は、現代のシステムやプログラミング言語の研究に基礎を置いている。以前のテストテクニックは、初期のソルババージョンではうまく機能していましたが、急速に進化する機能に追従するのに苦労しています。近年のLarge Language Models (LLM) に基づくアプローチは,高度な問題解決能力の探求において有望であることを示している。
論文参考訳（メタデータ） (2025-08-28T01:21:26Z)
Mut4All: Fuzzing Compilers via LLM-Synthesized Mutators Learned from Bug Reports [35.036499451862355]
突然変異ベースのファジィは、コンパイラのバグを発見するのに有効だが、現代言語のための高品質なミュータを設計することは依然として困難である。 Mut4Allは,大規模言語モデル(LLM)を用いてミュータを合成し,バグレポートからコンパイラ固有の知識を抽出する,完全に自動化された言語に依存しないフレームワークである。
論文参考訳（メタデータ） (2025-07-25T13:54:42Z)
FLEXITOKENS: Flexible Tokenization for Evolving Language Models [3.2749495104311874]
言語モデル(LM)は、単純な微調整によって新しいデータ分布に適応することが困難である。これは、そのサブワードトークンーザの剛性のためであり、通常は適応中に変化しない。我々は、トークン化を適応させるために、学習可能なトークン化器を備えたバイトレベルのLMを開発する。
論文参考訳（メタデータ） (2025-07-17T01:55:41Z)
LLAMA: Multi-Feedback Smart Contract Fuzzing Framework with LLM-Guided Seed Generation [56.84049855266145]
進化的突然変異戦略とハイブリッドテスト技術を統合したマルチフィードバックスマートコントラクトファジリングフレームワーク(LLAMA)を提案する。 LLAMAは、91%の命令カバレッジと90%のブランチカバレッジを達成すると同時に、148の既知の脆弱性のうち132が検出される。これらの結果は、現実のスマートコントラクトセキュリティテストシナリオにおけるLAMAの有効性、適応性、実用性を強調している。
論文参考訳（メタデータ） (2025-07-16T09:46:58Z)
Evaluating Sparse Autoencoders: From Shallow Design to Matching Pursuit [16.996218963146788]
スパースオートエンコーダ(SAE)は近年,解釈可能性の中心的なツールとなっている。本稿では,MNISTを用いた制御環境でのSAEの評価を行う。我々は、MP-SAE(Matching Pursuit)をアンロールすることで、マルチイテレーションSAEを導入する。
論文参考訳（メタデータ） (2025-06-05T16:57:58Z)
Evaluating Semantic Variation in Text-to-Image Synthesis: A Causal Perspective [50.261681681643076]
本稿では,SemVarEffectとSemVarBenchというベンチマークを用いて,テキスト・画像合成における入力のセマンティックな変化と出力の因果性を評価する。本研究は,T2I合成コミュニティによるヒューマンインストラクション理解の探索を促進する効果的な評価枠組みを確立する。
論文参考訳（メタデータ） (2024-10-14T08:45:35Z)
Localizing Factual Inconsistencies in Attributable Text Generation [91.981439746404]
本稿では,帰属可能なテキスト生成における事実の不整合をローカライズするための新しい形式であるQASemConsistencyを紹介する。まず,人間のアノテーションに対するQASemConsistency法の有効性を示す。そこで我々は,局所的な事実の不整合を自動的に検出するいくつかの手法を実装した。
論文参考訳（メタデータ） (2024-10-09T22:53:48Z)
Training Language Models on Synthetic Edit Sequences Improves Code Synthesis [33.13471417703669]
大規模言語モデル(LLM)は、プログラムを単一のパスで自動ソースで合成する。我々はLintSeqと呼ばれる合成データ生成アルゴリズムを開発し、高品質なコード編集データを生成する。編集シーケンスを微調整したモデルがベースライン合成よりも多様なプログラムを生成することを示す。
論文参考訳（メタデータ） (2024-10-03T17:57:22Z)
Fix the Tests: Augmenting LLMs to Repair Test Cases with Static Collector and Neural Reranker [9.428021853841296]
本稿では, TROCtxsの精密かつ高精度な構築により, 旧来の検査ケースを自動的に修復する新しい手法であるSynTERを提案する。構築されたTROCtxの増強により、幻覚は57.1%減少する。
論文参考訳（メタデータ） (2024-07-04T04:24:43Z)
Nearest Neighbor Speculative Decoding for LLM Generation and Attribution [87.3259169631789]
Nearest Speculative Decoding (NEST)は、任意の長さの実世界のテキストスパンをLM世代に組み込むことができ、それらのソースへの属性を提供する。 NESTは、様々な知識集約タスクにおいて、基本LMの生成品質と帰属率を大幅に向上させる。さらに、NESTは、Llama-2-Chat 70Bに適用した場合の推論時間において1.8倍のスピードアップを達成することにより、生成速度を大幅に改善する。
論文参考訳（メタデータ） (2024-05-29T17:55:03Z)
SynthesizRR: Generating Diverse Datasets with Retrieval Augmentation [55.2480439325792]
トピック分類,感情分析,トーン検出,ユーモアの6つのデータセットの合成について検討した。その結果,SynthesizRRは語彙や意味の多様性,人文との類似性,蒸留性能を大幅に向上させることがわかった。
論文参考訳（メタデータ） (2024-05-16T12:22:41Z)
LLMorpheus: Mutation Testing using Large Language Models [7.312170216336085]
本稿では,ソースコードに挿入されたプレースホルダーを置き換えることで,LLM(Large Language Model)に変異を提案する手法を提案する。 LLMorpheusは、最先端の突然変異検査ツールであるStrykerJSでは生成できない既存のバグに似た変異を生成できる。
論文参考訳（メタデータ） (2024-04-15T17:25:14Z)
MRL Parsing Without Tears: The Case of Hebrew [14.104766026682384]
形態的にリッチな言語(MRL)では、トークンごとに複数の語彙単位を識別する必要があるが、既存のシステムはレイテンシとセットアップの複雑さに悩まされている。決定は、専門家の分類器によって、各ユニットが1つの特定のタスクに特化して行われる。この信じられないほど高速なアプローチは、HebrewのPOSタグ付けと依存性解析に新しいSOTAを設定し、他のHebrewタスクではほぼSOTAのパフォーマンスを実現している。
論文参考訳（メタデータ） (2024-03-11T17:54:33Z)
A Novel Refactoring and Semantic Aware Abstract Syntax Tree Differencing Tool and a Benchmark for Evaluating the Accuracy of Diff Tools [2.0625936401496237]
Syntax Tree (AST) diffツールは、ほとんどの開発者が使っている行ベースのdiffツールの制限を克服するために開発された。上記の制限をすべて解決するRefactoringMinerに基づく新しいAST diffツールを提案する。当社のツールは,特にコミットにおいて,非互換性ツールに匹敵する実行時間で,大幅な精度の向上とリコールを実現しています。
論文参考訳（メタデータ） (2024-03-09T15:32:41Z)
Contrastive Instruction Tuning [61.97704869248903]
意味論的に等価な命令-インスタンスペア間の類似性を最大化するために、コントラスト命令チューニングを提案する。 PromptBenchベンチマークの実験によると、CoINはLLMの頑健さを一貫して改善し、文字、単語、文、意味のレベルを平均して2.5%の精度で変化させる。
論文参考訳（メタデータ） (2024-02-17T00:09:32Z)
Paraformer: Fast and Accurate Parallel Transformer for Non-autoregressive End-to-End Speech Recognition [62.83832841523525]
そこで我々はParaformerと呼ばれる高速かつ高精度な並列トランスを提案する。出力トークンの数を正確に予測し、隠れた変数を抽出する。 10倍以上のスピードアップで、最先端のARトランスフォーマーに匹敵するパフォーマンスを実現することができる。
論文参考訳（メタデータ） (2022-06-16T17:24:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。