論文の概要: Fuzzing MLIR Compilers with Custom Mutation Synthesis
- arxiv url: http://arxiv.org/abs/2404.16947v2
- Date: Tue, 27 Aug 2024 16:08:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-28 19:19:38.435215
- Title: Fuzzing MLIR Compilers with Custom Mutation Synthesis
- Title(参考訳): カスタムミューテーション合成によるファジングMLIRコンパイラ
- Authors: Ben Limpanukorn, Jiyuan Wang, Hong Jin Kang, Eric Zitong Zhou, Miryung Kim,
- Abstract要約: 我々は、文法に基づくファジィとカスタム合成突然変異を組み合わせたSynTHFUZZと呼ばれる新しいテストジェネレータを開発した。
各方言のカスタム突然変異演算子を手動で定義する必要がなくなる。
評価の結果,SynTHFUZはMLIRの方言対のカバレッジを1.75倍に改善し,ブランチのカバレッジを1.22倍に向上させることがわかった。
- 参考スコア(独自算出の注目度): 6.617861009996863
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Compiler technologies in deep learning and domain-specific hardware acceleration are increasingly adopting extensible compiler frameworks such as Multi-Level Intermediate Representation (MLIR) to facilitate more efficient development. With MLIR, compiler developers can easily define their own custom IRs in the form of MLIR dialects. However, the diversity and rapid evolution of such custom IRs make it impractical to manually write a custom test generator for each dialect. To address this problem, we design a new test generator called SYNTHFUZZ that combines grammar-based fuzzing with custom mutation synthesis. The key essence of SYNTHFUZZ is two fold: (1) It automatically infers parameterized context-dependent custom mutations from existing test cases. (2) It then concretizes the mutation's content depending on the target context and reduces the chance of inserting invalid edits by performing k-ancestor and pre(post)fix matching. SYNTHFUZZ obviates the need to manually define custom mutation operators for each dialect. We compare SYNTHFUZZ to three baselines: Grammarinator, MLIRSmith, and NeuRI. We conduct this comprehensive comparison on four different MLIR projects. Each project defines a new set of MLIR dialects where manually writing a custom test generator would take weeks of effort. Our evaluation shows that SYNTHFUZZ on average improves MLIR dialect pair coverage by 1.75 times, which increases branch coverage by 1.22 times. Further, we show that our context dependent custom mutation increases the proportion of valid tests by up to 1.11 times, indicating that SYNTHFUZZ correctly concretizes its parameterized mutations with respect to the target context. Parameterization of the mutations reduces the fraction of tests violating the base MLIR constraints by 0.57 times, increasing the time spent fuzzing dialect-specific code.
- Abstract(参考訳): ディープラーニングとドメイン固有のハードウェアアクセラレーションにおけるコンパイラ技術は、より効率的な開発を容易にするために、MLIR(Multi-Level Intermediate Representation)のような拡張可能なコンパイラフレームワークの採用が増えている。
MLIRを使用すると、コンパイラ開発者は独自のカスタムIRをMLIR方言として簡単に定義できる。
しかし、そのようなカスタムIRの多様性と急速な進化により、各方言のカスタムテストジェネレータを手作業で書くことは不可能である。
この問題に対処するために,文法ベースのファジィとカスタム突然変異合成を組み合わせたSynTHFUZZと呼ばれる新しいテストジェネレータを設計する。
SynTHFUZZの重要な内容は2つある: 1) パラメータ化されたコンテキスト依存のカスタム突然変異を既存のテストケースから自動的に推論する。
2)k-ancestorおよびpre(post)fix matchingを実行することで、ターゲットコンテキストに応じて変異の内容が増加し、無効な編集を挿入する可能性を低減する。
SynTHFUZZは、各方言のカスタム突然変異演算子を手動で定義する必要がない。
我々はSynTHFUZをGrammarinator, MLIRSmith, NeuRIの3つのベースラインと比較する。
4つの異なるMLIRプロジェクトについて包括的な比較を行う。
各プロジェクトはMLIR方言の新たなセットを定義しており、手動でカスタムテストジェネレータを書くのに数週間かかる。
評価の結果,SynTHFUZはMLIRの方言対のカバレッジを1.75倍改善し,ブランチのカバレッジを1.22倍向上させることがわかった。
さらに、我々の文脈依存的なカスタム突然変異は有効検査の割合を最大1.11倍に増加させ、SynTHFUZはターゲットの文脈に関してパラメータ化された突然変異を正しく増加させることを示す。
突然変異のパラメータ化は、基本MLIRの制約に違反するテストの比率を0.57倍に減らし、方言固有のコードに時間を費やす。
関連論文リスト
- Evaluating Semantic Variation in Text-to-Image Synthesis: A Causal Perspective [50.261681681643076]
本稿では,SemVarEffectとSemVarBenchというベンチマークを用いて,テキスト・画像合成における入力のセマンティックな変化と出力の因果性を評価する。
本研究は,T2I合成コミュニティによるヒューマンインストラクション理解の探索を促進する効果的な評価枠組みを確立する。
論文 参考訳(メタデータ) (2024-10-14T08:45:35Z) - Localizing Factual Inconsistencies in Attributable Text Generation [91.981439746404]
本稿では,帰属可能なテキスト生成における事実の不整合をローカライズするための新しい形式であるQASemConsistencyを紹介する。
まず,人間のアノテーションに対するQASemConsistency法の有効性を示す。
そこで我々は,局所的な事実の不整合を自動的に検出するいくつかの手法を実装した。
論文 参考訳(メタデータ) (2024-10-09T22:53:48Z) - Training Language Models on Synthetic Edit Sequences Improves Code Synthesis [33.13471417703669]
大規模言語モデル(LLM)は、プログラムを単一のパスで自動ソースで合成する。
我々はLintSeqと呼ばれる合成データ生成アルゴリズムを開発し、高品質なコード編集データを生成する。
編集シーケンスを微調整したモデルがベースライン合成よりも多様なプログラムを生成することを示す。
論文 参考訳(メタデータ) (2024-10-03T17:57:22Z) - Fix the Tests: Augmenting LLMs to Repair Test Cases with Static Collector and Neural Reranker [9.428021853841296]
本稿では, TROCtxsの精密かつ高精度な構築により, 旧来の検査ケースを自動的に修復する新しい手法であるSynTERを提案する。
構築されたTROCtxの増強により、幻覚は57.1%減少する。
論文 参考訳(メタデータ) (2024-07-04T04:24:43Z) - Nearest Neighbor Speculative Decoding for LLM Generation and Attribution [87.3259169631789]
Nearest Speculative Decoding (NEST)は、任意の長さの実世界のテキストスパンをLM世代に組み込むことができ、それらのソースへの属性を提供する。
NESTは、様々な知識集約タスクにおいて、基本LMの生成品質と帰属率を大幅に向上させる。
さらに、NESTは、Llama-2-Chat 70Bに適用した場合の推論時間において1.8倍のスピードアップを達成することにより、生成速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-05-29T17:55:03Z) - SynthesizRR: Generating Diverse Datasets with Retrieval Augmentation [55.2480439325792]
トピック分類,感情分析,トーン検出,ユーモアの6つのデータセットの合成について検討した。
その結果,SynthesizRRは語彙や意味の多様性,人文との類似性,蒸留性能を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2024-05-16T12:22:41Z) - LLMorpheus: Mutation Testing using Large Language Models [7.312170216336085]
本稿では,ソースコードに挿入されたプレースホルダーを置き換えることで,LLM(Large Language Model)に変異を提案する手法を提案する。
LLMorpheusは、最先端の突然変異検査ツールであるStrykerJSでは生成できない既存のバグに似た変異を生成できる。
論文 参考訳(メタデータ) (2024-04-15T17:25:14Z) - MRL Parsing Without Tears: The Case of Hebrew [14.104766026682384]
形態的にリッチな言語(MRL)では、トークンごとに複数の語彙単位を識別する必要があるが、既存のシステムはレイテンシとセットアップの複雑さに悩まされている。
決定は、専門家の分類器によって、各ユニットが1つの特定のタスクに特化して行われる。
この信じられないほど高速なアプローチは、HebrewのPOSタグ付けと依存性解析に新しいSOTAを設定し、他のHebrewタスクではほぼSOTAのパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-03-11T17:54:33Z) - Contrastive Instruction Tuning [61.97704869248903]
意味論的に等価な命令-インスタンスペア間の類似性を最大化するために、コントラスト命令チューニングを提案する。
PromptBenchベンチマークの実験によると、CoINはLLMの頑健さを一貫して改善し、文字、単語、文、意味のレベルを平均して2.5%の精度で変化させる。
論文 参考訳(メタデータ) (2024-02-17T00:09:32Z) - Paraformer: Fast and Accurate Parallel Transformer for
Non-autoregressive End-to-End Speech Recognition [62.83832841523525]
そこで我々はParaformerと呼ばれる高速かつ高精度な並列トランスを提案する。
出力トークンの数を正確に予測し、隠れた変数を抽出する。
10倍以上のスピードアップで、最先端のARトランスフォーマーに匹敵するパフォーマンスを実現することができる。
論文 参考訳(メタデータ) (2022-06-16T17:24:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。