論文の概要: Bootstrapping Fuzzers for Compilers of Low-Resource Language Dialects Using Language Models
- arxiv url: http://arxiv.org/abs/2512.05887v1
- Date: Fri, 05 Dec 2025 17:00:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-13 22:40:57.11233
- Title: Bootstrapping Fuzzers for Compilers of Low-Resource Language Dialects Using Language Models
- Title(参考訳): 言語モデルを用いた低リソース言語辞書のコンパイラのためのブートストラップファザ
- Authors: Sairam Vaidya, Marcel Böhme, Loris D'Antoni,
- Abstract要約: 本稿では,コンパイラに対して,方言に依存しない,方言に有効な文法に基づく,カバレッジに配慮したファジィ手法を提案する。
私たちはこのアプローチをツールであるGerminatorに組み入れました。
91の方言にまたがる6つのMLIRプロジェクトにおいて、Germinatorが生成した種子は文法ベースのベースラインよりも10-120%向上した。
- 参考スコア(独自算出の注目度): 13.843101157271034
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern extensible compiler frameworks-such as MLIR-enable rapid creation of domain-specific language dialects. This flexibility, however, makes correctness harder to ensure as the same extensibility that accelerates development also complicates maintaining the testing infrastructure. Extensible languages require automated test generation that is both dialect-agnostic (works across dialects without manual adaptation) and dialect-effective (targets dialect-specific features to find bugs). Existing approaches typically sacrifice one of these goals by either requiring manually constructed seed corpora for each dialect, or by failing to be effective. We present a dialect-agnostic and dialect-effective grammar-based and coverage-guided fuzzing approach for extensible compilers that combines two key insights from existing work: (i) the grammars of dialects, which already encode the structural and type constraints, can often be extracted automatically from the dialect specification; and (ii) these grammars can be used in combination with pre-trained large language models to automatically generate representative and diverse seed inputs from the full dialect space without requiring any manual input or training data. These seeds can then be used to bootstrap coverage-guided fuzzers. We built this approach into a tool, Germinator. When evaluated on six MLIR projects spanning 91 dialects, Germinator generated seeds improve line coverage by 10-120% over grammar-based baselines. We compare against grammar-based baselines because they are the only class of existing automatic seed generators that can be applied uniformly across MLIR's heterogeneous dialect ecosystem. Germinator discovers 88 previously unknown bugs (40 confirmed), including 23 in dialects with no prior automated test generators, demonstrating effective and controllable testing of low-resource dialects at scale.
- Abstract(参考訳): MLIRのような近代的な拡張可能なコンパイラフレームワークは、ドメイン固有の言語方言を迅速に作成できる。
しかし、この柔軟性は、開発を加速するのと同じ拡張性でテストインフラストラクチャのメンテナンスが複雑になるように、修正を困難にします。
拡張可能な言語は、方言に依存しない自動テスト生成(手動適応なしの方言をまたいだ作業)と方言に有効な(バグを見つけるために方言固有の特徴を目標とする)の両方を必要とする。
既存のアプローチは、通常、これらの目標の1つを、それぞれの方言のために手動で構築されたシードコーパスを必要とするか、効果的でないかによって犠牲にする。
既存の研究から得られた2つの重要な知見を組み合わせた拡張可能なコンパイラに対して、方言に依存しない、方言に有効な文法ベースおよびカバレッジ誘導ファジィアプローチを提案する。
i) すでに構造的制約及び型制約を符号化している方言の文法は、しばしば方言仕様から自動的に抽出することができる。
(II)これらの文法は、事前訓練された大規模言語モデルと組み合わせて、手動入力や訓練データを必要とすることなく、完全な方言空間から代表的および多種多様なシード入力を自動的に生成することができる。
これらの種子は、カバーカバー付きファズナーのブートストラップに使用することができる。
私たちはこのアプローチをツールであるGerminatorに組み入れました。
91の方言にまたがる6つのMLIRプロジェクトにおいて、Germinatorが生成した種子は文法ベースのベースラインよりも10-120%向上した。
MLIRのヘテロジニアス方言のエコシステムで一様に適用できる既存の自動シードジェネレータのクラスであるため,文法ベースのベースラインと比較する。
Germinatorは、以前の自動テストジェネレータを持たない方言で23つを含む88の既知のバグ(40が確認された)を発見した。
関連論文リスト
- A two-stage transliteration approach to improve performance of a multilingual ASR [1.9511556030544333]
本稿では,言語に依存しないエンドツーエンドモデルを構築するためのアプローチを提案する。
我々は2つのIndic言語に対するエンドツーエンドの多言語音声認識システムを用いて実験を行った。
論文 参考訳(メタデータ) (2024-10-09T05:30:33Z) - Soft Language Clustering for Multilingual Model Pre-training [57.18058739931463]
本稿では,インスタンスを条件付きで符号化するためのフレキシブルガイダンスとして,コンテキスト的にプロンプトを検索するXLM-Pを提案する。
我々のXLM-Pは、(1)言語間における言語不変および言語固有知識の軽量なモデリングを可能にし、(2)他の多言語事前学習手法との容易な統合を可能にする。
論文 参考訳(メタデータ) (2023-06-13T08:08:08Z) - Multi-VALUE: A Framework for Cross-Dialectal English NLP [49.55176102659081]
マルチディレクト (Multi-Dilect) は、50の英語方言にまたがる制御可能なルールベースの翻訳システムである。
ストレステストは、非標準方言の先行モデルに対する顕著な性能格差を示す。
私たちはチカノやインド英語のネイティブスピーカーと提携して、人気のあるCoQAタスクの新しいゴールドスタンダード版をリリースしています。
論文 参考訳(メタデータ) (2022-12-15T18:17:01Z) - BenchCLAMP: A Benchmark for Evaluating Language Models on Syntactic and
Semantic Parsing [55.058258437125524]
本稿では,制約付きLanguage Model Parsingを評価するベンチマークであるBenchCLAMPを紹介する。
APIを通じてのみ利用可能な2つのGPT-3変種を含む8つの言語モデルをベンチマークする。
実験により,エンコーダ-デコーダ事前学習言語モデルでは,モデル出力が有効であると制約された場合に,構文解析や意味解析の最先端手法を超えることができることがわかった。
論文 参考訳(メタデータ) (2022-06-21T18:34:11Z) - Zero-Shot Cross-lingual Semantic Parsing [56.95036511882921]
7つのテスト言語に対する並列データを持たないゼロショット問題として,言語間セマンティックパーシングについて検討した。
英文論理形式ペアデータのみを用いて解析知識を付加言語に転送するマルチタスクエンコーダデコーダモデルを提案する。
このシステムは、ゼロショット解析を潜時空間アライメント問題としてフレーム化し、事前訓練されたモデルを改善し、最小のクロスリンガル転送ペナルティで論理形式を生成することができる。
論文 参考訳(メタデータ) (2021-04-15T16:08:43Z) - UNKs Everywhere: Adapting Multilingual Language Models to New Scripts [103.79021395138423]
マルチリンガルBERT(mBERT)やXLM-Rのような多言語言語モデルは、様々なNLPタスクに対して最先端の言語間転送性能を提供する。
キャパシティの制限と事前トレーニングデータの大きな差のため、リソース豊富な言語とリソースを対象とする言語には大きなパフォーマンスギャップがある。
本稿では,事前学習した多言語モデルの低リソース言語や未知のスクリプトへの高速かつ効果的な適応を可能にする新しいデータ効率手法を提案する。
論文 参考訳(メタデータ) (2020-12-31T11:37:28Z) - Learning to Recognize Dialect Features [21.277962038423123]
本稿では,方言の特徴検出の課題を紹介するとともに,2つのマルチタスク学習手法を提案する。
言語学者は通常、方言の特徴をどのように定義するかに基づいて、モデルを少数の最小のペアでトレーニングします。
論文 参考訳(メタデータ) (2020-10-23T23:25:00Z) - Automatic Extraction of Rules Governing Morphological Agreement [103.78033184221373]
原文から第一パス文法仕様を抽出する自動フレームワークを開発する。
我々は、世界の多くの言語の文法の中核にあるモルフォシンタクティックな現象である合意を記述する規則の抽出に焦点をあてる。
我々のフレームワークはUniversal Dependenciesプロジェクトに含まれるすべての言語に適用され、有望な結果が得られます。
論文 参考訳(メタデータ) (2020-10-02T18:31:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。