論文の概要: TENSURE: Fuzzing Sparse Tensor Compilers (Registered Report)
- arxiv url: http://arxiv.org/abs/2603.18372v1
- Date: Thu, 19 Mar 2026 00:13:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-20 17:19:05.888798
- Title: TENSURE: Fuzzing Sparse Tensor Compilers (Registered Report)
- Title(参考訳): TENSURE:スパーステンソルコンパイラのファジリング(登録記事)
- Authors: Kabilan Mahathevan, Yining Zhang, Muhammad Ali Gulzar, Kirshanthan Sundararajah,
- Abstract要約: 我々は,スパースコンパイラのテストに特化して設計された,最初のブラックボックスファジィフレームワークであるTENSUREを紹介する。
合成されたカーネルの100%の意味論的妥当性を保証する制約ベースの新しい生成アルゴリズムを提案する。
TACOとFinchの2つの最先端システムに対する評価では、特にTACOでは、TENSUREがクラッシュや無音の誤コンパイルを露呈している。
- 参考スコア(独自算出の注目度): 9.083996936429465
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sparse Tensor Compilers (STCs) have emerged as critical infrastructure for optimizing high-dimensional data analytics and machine learning workloads. The STCs must synthesize complex, irregular control flow for various compressed storage formats directly from high-level declarative specifications, thereby making them highly susceptible to subtle correctness defects. Existing testing frameworks, which rely on mutating computation graphs restricted to a standard vocabulary of operators, fail to exercise the arbitrary loop synthesis capabilities of these compilers. Furthermore, generic grammar-based fuzzers struggle to generate valid inputs due to the strict rules governing how indices are reused across multiple tensors. In this paper, we present TENSURE, the first extensible black-box fuzzing framework specifically designed for the testing of STCs. TENSURE leverages Einstein Summation (Einsum) notation as a general input abstraction, enabling the generation of complex, unconventional tensor contractions that expose corner cases in the code-generation phases of STCs. We propose a novel constraint-based generation algorithm that guarantees 100% semantic validity of synthesized kernels, significantly outperforming the ~3.3% validity rate of baseline grammar fuzzers. To enable metamorphic testing without a trusted reference, we introduce a set of semantic-preserving mutation operators that exploit algebraic commutativity and heterogeneity in storage formats. Our evaluation on two state-of-the-art systems, TACO and Finch, reveals widespread fragility, particularly in TACO, where TENSURE exposed crashes or silent miscompilations in a majority of generated test cases. These findings underscore the critical need for specialized testing tools in the sparse compilation ecosystem.
- Abstract(参考訳): スパーステンソルコンパイラ(STC)は、高次元データ分析と機械学習ワークロードを最適化するための重要なインフラストラクチャとして登場した。
STCは、様々な圧縮ストレージフォーマットの複雑な不規則な制御フローを、高レベルの宣言的仕様から直接合成する必要がある。
演算子の標準的な語彙に制限された計算グラフの変更に依存する既存のテストフレームワークは、これらのコンパイラの任意のループ合成機能を実行することができない。
さらに、汎用文法ベースのファジィは、複数のテンソル間でインデックスの再利用方法を決定する厳格な規則のために、有効な入力を生成するのに苦労する。
本稿では,STCのテストに特化して設計された,最初の拡張可能なブラックボックスファジィフレームワークであるTENSUREについて述べる。
TENSUREはEinstein Summation(Einsum)表記を一般的な入力抽象化として利用し、STCのコード生成フェーズにおけるコーナーケースを公開する複雑なテンソル収縮の生成を可能にする。
本稿では,合成されたカーネルの100%の意味論的妥当性を保証し,ベースライン文法ファジィの約3.3%の妥当性を著しく向上させる制約ベース生成アルゴリズムを提案する。
信頼された参照なしにメタモルフィックテストを可能にするため、記憶形式における代数的可換性と不均一性を利用する意味保存型突然変異演算子のセットを導入する。
TACOとFinchの2つの最先端システムに対する評価では、特にTACOでは、TENSUREが発生したテストケースの大多数でクラッシュや無音の誤コンパイルを露呈している。
これらの調査結果は、スパースコンパイルエコシステムにおける特殊なテストツールの必要性を浮き彫りにしている。
関連論文リスト
- Accelerate Speculative Decoding with Sparse Computation in Verification [49.74839681322316]
投機的復号化は、複数のドラフトトークンを並列に検証することにより、自動回帰言語モデル推論を加速する。
既存のスペーシフィケーション方式は主にトークン・バイ・トーケンの自己回帰復号化のために設計されている。
そこで本研究では,注目度,FFN,MoEを両立させるスパース検証フレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-26T07:53:41Z) - zkStruDul: Programming zkSNARKs with Structural Duality [0.2449909275410287]
zkStruDulは、入力変換を統一し、定義を単一の複合抽象化に述語する言語である。
我々は、ソースレベルのセマンティクスを提供し、その振る舞いが予測されたセマンティクスと同一であることを証明する。
論文 参考訳(メタデータ) (2025-11-13T18:06:21Z) - High-Performance Generation of Constrained Inputs [4.837737516460689]
言語ベースのテストは、文脈のない文法定義と意味制約を組み合わせてテスト入力を生成する。
進化的言語に基づく新しい手法を提案し,現状よりも3~4桁の性能向上を図っている。
本稿では,FANDANGO-RSが1分間に401の多様で複雑で有効なテスト入力を生成できるCサブセットのケーススタディにより,これを実証する。
論文 参考訳(メタデータ) (2025-11-08T12:26:55Z) - SIM-CoT: Supervised Implicit Chain-of-Thought [108.30049193668083]
Implicit Chain-of-Thought(CoT)メソッドは、大規模言語モデルにおける明示的なCoT推論に代わるトークン効率の代替手段を提供する。
暗黙的なCoTの計算予算をスケールする際の中核的な不安定性問題を特定する。
そこで我々はSIM-CoTを提案する。SIM-CoTは,遅延推論空間を安定化・拡張するためのステップレベルの監視を実現するモジュールである。
論文 参考訳(メタデータ) (2025-09-24T17:01:32Z) - Fuzzing MLIR Compilers with Custom Mutation Synthesis [6.617861009996863]
我々は、文法に基づくファジィとカスタム合成突然変異を組み合わせたSynTHFUZZと呼ばれる新しいテストジェネレータを開発した。
各方言のカスタム突然変異演算子を手動で定義する必要がなくなる。
評価の結果,SynTHFUZはMLIRの方言対のカバレッジを1.75倍に改善し,ブランチのカバレッジを1.22倍に向上させることがわかった。
論文 参考訳(メタデータ) (2024-04-25T18:00:37Z) - Factorizers for Distributed Sparse Block Codes [45.29870215671697]
分散ブロック符号(SBC)を高速かつ高精度に分解する手法を提案する。
我々の反復分解器は、しきい値に基づく非線形活性化、条件付きランダムサンプリング、および $ell_infty$-based similarity metricを導入している。
CIFAR-100, ImageNet-1K, RAVENデータセット上での4つの深層CNNアーキテクチャの実現可能性を示す。
論文 参考訳(メタデータ) (2023-03-24T12:31:48Z) - Mutual Exclusivity Training and Primitive Augmentation to Induce
Compositionality [84.94877848357896]
最近のデータセットは、標準的なシーケンス・ツー・シーケンスモデルにおける体系的な一般化能力の欠如を露呈している。
本稿では,セq2seqモデルの振る舞いを分析し,相互排他バイアスの欠如と全例を記憶する傾向の2つの要因を同定する。
広範に使用されている2つの構成性データセット上で、標準的なシーケンス・ツー・シーケンスモデルを用いて、経験的改善を示す。
論文 参考訳(メタデータ) (2022-11-28T17:36:41Z) - Composed Fine-Tuning: Freezing Pre-Trained Denoising Autoencoders for
Improved Generalization [93.95299500688286]
本稿では,出力の妥当性制約を考慮した構造化出力の予測問題に焦点をあてる。
本稿では,事前学習したデノイザを組み込んだ予測器を微調整するファインチューニングを提案する。
2層ReLUネットワークの場合、構成した微調整が予測器の複雑さを著しく低減することを示す。
論文 参考訳(メタデータ) (2020-06-29T17:14:35Z) - Syntactic Data Augmentation Increases Robustness to Inference Heuristics [27.513414694720716]
BERTのような事前訓練されたニューラルネットワークモデルは、標準データセットに対して高い精度を示すが、制御されたチャレンジセットに対する単語順序に対する感度の驚くべき欠如がある。
我々は,MNLIコーパスからの文に構文変換を適用して生成した構文的情報的例を用いて,標準学習セットを増強するいくつかの手法について検討する。
MNLIテストセットの性能に影響を与えることなく、単語の順序に対する感度を0.28から0.73に診断する制御例におけるBERTの精度を改善した。
論文 参考訳(メタデータ) (2020-04-24T21:35:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。