論文の概要: Characterizing Real-World Bugs in Tile Programs for Automated Bug Detection
- arxiv url: http://arxiv.org/abs/2605.19652v1
- Date: Tue, 19 May 2026 10:42:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.284355
- Title: Characterizing Real-World Bugs in Tile Programs for Automated Bug Detection
- Title(参考訳): 自動バグ検出のためのタイルプログラムにおける実世界のバグの特徴付け
- Authors: Ravishka Rathnasuriya, Zihe Song, Nidhi Majoju, Aaryaa Moharir, Tingxi Li, Wei Yang, Tao Xie,
- Abstract要約: タイルベースのプログラミングフレームワークは、ディープラーニングや科学計算などの領域で高性能なGPUカーネルを書くために、ますます採用されている。
コンパイルパイプラインには、入力フォーム、データタイプ、バックエンドターゲットと密結合された、異なるコード生成バグが導入されている。
本稿では,タイルプログラムによるコード生成バグの最初の系統的研究について述べる。
- 参考スコア(独自算出の注目度): 12.913491087289117
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Tile-based programming frameworks are increasingly adopted to write high-performance GPU kernels in domains such as deep learning and scientific computing. While these frameworks enhance productivity and hardware utilization, their multi-stage compilation pipelines introduce distinct code generation bugs that are tightly coupled to input shapes, data types, and backend targets. These bugs often manifest as silent correctness or performance issues, making them difficult to detect using existing compiler testing tools. Additionally, the unique programming conventions of tile domain-specific languages complicate root cause identification, while fixing such bugs demands specialized knowledge of tile abstractions and compilation pipelines. Despite the growing adoption of tile-based systems, their code generation bugs remain largely unexplored. This paper presents the first systematic study of tile-program code generation bugs. We curate 401 bug reports from GitHub and identify 301 tile-program codegen bugs for analysis, categorizing the root causes, symptoms, input patterns, test oracles that trigger these bugs, and the strategies used to fix bugs. Our study provides foundational insights for building debugging, testing, and repair tools tailored to tile-based compiler infrastructures.
- Abstract(参考訳): タイルベースのプログラミングフレームワークは、ディープラーニングや科学計算などの領域で高性能なGPUカーネルを書くために、ますます採用されている。
これらのフレームワークは生産性とハードウェア利用を向上する一方で、多段階のコンパイルパイプラインでは、入力フォームやデータタイプ、バックエンドターゲットと密結合したコード生成バグが導入されている。
これらのバグは、しばしばサイレントな正当性やパフォーマンス上の問題として現れ、既存のコンパイラテストツールを使用することで検出が困難になる。
さらに、タイルドメイン固有の言語のユニークなプログラミング規約は、ルート原因の特定を複雑にし、そのようなバグを修正するには、タイルの抽象化とコンパイルパイプラインに関する専門知識が必要である。
タイルベースのシステムの普及にもかかわらず、コード生成のバグはほとんど未調査のままである。
本稿では,タイルプログラムによるコード生成バグの最初の系統的研究について述べる。
GitHubから401のバグレポートをキュレートし、分析のために301のタイルプログラムのコーダーバグを特定し、根本原因、症状、入力パターン、これらのバグをトリガーするテストオーラクル、バグの修正に使用される戦略を分類します。
私たちの研究は、タイルベースのコンパイラインフラに適したデバッグ、テスト、修復ツールを構築するための基礎的な洞察を提供する。
関連論文リスト
- Leveraging Data Characteristics for Bug Localization in Deep Learning Programs [21.563130049562357]
本稿では,Deep Learning (DL)プログラムにおける構造的バグの検出とローカライズを行うTheiaを提案する。
Theiaは40のバグギープログラムにおいて57/75のバグをローカライズすることに成功しているのに対し,NeuraLintは17/75のバグをローカライズする前に構造バグをローカライズできる最先端のアプローチである。
論文 参考訳(メタデータ) (2024-12-08T01:52:06Z) - VeriBug: An Attention-based Framework for Bug-Localization in Hardware
Designs [2.807347337531008]
近年,様々な用途を対象としたSystem-on-Chip設計の規模と複雑さが指数関数的に増大している。
これらのシステムにおける未検出バグのコストは、従来のプロセッサシステムよりもはるかに高い。
本稿では,近年のディープラーニングの進歩を活用してレジスタ・トランスファーレベルのデバッグを高速化するVeriBugを提案し,根本原因の可能性のある説明を生成する。
論文 参考訳(メタデータ) (2024-01-17T01:33:37Z) - DebugBench: Evaluating Debugging Capability of Large Language Models [80.73121177868357]
DebugBench - LLM(Large Language Models)のベンチマーク。
C++、Java、Pythonの4つの主要なバグカテゴリと18のマイナータイプをカバーする。
ゼロショットシナリオで2つの商用および4つのオープンソースモデルを評価する。
論文 参考訳(メタデータ) (2024-01-09T15:46:38Z) - Challenging Bug Prediction and Repair Models with Synthetic Bugs [7.285779914390472]
BugFarmは任意のコードを複数の複雑なバグに変換する。
BUGFARMが生成した1.9万以上の変異株から435k以上のバグを総合的に評価する。
論文 参考訳(メタデータ) (2023-10-03T20:01:51Z) - Using Developer Discussions to Guide Fixing Bugs in Software [51.00904399653609]
我々は,タスク実行前に利用可能であり,また自然発生しているバグレポートの議論を,開発者による追加情報の必要性を回避して利用することを提案する。
このような議論から派生したさまざまな自然言語コンテキストがバグ修正に役立ち、オラクルのバグ修正コミットに対応するコミットメッセージの使用よりもパフォーマンスの向上につながることを実証する。
論文 参考訳(メタデータ) (2022-11-11T16:37:33Z) - BigIssue: A Realistic Bug Localization Benchmark [89.8240118116093]
BigIssueは、現実的なバグローカライゼーションのためのベンチマークである。
実際のJavaバグと合成Javaバグの多様性を備えた一般的なベンチマークを提供する。
われわれは,バグローカライゼーションの最先端技術として,APRの性能向上と,現代の開発サイクルへの適用性の向上を期待している。
論文 参考訳(メタデータ) (2022-07-21T20:17:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。