論文の概要: Isolating Compiler Bugs through Compilation Steps Analysis
- arxiv url: http://arxiv.org/abs/2510.13128v1
- Date: Wed, 15 Oct 2025 03:58:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-16 20:13:28.489104
- Title: Isolating Compiler Bugs through Compilation Steps Analysis
- Title(参考訳): コンパイルステップ解析によるコンパイラバグの分離
- Authors: Yujie Liu, Mingxuan Zhu, Shengyu Cheng, Dan Hao,
- Abstract要約: CompSCANは、コンパイルステップのシーケンスを解析する新しいコンパイラバグ分離技術である。
実世界のLLVMおよびGCCバグ185件についてCompSCANを評価した。
ETEMとODFLと比較すると、CompSCANは44.51%/50.18%/36.24%/24.49%/ETEM、31.58%/49.12%/44.93%/21.78%の相対的な改善を実現している。
- 参考スコア(独自算出の注目度): 5.783745108952491
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Compilers are essential to software systems, and their bugs can propagate to dependent software. Ensuring compiler correctness is critical. However, isolating compiler bugs remains challenging due to the internal complexity of compiler execution. Existing techniques primarily mutate compilation inputs to generate passing and failing tests, but often lack causal analysis of internal steps, limiting their effectiveness. To address this limitation, we propose CompSCAN, a novel compiler bug isolation technique that applies analysis over the sequence of compilation steps. CompSCAN follows a three-stage process: (1) extracting the array of compilation steps that leads to the original failure, (2) identifying bug-causing steps and collecting corresponding compiler code elements, and (3) calculating suspicious scores for each code element and outputting a suspicious ranking list as the bug isolation result. We evaluate CompSCAN on 185 real-world LLVM and GCC bugs. Results show that CompSCAN outperforms state-of-the-art techniques in both effectiveness and efficiency. CompSCAN successfully isolates 50, 85, 100, and 123 bugs within the Top-1/3/5/10 ranks, respectively. Compared with ETEM and ODFL, two state-of-the-art compiler bug isolation techniques, CompSCAN achieves relative improvements of 44.51% / 50.18% / 36.24% / 24.49% over ETEM, and 31.58% / 49.12% / 44.93% / 21.78% over ODFL on those metrics. Moreover, CompSCAN runs faster on average per bug than both baselines.
- Abstract(参考訳): コンパイラはソフトウェアシステムに必須であり、そのバグは依存するソフトウェアに伝播する。
コンパイラの正確性を保証することが重要だ。
しかし、コンパイラ実行の内部的な複雑さのため、コンパイラのバグを分離することは依然として困難である。
既存のテクニックは、主にコンパイル入力を変更してパステストとフェールテストを生成するが、内部ステップの因果解析を欠くことが多く、その有効性を制限している。
この制限に対処するために,コンパイルステップのシーケンスに対して解析を適用する新しいコンパイラバグ分離手法であるCompSCANを提案する。
CompSCANは、(1)元の失敗につながるコンパイルステップの配列を抽出し、(2)バグ発生ステップを特定し、対応するコンパイラコード要素を収集し、(3)各コード要素の疑わしいスコアを計算し、疑わしいランキングリストをバグ分離結果として出力する。
実世界のLLVMおよびGCCバグ185件についてCompSCANを評価した。
その結果,CompSCANは最先端技術よりも有効性と効率性が高いことがわかった。
CompSCANは、トップ1/3/5/10ランキングで、それぞれ50、85、100、123のバグを分離した。
ETEMとODFLと比較して、CompSCANは44.51% / 50.18% / 36.24% / 24.49%でETEMを31.58% / 49.12% / 44.93% / 21.78%で改善している。
さらに、CompSCANは、両方のベースラインよりもバグ当たり平均で高速に実行される。
関連論文リスト
- Finding Compiler Bugs through Cross-Language Code Generator and Differential Testing [4.072167151876496]
CrossLangFuzzerは多種多様な型パラメータと複雑な継承構造を持つ言語横断のテストプログラムを生成する。
Kotlinコンパイラの10のバグ、Groovyコンパイラの4つのバグ、Scala 3コンパイラの7つのバグ、Scala 2コンパイラの2つのバグ、Javaコンパイラの1つのバグを発見した。
論文 参考訳(メタデータ) (2025-07-09T06:33:06Z) - Improving Compiler Bug Isolation by Leveraging Large Language Models [14.679589768900621]
本稿では,AutoCBIという新しいコンパイラバグ分離手法を提案する。
我々は、広く使われているGCCおよびLLVMコンパイラの120の現実世界バグに対して、最先端のアプローチ(DiWi、RecBi、FuseFL)に対してAutoCBIを評価した。
特に、GCC/LLVMの上位1位では、AutoCBIは66.67%/69.23%、300%/340%、100%/57.14%のバグをRecBi、DiWi、FuseFLより分離している。
論文 参考訳(メタデータ) (2025-06-21T09:09:30Z) - CompileAgent: Automated Real-World Repo-Level Compilation with Tool-Integrated LLM-based Agent System [52.048087777953064]
リポジトリレベルのコンパイル専用のエージェントフレームワークであるCompileAgentを提案する。
CompileAgentは5つのツールとフローベースのエージェント戦略を統合し、コンパイル命令検索とエラー解決のためのソフトウェアアーチファクトとのインタラクションを可能にする。
提案手法は,10%から71%の範囲で,コンパイル成功率を大幅に向上することを示す。
論文 参考訳(メタデータ) (2025-05-07T08:59:14Z) - EquiBench: Benchmarking Large Language Models' Reasoning about Program Semantics via Equivalence Checking [58.15568681219339]
大規模言語モデル(LLM)を評価するための新しいベンチマークであるEquiBenchを紹介する。
このタスクは、プログラムのセマンティクスについて推論するモデルの能力を直接テストする。
19の最先端LCMを評価し、最も難しいカテゴリでは、最高の精度は63.8%と76.2%であり、50%のランダムベースラインよりわずかに高い。
論文 参考訳(メタデータ) (2025-02-18T02:54:25Z) - Finding Missed Code Size Optimizations in Compilers using LLMs [1.90019787465083]
我々は,大規模言語モデルと一連の差分テスト戦略を組み合わせた新しいテスト手法を開発した。
当社のアプローチでは,実装に150行未満のコードが必要です。
現在までに、本番コンパイラの24のバグが報告されている。
論文 参考訳(メタデータ) (2024-12-31T21:47:46Z) - DebugBench: Evaluating Debugging Capability of Large Language Models [80.73121177868357]
DebugBench - LLM(Large Language Models)のベンチマーク。
C++、Java、Pythonの4つの主要なバグカテゴリと18のマイナータイプをカバーする。
ゼロショットシナリオで2つの商用および4つのオープンソースモデルを評価する。
論文 参考訳(メタデータ) (2024-01-09T15:46:38Z) - Isolating Compiler Bugs by Generating Effective Witness Programs with Large Language Models [10.660543763757518]
既存のコンパイラのバグ分離アプローチは、問題をテストプログラムの突然変異問題に変換する。
コンパイラのバグ分離のための効率的なテストプログラムを生成するために,LLM4CBIという新しい手法を提案する。
GCCとLLVMの120以上の実際のバグに対する最先端のアプローチと比較し,LLM4CBIの利点を実証した。
論文 参考訳(メタデータ) (2023-07-02T15:20:54Z) - HDCC: A Hyperdimensional Computing compiler for classification on
embedded systems and high-performance computing [58.720142291102135]
この研究は、HDC分類メソッドの高レベルな記述を最適化されたCコードに変換する最初のオープンソースコンパイラである、ネームコンパイラを紹介している。
nameは現代のコンパイラのように設計されており、直感的で記述的な入力言語、中間表現(IR)、再ターゲット可能なバックエンドを備えている。
これらの主張を裏付けるために,HDC文献で最もよく使われているデータセットについて,HDCCを用いて実験を行った。
論文 参考訳(メタデータ) (2023-04-24T19:16:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。