Fugu-MT 論文翻訳(概要): Using a Sledgehammer to Crack a Nut? Revisiting Automated Compiler Fault Isolation

論文の概要: Using a Sledgehammer to Crack a Nut? Revisiting Automated Compiler Fault Isolation

arxiv url: http://arxiv.org/abs/2512.16335v1
Date: Thu, 18 Dec 2025 09:22:57 GMT
ステータス: 翻訳完了
システム内更新日: 2025-12-19 18:10:31.998605
Title: Using a Sledgehammer to Crack a Nut? Revisiting Automated Compiler Fault Isolation
Title（参考訳）: Sledgehammerを使ってNutをクラックする? 自動コンパイラ故障分離を再考
Authors: Yibiao Yang, Qingyang Li, Maolin Sun, Jiangchang Wu, Yuming Zhou,
Abstract要約: 本研究の目的は,BICベースの戦略であるBasicと,コンパイラ故障局所化の文脈における代表的SBFL技術を直接比較することである。 Basicは最新の良いリリースと最も初期の悪いリリースを特定し、バグを引き起こすコミットをピンポイントするためにバイナリ検索を使用する。我々は、60のGCCバグと60のLLVMバグからなるベンチマークを用いて、BasicとSBFLベースのテクニックを厳格に比較した。
参考スコア（独自算出の注目度）: 9.699231545580806
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Background: Compilers are fundamental to software development, translating high-level source code into executable software systems. Faults in compilers can have severe consequences and thus effective localization and resolution of compiler bugs are crucial. Problem: In practice, developers often examine version history to identify and investigate bug-inducing commit (BIC) for fixing bugs. However, while numerous sophisticated Spectrum-Based Fault Localization (SBFL) techniques have been proposed for compiler fault isolation, their effectiveness has not been evaluated against the BIC-based strategies widely adopted in practice. Objective: This study aims to bridge this gap by directly comparing a BIC-based strategy, Basic, with representative SBFL techniques in the context of compiler fault localization. The BIC-based strategy closely aligns with common developer practices, as it directly identifies the BIC and treats the files modified in that commit as faulty candidates. Method: The Basic identifies the most recent good release and earliest bad release, and then employs a binary search to pinpoint the bug-inducing commit. All files modified in the identified commit are flagged as potentially faulty. We rigorously compare Basic against SBFL-based techniques using a benchmark consisting of 60 GCC bugs and 60 LLVM bugs. Result: Our analysis reveals that Basic performs comparably to, and in many cases outperforms, state-of-the-art SBFL-based techniques, particularly on the critical Top-1 and Top-5 ranking metrics. Conclusion: This study provides new insights into the practical effectiveness of SBFL-based techniques in real-world compiler debugging scenarios. We recommend that future research adopt Basic as a baseline when developing and evaluating new compiler fault isolation methods.
Abstract（参考訳）: 背景: コンパイラはソフトウェア開発の基本であり、ハイレベルなソースコードを実行可能なソフトウェアシステムに変換する。コンパイラの障害は深刻な結果をもたらす可能性があるため、効果的なローカライゼーションとコンパイラのバグの解決が不可欠である。問題: 実際には、開発者はバグ修正のためのバグ誘発コミット(BIC)を特定し、調査するためにバージョン履歴を調べることが多い。しかし、多くの高度なスペクトルベースのフォールトローカライゼーション(SBFL)技術がコンパイラのフォールトアイソレーションのために提案されているが、その効果は実際に広く採用されているBICベースの戦略に対して評価されていない。目的: 本研究は,BICベースの戦略であるBasicと,コンパイラ故障の局所化の文脈における代表的SBFL技術を直接比較することによって,このギャップを埋めることを目的としている。 BICベースの戦略は、BICを直接識別し、コミットで修正されたファイルを障害候補として扱うため、一般的な開発者のプラクティスと密接に一致している。メソッド: Basicは、最新の良いリリースと最も初期の悪いリリースを特定し、バグを引き起こすコミットをピンポイントするためにバイナリ検索を使用する。特定されたコミットで修正されたすべてのファイルは、潜在的な欠陥としてフラグ付けされる。我々は、60のGCCバグと60のLLVMバグからなるベンチマークを用いて、BasicとSBFLベースのテクニックを厳格に比較した。結果:本分析の結果から,Basicは最先端のSBFLベースの技術,特にTop-1とTop-5の有意な評価基準において,相容れない性能を発揮した。結論:本研究では,実世界のコンパイラデバッグシナリオにおいて,SBFLベースの手法の実用性に関する新たな知見を提供する。我々は,新しいコンパイラ障害分離手法の開発と評価において,Basicをベースラインとして採用することを推奨する。

関連論文リスト

Outrunning LLM Cutoffs: A Live Kernel Crash Resolution Benchmark for All [57.23434868678603]
Live-kBenchは、新たに発見されたカーネルバグのエージェントをスクラップし、評価するセルフ進化ベンチマークの評価フレームワークである。 kEnvは、カーネルのコンパイル、実行、フィードバックのためのエージェントに依存しないクラッシュ解決環境である。 kEnvを用いて3つの最先端エージェントをベンチマークし、最初の試行で74%のクラッシュを解決したことを示す。
論文参考訳（メタデータ） (2026-02-02T19:06:15Z)
LibContinual: A Comprehensive Library towards Realistic Continual Learning [62.34449396069085]
継続的学習(CL)における根本的な課題は破滅的な忘れ込みであり、新しいタスクに適応することで、以前のタスクのパフォーマンスが低下する。現実的なCLの基礎となるプラットフォームとして設計された,包括的で再現可能なライブラリであるLibContinualを提案する。
論文参考訳（メタデータ） (2025-12-26T13:59:13Z)
LLMBisect: Breaking Barriers in Bug Bisection with A Comparative Analysis Pipeline [35.18683484280968]
大規模言語モデル(LLM)は、既存のソリューションの障壁を断ち切るために適切に配置されている。 LLMはテキストデータとコードの両方をパッチやコミットで理解している。提案手法は最先端のソリューションよりも38%以上精度が向上する。
論文参考訳（メタデータ） (2025-10-30T02:47:25Z)
Improving Compiler Bug Isolation by Leveraging Large Language Models [14.679589768900621]
本稿では,AutoCBIという新しいコンパイラバグ分離手法を提案する。我々は、広く使われているGCCおよびLLVMコンパイラの120の現実世界バグに対して、最先端のアプローチ(DiWi、RecBi、FuseFL)に対してAutoCBIを評価した。特に、GCC/LLVMの上位1位では、AutoCBIは66.67%/69.23%、300%/340%、100%/57.14%のバグをRecBi、DiWi、FuseFLより分離している。
論文参考訳（メタデータ） (2025-06-21T09:09:30Z)
Is Compression Really Linear with Code Intelligence? [60.123628177110206]
textitFormat Annealingは、事前訓練されたモデルの本質的な能力を同等に評価するために設計された、軽量で透明なトレーニング手法である。我々の経験的結果は、測定されたコードインテリジェンスとビット・パー・キャラクタ(BPC)の基本的な対数関係を明らかにする。私たちの研究は、コードインテリジェンスの開発における圧縮の役割をより微妙に理解し、コードドメインにおける堅牢な評価フレームワークに貢献します。
論文参考訳（メタデータ） (2025-05-16T16:59:14Z)
Identifying Bug Inducing Commits by Combining Fault Localisation and Code Change Histories [10.027862394831669]
BIC(Bug Inducing Commit)は、コミットにバグを導入するコード変更である。我々は、最近修正されたコード要素がある場合、コミットがBICになる可能性が高いというコア概念でBICを識別することを目的としたFonteと呼ばれるテクニックを提案する。フォンテは最先端のBIC識別技術を大きく上回り、最大45.8%のMRRを達成している。
論文参考訳（メタデータ） (2025-02-18T15:02:22Z)
ReF Decompile: Relabeling and Function Call Enhanced Decompile [50.86228893636785]
逆コンパイルの目標は、コンパイルされた低レベルコード(アセンブリコードなど)を高レベルプログラミング言語に変換することである。このタスクは、脆弱性識別、マルウェア分析、レガシーソフトウェアマイグレーションなど、さまざまなリバースエンジニアリングアプリケーションをサポートする。
論文参考訳（メタデータ） (2025-02-17T12:38:57Z)
DOCE: Finding the Sweet Spot for Execution-Based Code Generation [69.5305729627198]
本稿では,候補生成,$n$-best再ランク,最小ベイズリスク(MBR)復号化,自己老化などを含む包括的フレームワークを提案する。本研究は,実行ベースメソッドの重要性と,実行ベースメソッドと実行フリーメソッドとの差を明らかにする。
論文参考訳（メタデータ） (2024-08-25T07:10:36Z)
FoC: Figure out the Cryptographic Functions in Stripped Binaries with LLMs [51.898805184427545]
削除されたバイナリの暗号関数を抽出するFoCと呼ばれる新しいフレームワークを提案する。まず、自然言語における暗号関数のセマンティクスを要約するために、バイナリ大言語モデル(FoC-BinLLM)を構築した。次に、FoC-BinLLM上にバイナリコード類似モデル(FoC-Sim)を構築し、変更に敏感な表現を作成し、データベース内の未知の暗号関数の類似実装を検索する。
論文参考訳（メタデータ） (2024-03-27T09:45:33Z)
Patch2QL: Discover Cognate Defects in Open Source Software Supply Chain With Auto-generated Static Analysis Rules [1.9591497166224197]
本稿では,SASTルールの自動生成によるOSSのコグネート欠陥の検出手法を提案する。具体的には、プリパッチバージョンとポストパッチバージョンから重要な構文と意味情報を抽出する。我々はPatch2QLというプロトタイプツールを実装し、それをC/C++の基本OSSに適用した。
論文参考訳（メタデータ） (2024-01-23T02:23:11Z)
Fully Autonomous Programming with Large Language Models [0.9558392439655015]
LLM(Large Language Models)を用いたプログラム合成への最近のアプローチは、"ニアミスシンドローム"を示す。我々は、LLMとプログラム合成ベンチマーク2としてOpenAI Codexを使用し、問題記述と評価のためのテストのデータベースとして使用します。結果として生じるフレームワークは、修復フェーズなしでのCodexの従来の使用法と、従来の遺伝的プログラミングアプローチの両方を上回ります。
論文参考訳（メタデータ） (2023-04-20T16:12:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。