Fugu-MT 論文翻訳(概要): SmartFL: Semantics Based Probabilistic Fault Localization

論文の概要: SmartFL: Semantics Based Probabilistic Fault Localization

arxiv url: http://arxiv.org/abs/2503.23224v2
Date: Thu, 03 Apr 2025 16:35:04 GMT
ステータス: 翻訳完了
システム内更新日: 2025-04-04 12:51:12.702354
Title: SmartFL: Semantics Based Probabilistic Fault Localization
Title（参考訳）: SmartFL: セマンティックスに基づく確率的フォールトローカライゼーション
Authors: Yiqian Wu, Yujie Liu, Yi Yin, Muhan Zeng, Zhentao Ye, Xin Zhang, Yingfei Xiong, Lu Zhang,
Abstract要約: テストベースの障害ローカライゼーションは、過去数十年間、ソフトウェアエンジニアリングに重点を置いてきた。フォールトローカライゼーションアプローチにおけるプログラムセマンティクスのモデル化は重要である。私たちのキーとなるアイデアは、プログラム値の正しさのみをモデル化し、その完全な意味論をモデル化することで、有効性とスケーラビリティのバランスを達成できるということです。
参考スコア（独自算出の注目度）: 15.481820762877897
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Testing-based fault localization has been a research focus in software engineering in the past decades. It localizes faulty program elements based on a set of passing and failing test executions. Since whether a fault could be triggered and detected by a test is related to program semantics, it is crucial to model program semantics in fault localization approaches. Existing approaches either consider the full semantics of the program (e.g., mutation-based fault localization and angelic debugging), leading to scalability issues, or ignore the semantics of the program (e.g., spectrum-based fault localization), leading to imprecise localization results. Our key idea is: by modeling only the correctness of program values but not their full semantics, a balance could be reached between effectiveness and scalability. To realize this idea, we introduce a probabilistic model by efficient approximation of program semantics and several techniques to address scalability challenges. Our approach, SmartFL(SeMantics bAsed pRobabilisTic Fault Localization), is evaluated on a real-world dataset, Defects4J 2.0. The top-1 statement-level accuracy of our approach is {14\%}, which improves 130\% over the best SBFL and MBFL methods. The average time cost is {205} seconds per fault, which is half of SBFL methods. After combining our approach with existing approaches using the CombineFL framework, the performance of the combined approach is significantly boosted by an average of 10\% on top-1, top-3, and top-5 accuracy compared to state-of-the-art combination methods.
Abstract（参考訳）: テストベースの障害ローカライゼーションは、過去数十年間、ソフトウェアエンジニアリングに重点を置いてきた。パステストとフェールテストの実行セットに基づいて、欠陥のあるプログラム要素をローカライズする。テストによって障害が引き起こされ検出されるかどうかがプログラムセマンティクスに関係しているため、フォールトローカライゼーションアプローチにおけるプログラムセマンティクスをモデル化することが重要である。既存のアプローチでは、プログラムの完全なセマンティクス(例えば、突然変異ベースの障害ローカライゼーションとエンジェルデバッギング)を考慮し、スケーラビリティの問題につながるか、プログラムのセマンティクス(例えば、スペクトルベースの障害ローカライゼーション)を無視し、不正確なローカライゼーション結果をもたらす。私たちのキーとなるアイデアは、プログラム値の正しさのみをモデル化し、その完全な意味論をモデル化することで、有効性とスケーラビリティのバランスを達成できるということです。このアイデアを実現するために,プログラムセマンティクスの効率的な近似による確率モデルと,スケーラビリティ問題に対処するいくつかの手法を導入する。実世界のデータセットであるDefects4J 2.0を用いて,SmartFL(Semantics bAsed pRobabilisTic Fault Localization)の評価を行った。提案手法は,SBFL法とMBFL法よりも130\%向上した<14\%}である。平均時間コストは1フォールトあたり {205} 秒であり、これはSBFL法の半分である。提案手法とCommergeFLフレームワークを併用した既存手法を併用すると, 組立手法の性能は, 最先端の組み合わせ法と比較して, トップ1, トップ3, トップ5の精度で平均10\%向上する。

関連論文リスト

Fast Controlled Generation from Language Models with Adaptive Weighted Rejection Sampling [90.86991492288487]
トークンの制約を評価するのは違法にコストがかかる LCDは文字列上のグローバル分布を歪め、ローカル情報のみに基づいてトークンをサンプリングすることができる。我々のアプローチは最先端のベースラインよりも優れていることを示す。
論文参考訳（メタデータ） (2025-04-07T18:30:18Z)
The Impact of Input Order Bias on Large Language Models for Software Fault Localization [8.22737389683156]
大規模言語モデル(LLM)は、ソフトウェア工学のタスクにおいて大きな可能性を示しています。本研究では,入力順序と文脈サイズがLLM性能に与える影響について検討する。
論文参考訳（メタデータ） (2024-12-25T02:48:53Z)
A Multi-Agent Approach to Fault Localization via Graph-Based Retrieval and Reflexion [8.22737389683156]
従来のフォールトローカライゼーション技術は、広範なトレーニングデータセットと高い計算資源を必要とする。大規模言語モデル(LLM)の最近の進歩は、コード理解と推論を強化することで、新たな機会を提供する。 LLM4FLは3つの特殊なLLMエージェントを利用するマルチエージェントの故障局所化フレームワークである。 14のJavaプロジェクトから675の障害を含むDefects4Jベンチマークで評価され、LLM4FLはAutoFLよりも18.55%、SoapFLより4.82%、Top-1の精度が18.55%向上した。
論文参考訳（メタデータ） (2024-09-20T16:47:34Z)
Impact of Large Language Models of Code on Fault Localization [2.936007114555107]
本稿では,FLタスクのための大規模言語モデルの微調整のための,単純だが効果的なシーケンス生成手法を提案する。具体的には、FLタスク用の代表エンコーダ、エンコーダデコーダ、デコーダベースの13のLLMCを微調整する。実験結果から, LLMCは50.6%, 64.2%, 72.3%の誤差位置を検出できた。
論文参考訳（メタデータ） (2024-08-19T02:36:07Z)
Effective Fault Localization using Probabilistic and Grouping Approach [0.7673339435080445]
本研究の目的は, 条件付き確率の概念を用いて, 効果的な断層位置決め手法を設計することである。本稿では,文のカバレッジ情報とテストケースの実行結果の関係を導出するフォールトローカライゼーション手法を提案する。本研究では,11個のオープンソースデータセットに対して提案手法の有効性を評価する。
論文参考訳（メタデータ） (2024-03-08T03:55:09Z)
Masked Thought: Simply Masking Partial Reasoning Steps Can Improve Mathematical Reasoning Learning of Language Models [102.72940700598055]
推論タスクでは、小さなエラーでも不正確な結果にカスケードすることができる。入力の摂動に頼らず、外部リソースの導入を避ける手法を開発した。私たちのトレーニングアプローチでは、思考の連鎖の中で特定のトークンをランダムにマスクします。
論文参考訳（メタデータ） (2024-03-04T16:21:54Z)
DF2: Distribution-Free Decision-Focused Learning [53.2476224456902]
決定中心学習(DFL)は近年,予測最適化問題に対する強力なアプローチとして出現している。既存のエンドツーエンドDFL法は、モデル誤差、サンプル平均近似誤差、予測対象の分布に基づくパラメータ化の3つの重大なボトルネックによって妨げられている。 DF2は,これら3つのボトルネックに明示的に対処するために設計された,初となるテキストフリーな意思決定型学習手法である。
論文参考訳（メタデータ） (2023-08-11T00:44:46Z)
Self-Evaluation Guided Beam Search for Reasoning [61.523627290397556]
我々は,Large Language Model (LLM) の推論プロセスのガイドと校正を行うための段階的自己評価機構を導入する。本稿では,ビームサーチによる自己評価ガイダンスを統合した復号アルゴリズムを提案する。我々のアプローチは、GSM8K、AQuA、StrategyQAにおいて、対応するCodexバックボンドベースラインをわずかに精度6.34%、9.56%、および5.46%で上回る。
論文参考訳（メタデータ） (2023-05-01T02:37:59Z)
Scalable Bayesian Meta-Learning through Generalized Implicit Gradients [64.21628447579772]
Inlicit Bayesian Meta-learning (iBaML) 法は、学習可能な事前のスコープを広げるだけでなく、関連する不確実性も定量化する。解析誤差境界は、明示的よりも一般化された暗黙的勾配の精度と効率を示すために確立される。
論文参考訳（メタデータ） (2023-03-31T02:10:30Z)
Fast and Correct Gradient-Based Optimisation for Probabilistic Programming via Smoothing [0.0]
本稿では,後部推論を最適化問題とする変分推論の基礎について検討する。私たちは、測定可能とスムーズな(近似的な)値セマンティクスの両方を言語に与えました。提案手法は鍵となる競合相手と同様の収束性を持つが,よりシンプルで,高速で,作業正規化分散の桁違いの低減が達成できることを示す。
論文参考訳（メタデータ） (2023-01-09T15:12:45Z)
FedPD: A Federated Learning Framework with Optimal Rates and Adaptivity to Non-IID Data [59.50904660420082]
フェデレートラーニング(FL)は、分散データから学ぶための一般的なパラダイムになっています。クラウドに移行することなく、さまざまなデバイスのデータを効果的に活用するために、Federated Averaging(FedAvg)などのアルゴリズムでは、"Computation then aggregate"(CTA)モデルを採用している。
論文参考訳（メタデータ） (2020-05-22T23:07:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。