Fugu-MT 論文翻訳(概要): FLIMs: Fault Localization Interference Mutants, Definition, Recognition and Mitigation

論文の概要: FLIMs: Fault Localization Interference Mutants, Definition, Recognition and Mitigation

arxiv url: http://arxiv.org/abs/2511.23302v1
Date: Fri, 28 Nov 2025 16:00:44 GMT
ステータス: 翻訳完了
システム内更新日: 2025-12-01 19:47:55.971071
Title: FLIMs: Fault Localization Interference Mutants, Definition, Recognition and Mitigation
Title（参考訳）: FLIMs: フォールトローカライゼーション干渉ミュータント、定義、認識、緩和
Authors: Hengyuan Liu, Zheng Li, Donghua Wang, Yankai Wu, Xiang Chen, Yong Liu,
Abstract要約: そこで本研究では,実際の故障検出情報を保存しながら,誤った干渉を低減できる故障局所化フレームワークを開発した。 MBFL-FLIMはTop-1メートル法で44の断層を平均的に改善し、基準線法よりも大幅に向上した。
参考スコア（独自算出の注目度）: 18.9509632937475
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Mutation-based Fault Localization (MBFL) has been widely explored for automated software debugging, leveraging artificial mutants to identify faulty code entities. However, MBFL faces significant challenges due to interference mutants generated from non-faulty code entities but can be killed by failing tests. These mutants mimic the test sensitivity behaviors of real faulty code entities and weaken the effectiveness of fault localization. To address this challenge, we introduce the concept of Fault Localization Interference Mutants (FLIMs) and conduct a theoretical analysis based on the Reachability, Infection, Propagation, and Revealability (RIPR) model, identifying four distinct interference causes. Building on this, we propose a novel approach to semantically recognize and mitigate FLIMs using LLM-based semantic analysis, enhanced by fine-tuning techniques and confidence estimation strategies to address LLM output instability. The recognized FLIMs are then mitigated by refining the suspiciousness scores calculated from MBFL techniques. We integrate FLIM recognition and mitigation into the MBFL workflow, developing MBFL-FLIM, a fault localization framework that enhances MBFL's effectiveness by reducing misleading interference while preserving real fault-revealing information. Our empirical experiments on the Defects4J benchmark with 395 program versions using eight LLMs demonstrate MBFL-FLIM's superiority over traditional SBFL and MBFL methods, advanced dynamic feature-based approaches, and recent LLM-based fault localization techniques. Specifically, MBFL-FLIM achieves an average improvement of 44 faults in the Top-1 metric, representing a significant enhancement over baseline methods. Further evaluation confirms MBFL-FLIM's robust performance in multi-fault scenarios, with ablation experiments validating the contributions of the fine-tuning and confidence estimation components.
Abstract（参考訳）: Mutation-based Fault Localization (MBFL) は、人工的なミュータントを利用して欠陥のあるコードエンティティを識別する自動ソフトウェアデバッグのために広く研究されている。しかし、MBFLは、非デフォルトのコードエンティティから発生する干渉変異のために重大な課題に直面しているが、テストの失敗によって死亡する可能性がある。これらの変異体は、実際の欠陥コードエンティティのテスト感度挙動を模倣し、障害局所化の有効性を弱める。この課題に対処するために,障害局在化干渉変異体 (FLIM) の概念を導入し, 4つの異なる干渉原因を同定し, 到達性, 感染性, 伝播性, 回復性 (RIPR) モデルに基づく理論的解析を行った。そこで本研究では,LLMを用いたセマンティック分析を用いてFLIMを意味的に認識・緩和する手法を提案する。認識されたFLIMは、MBFL技術から算出された不確実性スコアを精製することにより緩和される。我々は,MBFLのワークフローにFLIM認識と緩和を組み込み,実際のフォールト検索情報を保存しながら,ミスリード干渉を低減し,MBFLの有効性を高める故障局所化フレームワークであるMBFL-FLIMを開発した。従来のSBFL法やMBFL法よりもMBFL-FLIMの方が優れていること,高度な動的特徴に基づくアプローチ,そして最近のLLMに基づく障害ローカライゼーション手法を実証した。具体的には、MBFL-FLIMは、Top-1メートル法における44の断層を平均的に改善し、ベースライン法よりも大幅に向上したことを示す。さらに、MBFL-FLIMのマルチフォールトシナリオにおける頑健な性能を確認し、微調整および信頼度推定コンポーネントの寄与を検証するアブレーション実験を行った。

関連論文リスト

LIME-LLM: Probing Models with Fluent Counterfactuals, Not Broken Text [7.194073942393882]
LIME-LLMは、ランダムノイズを仮説駆動の制御摂動に置き換えるフレームワークである。実験の結果、LIME-LLMはブラックボックスの説明可能性のための新しいベンチマークを確立している。
論文参考訳（メタデータ） (2026-01-16T19:55:06Z)
MBFL-DKMR: Improving Mutation-based Fault Localization through Denoising-based Kill Matrix Refinement [21.09532467931481]
本稿では,MBFLにおけるミュータント-テスト関係を捉えるコアデータ構造であるキルマトリクスを改良する新しい手法を提案する。 DKMRは、ハイブリッド行列構築による信号強調と、雑音抑制のための周波数領域フィルタリングによる信号復調の2つの重要な段階を用いる。 Defects4J v2.0.0の評価は、MBFL-DKMRがノイズを効果的に軽減し、最先端のMBFL技術より優れていることを示す。
論文参考訳（メタデータ） (2025-11-28T06:48:00Z)
Digging Into the Internal: Causality-Based Analysis of LLM Function Calling [20.565096639708162]
FC(Function Calling)は,ユーザ命令による大規模言語モデルのコンプライアンスを大幅に向上させることができることを示す。我々は,従来のプロンプト法と比較してFCベースの命令の有効性を比較する実験を行った。 FCは、悪意のある入力を検知する従来のプロンプト法よりも平均で約135%の性能向上を示した。
論文参考訳（メタデータ） (2025-09-18T08:30:26Z)
LLM-Lasso: A Robust Framework for Domain-Informed Feature Selection and Regularization [59.75242204923353]
LLM-Lassoは大規模言語モデル(LLM)を利用してラッソ回帰における特徴選択を導くフレームワークである。 LLMは各特徴に対してペナルティ因子を生成し、単純でチューニング可能なモデルを用いてラスソペナルティの重みに変換される。 LLMによりより関連づけられた特徴は、より低い罰を受け、最終モデルに保持される可能性を高める。
論文参考訳（メタデータ） (2025-02-15T02:55:22Z)
A Multi-Agent Approach to Fault Localization via Graph-Based Retrieval and Reflexion [8.22737389683156]
従来のフォールトローカライゼーション技術は、広範なトレーニングデータセットと高い計算資源を必要とする。大規模言語モデル(LLM)の最近の進歩は、コード理解と推論を強化することで、新たな機会を提供する。 LLM4FLは3つの特殊なLLMエージェントを利用するマルチエージェントの故障局所化フレームワークである。 14のJavaプロジェクトから675の障害を含むDefects4Jベンチマークで評価され、LLM4FLはAutoFLよりも18.55%、SoapFLより4.82%、Top-1の精度が18.55%向上した。
論文参考訳（メタデータ） (2024-09-20T16:47:34Z)
FactorLLM: Factorizing Knowledge via Mixture of Experts for Large Language Models [50.331708897857574]
本稿では,高度に訓練された高密度FFNを余分なサブネットワークに分解する新しいアプローチであるFacterLLMを紹介する。 FactorLLMは、最大85%のモデル性能を確保しながら、推論速度を30%以上増加させながら、ソースモデルに匹敵するパフォーマンスを達成する。
論文参考訳（メタデータ） (2024-08-15T16:45:16Z)
Exploring Automatic Cryptographic API Misuse Detection in the Era of LLMs [60.32717556756674]
本稿では,暗号誤用の検出において,大規模言語モデルを評価するための体系的評価フレームワークを提案する。 11,940個のLCM生成レポートを詳細に分析したところ、LSMに固有の不安定性は、報告の半数以上が偽陽性になる可能性があることがわかった。最適化されたアプローチは、従来の手法を超え、確立されたベンチマークでこれまで知られていなかった誤用を明らかにすることで、90%近い顕著な検出率を達成する。
論文参考訳（メタデータ） (2024-07-23T15:31:26Z)
R-SFLLM: Jamming Resilient Framework for Split Federated Learning with Large Language Models [65.04475956174959]
Split Federated Learning (SFL)は、分散機械学習(ML)における計算効率のパラダイムである。 SFLにおける重要な課題は、特に無線チャネル上に展開する場合、送信されたモデルパラメータの敵ジャミングに対する感受性である。本稿では,無線ネットワーク上での大規模言語モデル (LLM) と視覚言語モデル (VLM) を用いたレジリエンスSFLのための物理層フレームワークを開発する。
論文参考訳（メタデータ） (2024-07-16T12:21:29Z)
UBench: Benchmarking Uncertainty in Large Language Models with Multiple Choice Questions [10.28688988951815]
大規模言語モデル(LLM)の不確実性を評価するための新しいベンチマークであるUBenchを紹介する。他のベンチマークとは異なり、UBenchは信頼区間に基づいている。知識、言語、理解、推論能力にまたがる11,978の多重選択質問を含んでいる。 1) 信頼性区間に基づく手法は不確実性定量化に極めて有効である; 2) 不確実性に関して、優れたオープンソースモデルは、クローズドソースモデルと競合する性能を示す; 3) CoT と RP は、モデル信頼性を改善するための潜在的方法を示し、温度変化の影響は普遍的な規則に従わない。
論文参考訳（メタデータ） (2024-06-18T16:50:38Z)
Learning Test-Mutant Relationship for Accurate Fault Localisation [16.080629795085322]
自動フォールトローカライゼーション(Automated fault Localization)は、開発者がフォールトロケーションのスペースを狭めることで、障害の根本原因を特定するのを支援することを目的としている。いくつかのミューテーションベース障害局所化(MBFL)技術が、自動的に故障を見つけるために提案されている。その成功にもかかわらず、既存のMBFL技術は、欠陥が観測された後に突然変異解析を行うコストに悩まされている。本稿では,現時点の異常をローカライズするために事前突然変異解析を利用するSIMFLと呼ばれる新しいMBFL手法を提案する。
論文参考訳（メタデータ） (2023-06-04T10:09:38Z)
LLMs as Factual Reasoners: Insights from Existing Benchmarks and Beyond [135.8013388183257]
そこで我々は,SummEditsと呼ばれる10ドメインのベンチマークで不整合検出ベンチマークを作成し,実装する新しいプロトコルを提案する。ほとんどのLLMはSummEditsで苦労しており、パフォーマンスはランダムに近い。最も優れたモデルであるGPT-4は、推定された人間のパフォーマンスよりも8%低い。
論文参考訳（メタデータ） (2023-05-23T21:50:06Z)
Tight Mutual Information Estimation With Contrastive Fenchel-Legendre Optimization [69.07420650261649]
我々はFLOと呼ばれる新しい,シンプルで強力なコントラストMI推定器を提案する。実証的に、我々のFLO推定器は前者の限界を克服し、より効率的に学習する。 FLOの有効性は、広範囲なベンチマークを用いて検証され、実際のMI推定におけるトレードオフも明らかにされる。
論文参考訳（メタデータ） (2021-07-02T15:20:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。