論文の概要: Principal Context-aware Diffusion Guided Data Augmentation for Fault Localization
- arxiv url: http://arxiv.org/abs/2505.24079v1
- Date: Thu, 29 May 2025 23:54:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-02 19:47:52.705806
- Title: Principal Context-aware Diffusion Guided Data Augmentation for Fault Localization
- Title(参考訳): フォールトローカライゼーションのための主成分的コンテキスト認識拡散誘導データ拡張
- Authors: Shihao Fu, Yan Lei,
- Abstract要約: そこで本研究では,PCD-DAugを提案する。
PCD-DAugは、故障局所化を改善するために合成失敗試験ケースを生成する。
我々は6つの最先端FL手法の大規模実験を行い、PCD-DAugと6つのデータ拡張ベースラインを比較した。
- 参考スコア(独自算出の注目度): 0.9712255342116106
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Test cases are indispensable for conducting effective fault localization (FL). However, test cases in practice are severely class imbalanced, i.e. the number of failing test cases (i.e. minority class) is much less than that of passing ones (i.e. majority class). The severe class imbalance between failing and passing test cases have hindered the FL effectiveness. To address this issue, we propose PCD-DAug: a Principal Context-aware Diffusion guided Data Augmentation approach that generate synthesized failing test cases for improving FL. PCD-DAug first combines program slicing with principal component analysis to construct a principal context that shows how a set of statements influences the faulty output via statistical program dependencies. Then, PCD-DAug devises a conditional diffusion model to learn from principle contexts for generating synthesized failing test cases and acquiring a class balanced dataset for FL. We conducted large-scale experiments on six state-of-the-art FL approaches and compare PCD-DAug with six data augmentation baselines. The results show that PCD-DAug significantly improves FL effectiveness, e.g. achieving average improvements of 383.83%, 227.08%, and 224.19% in six FL approaches under the metrics Top-1, Top-3, and Top-5, respectively.
- Abstract(参考訳): テストケースは、効果的なフォールトローカライゼーション(FL)の実行には不可欠である。
しかし、実際に行われているテストケースは、非常に不均衡である。つまり、失敗するテストケースの数(マイノリティークラス)は、通過するテストケースの数(マイノリティークラス)よりもはるかに少ない。
フェールテストとパステストの間の深刻なクラス不均衡は、FLの有効性を妨げている。
この問題に対処するために,本論文では, FL を改善するために合成されたフェールテストケースを生成するプリンシパルコンテキスト対応拡散誘導データ拡張アプローチである PCD-DAug を提案する。
PCD-DAugはまず、プログラムスライシングと主成分分析を組み合わせることで、一連のステートメントが統計的プログラム依存を通じた欠陥出力にどのように影響するかを示す主コンテキストを構築する。
そこで,PCD-DAug は,合成されたテストケースを生成し,FL のためのクラスバランスデータセットを取得するための条件拡散モデルを考案した。
我々は6つの最先端FL手法の大規模実験を行い、PCD-DAugと6つのデータ拡張ベースラインを比較した。
その結果,PCD-DAugは,Top-1,Top-3,Top-5の6つのFLアプローチにおいて平均383.83%,227.08%,224.19%の改善を達成した。
関連論文リスト
- The First Few Tokens Are All You Need: An Efficient and Effective Unsupervised Prefix Fine-Tuning Method for Reasoning Models [69.798277882245]
大規模言語モデルの推論効率を向上させるために,Unsupervised Prefix Fine-Tuning (UPFT)を導入した。
UPFTはラベル付きデータや徹底的なサンプリングの必要性を取り除く。
実験の結果,UPFTは教師付き手法の性能と一致していることがわかった。
論文 参考訳(メタデータ) (2025-03-04T18:56:03Z) - Can We Theoretically Quantify the Impacts of Local Updates on the Generalization Performance of Federated Learning? [50.03434441234569]
フェデレートラーニング(FL)は、直接データ共有を必要とせず、さまざまなサイトで機械学習モデルをトレーニングする効果により、大きな人気を集めている。
局所的な更新を伴うFLは通信効率のよい分散学習フレームワークであることが様々なアルゴリズムによって示されているが、局所的な更新によるFLの一般化性能は比較的低い。
論文 参考訳(メタデータ) (2024-09-05T19:00:18Z) - FedKBP: Federated dose prediction framework for knowledge-based planning in radiation therapy [0.5575343193009424]
ドーズ予測は、患者固有の線量分布を自動的に生成することにより、知識ベース計画(KBP)において重要な役割を果たす。
深層学習に基づく線量予測手法の最近の進歩は、データコントリビュータ間の協調が必要である。
フェデレーションラーニング(FL)がソリューションとして登場し、医療センターは患者のデータのプライバシーを損なうことなく、ディープラーニングモデルを共同で訓練することができる。
論文 参考訳(メタデータ) (2024-08-17T14:57:14Z) - Beyond Imitation: Leveraging Fine-grained Quality Signals for Alignment [105.34140537748546]
我々はFIGAという改良されたアライメント手法を提案し、従来の手法とは異なり、良質な応答と悪質な応答の対比から導出されるきめ細かい品質信号を取り込む。
まず、初期応答とそれに対応する修正データセットをペアリングする精巧なアライメントデータセットをキュレートする。
第2に,LLMの微粒な品質信号を利用してアライメントの学習を指導する新たな損失関数を考案する。
論文 参考訳(メタデータ) (2023-11-07T15:36:40Z) - Proposal Distribution Calibration for Few-Shot Object Detection [65.19808035019031]
few-shot object detection (FSOD)では、重度のサンプル不均衡を軽減するために、2段階の訓練パラダイムが広く採用されている。
残念ながら、極端なデータ不足は、提案の分布バイアスを増大させ、RoIヘッドが新しいクラスに進化するのを妨げます。
本稿では,RoIヘッドのローカライゼーションと分類能力を高めるために,単純かつ効果的な提案分布キャリブレーション(PDC)手法を提案する。
論文 参考訳(メタデータ) (2022-12-15T05:09:11Z) - DearFSAC: An Approach to Optimizing Unreliable Federated Learning via
Deep Reinforcement Learning [3.516494777812123]
本稿では,DearFSAC (Defect-AwaRe Federated soft actor-critic) を提案する。
DearFSACは、独立および同一分散(IID)と非IID設定の2つのデータセットに対して、既存の3つのアプローチより優れている。
論文 参考訳(メタデータ) (2022-01-30T01:47:43Z) - Towards Understanding Quality Challenges of the Federated Learning: A
First Look from the Lens of Robustness [4.822471415125479]
Federated Learning(FL)は、すべての参加者のデータセット全体をトレーニングに活用しながら、ユーザのデータのプライバシを保護することを目的としている。
FLは依然として攻撃やビザンチン障害などの品質問題に悩まされる傾向にある。
本報告では,攻撃・故障発生におけるSOTA(State-of-the-art)の強靭なFL手法の有効性について検討する。
論文 参考訳(メタデータ) (2022-01-05T02:06:39Z) - Failure Prediction in Production Line Based on Federated Learning: An
Empirical Study [8.574488051650123]
フェデレーション学習(fl)は、複数の参加者がデータを共有することなく学習モデルを構築することを可能にする。
本稿では,FLに基づく生産ラインの故障予測に関する実証研究の結果について述べる。
論文 参考訳(メタデータ) (2021-01-25T10:27:19Z) - Deep F-measure Maximization for End-to-End Speech Understanding [52.36496114728355]
本稿では,F測度に対する微分可能な近似法を提案し,標準バックプロパゲーションを用いてネットワークをトレーニングする。
我々は、アダルト、コミュニティ、犯罪の2つの標準フェアネスデータセットの実験を行い、ATISデータセットの音声・インテリジェンス検出と音声・COCOデータセットの音声・イメージ概念分類を行った。
これらの4つのタスクのすべてにおいて、F測定は、クロスエントロピー損失関数で訓練されたモデルと比較して、最大8%の絶対的な絶対的な改善を含む、マイクロF1スコアの改善をもたらす。
論文 参考訳(メタデータ) (2020-08-08T03:02:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。