論文の概要: An Anatomy of 488 Faults from Defects4J Based on the Control- and Data-Flow Graph Representations of Programs
- arxiv url: http://arxiv.org/abs/2502.02299v2
- Date: Mon, 28 Apr 2025 14:13:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-29 18:43:11.122195
- Title: An Anatomy of 488 Faults from Defects4J Based on the Control- and Data-Flow Graph Representations of Programs
- Title(参考訳): プログラムの制御・データフローグラフ表現に基づく欠陥4Jからの488断層の解剖
- Authors: Alexandra van der Spuy, Bernd Fischer,
- Abstract要約: Defects4Jのようなソフトウェア障害データセットは、個々の障害の位置と修復を提供するが、障害の特徴は示さない。
本稿では,プログラムの制御およびデータフローグラフ表現に基づく,新たな直接故障分類手法を提案する。
- 参考スコア(独自算出の注目度): 49.38684825106323
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Software fault datasets such as Defects4J provide for each individual fault its location and repair, but do not characterize the faults. Current classifications use the repairs as proxies, but these do not capture the intrinsic nature of the fault. In this paper, we propose a new, direct fault classification scheme based on the control- and data-flow graph representations of programs. Our scheme comprises six control-flow and two data-flow fault classes. We manually apply this scheme to 488 faults from seven projects in the Defects4J dataset. We find that the majority of the faults are assigned between one and three classes. We also find that one of the data-flow fault classes (definition fault) is the most common individual class but that the majority of faults are classified with at least one control-flow fault class. Our proposed classification can be applied to other fault datasets and can be used to improve fault localization and automated program repair techniques for specific fault classes.
- Abstract(参考訳): Defects4Jのようなソフトウェア障害データセットは、個々の障害の位置と修復を提供するが、障害の特徴は示さない。
現在の分類では、修復をプロキシとして使用するが、本質的な断層の性質を捉えていない。
本稿では,プログラムの制御・データフローグラフ表現に基づく,新たな直接故障分類手法を提案する。
提案手法は6つの制御フローと2つのデータフローフォールトクラスから構成される。
Defects4Jデータセットの7つのプロジェクトからの488の障害に対して、このスキームを手作業で適用します。
障害の大部分は,1~3つのクラスに割り当てられていることが分かりました。
また、データフローフォールトクラス(定義フォールトクラス)の1つは最も一般的な個別クラスであるが、障害の大部分は少なくとも1つの制御フローフォールトクラスに分類される。
提案する分類法は,他の断層データセットに適用可能であり,特定の断層クラスに対する故障局所化と自動プログラム修復技術の改善に有効である。
関連論文リスト
- Where's the Bug? Attention Probing for Scalable Fault Localization [18.699014321422023]
本稿では, 直接的位置付けラベルを使わずに, 最先端の故障位置付けを学習するBug Attention Probe(BAP)を提案する。
BAPは計算コストのごく一部で大きなオープンウェイトモデルよりもはるかに効率的である。
論文 参考訳(メタデータ) (2025-02-19T18:59:32Z) - Rethinking Early Stopping: Refine, Then Calibrate [49.966899634962374]
校正誤差と校正誤差は,訓練中に同時に最小化されないことを示す。
我々は,早期停止とハイパーパラメータチューニングのための新しい指標を導入し,トレーニング中の改善誤差を最小限に抑える。
本手法は,任意のアーキテクチャとシームレスに統合し,多様な分類タスクにおける性能を継続的に向上する。
論文 参考訳(メタデータ) (2025-01-31T15:03:54Z) - Classification Error Bound for Low Bayes Error Conditions in Machine Learning [50.25063912757367]
機械学習における誤りミスマッチとKulback-Leibler分散の関係について検討する。
多くの機械学習タスクにおける低モデルに基づく分類誤差の最近の観測により、低ベイズ誤差条件に対する分類誤差の線形近似を提案する。
論文 参考訳(メタデータ) (2025-01-27T11:57:21Z) - Parameter-tuning-free data entry error unlearning with adaptive
selective synaptic dampening [51.34904967046097]
本稿では,パラメータチューニングの必要性を排除した選択的シナプス減衰アンラーニング法の拡張を提案する。
本稿では,ResNet18とVision Transformerの未学習タスクにおける適応選択的シナプス減衰(ASSD)の性能を示す。
このアプローチの適用は、サプライチェーン管理などの産業環境において特に魅力的である。
論文 参考訳(メタデータ) (2024-02-06T14:04:31Z) - Making Binary Classification from Multiple Unlabeled Datasets Almost
Free of Supervision [128.6645627461981]
本稿では,複数ラベル付きデータセットからの2値分類という新たな問題設定を提案する。
MU-OPPOでは、ラベル付けされていないすべてのデータセットのクラスプリエントは不要です。
このフレームワークは,クラス前の推定誤差が小さくなり,バイナリ分類の性能が向上することを示す。
論文 参考訳(メタデータ) (2023-06-12T11:33:46Z) - Deep Reinforcement Learning for Online Error Detection in Cyber-Physical
Systems [1.2074552857379273]
本稿では,Deep Reinforcement Learning(DRL)に基づく新しい誤り検出手法を提案する。
提案手法は,通常のデータから異なるタイプのエラーを分類し,システムが失敗するかどうかを予測する。
評価結果から,提案手法の精度は2倍以上に向上し,推論時間も他の手法に比べて5倍以上に向上したことが示された。
論文 参考訳(メタデータ) (2023-02-03T06:28:54Z) - Understanding Factual Errors in Summarization: Errors, Summarizers,
Datasets, Error Detectors [105.12462629663757]
本研究では、既存の9つのデータセットから事実性エラーアノテーションを集約し、基礎となる要約モデルに従ってそれらを階層化する。
本稿では,この階層化ベンチマークにおいて,最近のChatGPTベースの指標を含む最先端の事実性指標の性能を比較し,その性能が様々な種類の要約モデルで大きく異なることを示す。
論文 参考訳(メタデータ) (2022-05-25T15:26:48Z) - Automatic Classification of Error Types in Solutions to Programming
Assignments at Online Learning Platform [4.028503203417233]
プログラムの代入に対する自動検証システムのフィードバックを改善するため,機械学習手法を適用した。
我々は、以前に提出された不正なソリューションをクラスタリングし、これらのクラスタをラベル付けし、このラベル付きデータセットを使用して、新しいサブミッションにおけるエラーのタイプを特定することで、頻繁なエラータイプを検出する。
論文 参考訳(メタデータ) (2021-07-13T11:59:57Z) - Data-Driven Fault Diagnosis Analysis and Open-Set Classification of
Time-Series Data [1.0152838128195467]
データ駆動解析とオープンセット分類のためのフレームワークが,故障診断への応用のために開発された。
不均衡なデータセット、クラスオーバーラップ、未知の障害を処理できるデータ駆動型障害分類アルゴリズムが提案されている。
トレーニングデータに既知の故障認識の情報が含まれている場合, 故障の大きさを推定するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-09-10T09:53:13Z) - Self-Learning with Rectification Strategy for Human Parsing [73.06197841003048]
擬似ラベルの2つの典型的な誤りを補正する訓練可能なグラフ推論法を提案する。
再構成された特徴は、人体のトポロジー構造を表現する能力が強い。
本手法は、教師付き人間の解析作業において、他の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-04-17T03:51:30Z) - Structured Prediction with Partial Labelling through the Infimum Loss [85.4940853372503]
弱い監督の目標は、収集コストの安いラベル付け形式のみを使用してモデルを学習できるようにすることである。
これは、各データポイントに対して、実際のものを含むラベルのセットとして、監督がキャストされる不完全なアノテーションの一種です。
本稿では、構造化された予測と、部分的なラベリングを扱うための無限損失の概念に基づく統一的なフレームワークを提供する。
論文 参考訳(メタデータ) (2020-03-02T13:59:41Z) - Implicit supervision for fault detection and segmentation of emerging
fault types with Deep Variational Autoencoders [1.160208922584163]
本研究では,ラベル付きおよびラベルなしサンプルを用いた可変オートエンコーダ(VAE)を提案する。
これによりコンパクトで情報に富んだ潜在表現が生成され、未確認のフォールトタイプの検出とセグメンテーションが良好になる。
本研究では,提案手法が他の学習方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2019-12-28T18:40:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。