論文の概要: Isolating Noisy Labelled Test Cases in Human-in-the-Loop Oracle Learning
- arxiv url: http://arxiv.org/abs/2506.13273v1
- Date: Mon, 16 Jun 2025 09:12:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:47.981257
- Title: Isolating Noisy Labelled Test Cases in Human-in-the-Loop Oracle Learning
- Title(参考訳): 人手によるOracle学習におけるノイズキャンベリングテストケースの分離
- Authors: Charaka Geethal Kapugama,
- Abstract要約: 誤ってラベル付けされたテストケースは、ループ内学習技術のトレーニングプロセスに悪影響を及ぼす可能性がある。
本報告では, 人道学習における誤検査事例を識別する手法であるISONOISEを紹介する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Incorrectly labelled test cases can adversely affect the training process of human-in-the-loop oracle learning tech-niques. This paper introduces ISONOISE, a technique designed to identify such mislabelled test cases introduced during human-in-the-loop oracle learning. This technique can be applied to programs taking numeric inputs. Given a compromised automatic test oracle and its training test suite, ISONOISE first isolates thetest cases suspected of being mislabelled. This task is performed based on the level of disagreement of a test case with respect to the others. An intermediate automatic test oracle is trained based on the slightly disagreeing test cases. Based on the predictions of this intermediate oracle, the test cases suspected of being mislabelled are systematically presented for relabelling. When mislabelled test cases are found, the intermediate test oracle is updated. This process repeats until no mislabelled test case is found in relabelling. ISONOISE was evaluated within the human-in-the-loop oracle learning method used in LEARN2FIX. Experimental results demonstrate that ISONOISE can identify mislabelled test cases introduced by the human in LEARN2FIX with over 67% accuracy, while requiring only a small number of relabelling queries. These findings highlight the potential of ISONOISE to enhance the reliability of human-in-the-loop oracle learning.
- Abstract(参考訳): 誤ってラベル付けされたテストケースは、ループ内学習技術のトレーニングプロセスに悪影響を及ぼす可能性がある。
本報告では, 人道学習における誤検査事例を識別する手法であるISONOISEを紹介する。
この手法は、数値入力を受けるプログラムに適用できる。
ISONOISEは、欠陥のある自動テストオラクルとそのトレーニングテストスイートを前提として、まず、誤認の疑いのあるテストケースを分離する。
このタスクは、他のものに対するテストケースの不一致のレベルに基づいて実行される。
中間自動テストオラクルは、わずかに不一致なテストケースに基づいて訓練される。
この中間オラクルの予測に基づいて, 誤認と疑われる検査事例を系統的に提示した。
不正なテストケースが見つかると、中間テストオラクルが更新される。
このプロセスは、不正なテストケースがリラベリングで見つかるまで繰り返す。
The human-in-the-loop Oracle learning method used in LEARN2FIX。
実験の結果、ISONOISEは、LEARN2FIXにおいてヒトが導入した不正な検査ケースを67%以上精度で識別でき、少数のリラベリングクエリしか必要としないことがわかった。
これらの知見は,ISONOISEが人道学習の信頼性を高める可能性を浮き彫りにした。
関連論文リスト
- STAMP: Outlier-Aware Test-Time Adaptation with Stable Memory Replay [76.06127233986663]
テスト時間適応(TTA)は、トレーニングデータとテストデータの間の分散シフトに、未ラベルのデータのみを用いて対処することを目的としている。
本稿では,サンプル認識とオフリエ拒絶の両方を行う問題に注意を払っている。
本稿では,STAble Memory rePlay (STAMP) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2024-07-22T16:25:41Z) - Test Oracle Automation in the era of LLMs [52.69509240442899]
大規模言語モデル(LLM)は、多様なソフトウェアテストタスクに取り組むのに顕著な能力を示した。
本研究の目的は, 各種のオラクル生成時に生じる課題とともに, LLMs によるオラクルの自動化の可能性について検討することである。
論文 参考訳(メタデータ) (2024-05-21T13:19:10Z) - Appeal: Allow Mislabeled Samples the Chance to be Rectified in Partial Label Learning [55.4510979153023]
部分ラベル学習(PLL)では、各インスタンスは候補ラベルのセットに関連付けられ、そのうち1つだけが接地真実である。
誤記されたサンプルの「アペアル」を支援するため,最初の魅力に基づくフレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-18T09:09:52Z) - Robust Positive-Unlabeled Learning via Noise Negative Sample
Self-correction [48.929877651182885]
正および未ラベルのデータから学ぶことは、文学における正の未ラベル(PU)学習として知られている。
本研究では,人間の学習の性質を動機とした学習戦略を取り入れた,新しい堅牢なPU学習手法を提案する。
論文 参考訳(メタデータ) (2023-08-01T04:34:52Z) - Perfect is the enemy of test oracle [1.457696018869121]
テストのオーラクルは、テストが失敗する(バグを検出する)か通過するかを判断するために、正しい動作とバギーな動作を区別できる地平線に依存しています。
本稿では,テストアサーションが存在しない場合には,テスト対象のメソッド(MUT)で単体テストが通過するか失敗するかを判定できる,学習に基づくSEERを提案する。
さまざまなオープンソースのJavaプロジェクトから5K以上のユニットテストにSEERを適用する実験は、生成したオラクルがフェールやパスラベルを予測するのに有効であることを示している。
論文 参考訳(メタデータ) (2023-02-03T01:49:33Z) - AEON: A Method for Automatic Evaluation of NLP Test Cases [37.71980769922552]
AEONを用いて、典型的な3つのNLPタスクにわたる5つのデータセット上で4つの一般的なテスト手法によって生成されたテストケースを評価する。
AEONは、セマンティックな不整合テストケースの検出において、最高の平均精度を達成し、最高のベースラインメトリックを10%上回る。
AEONはまた、不自然なテストケースを見つけるための平均的な精度も高く、ベースラインを15%以上越えている。
論文 参考訳(メタデータ) (2022-05-13T03:47:13Z) - Deep Active Learning via Open Set Recognition [0.0]
多くのアプリケーションでは、データは簡単に取得できるが、顕著な例を示すのに高価で時間がかかる。
オープンセット認識問題として能動的学習を定式化する。
現在のアクティブな学習方法とは異なり、我々のアルゴリズムはタスクラベルを必要とせずにタスクを学習することができる。
論文 参考訳(メタデータ) (2020-07-04T22:09:17Z) - Detection of Coincidentally Correct Test Cases through Random Forests [1.2891210250935143]
そこで本研究では,アンサンブル学習と教師付き学習アルゴリズム,すなわちランダムフォレスト(RF)を組み合わせたハイブリッド手法を提案する。
また、偶然の正しいテストケースを、テスト状態の反転やトリミング(すなわち、計算から排除)のコスト効率良く解析する。
論文 参考訳(メタデータ) (2020-06-14T15:01:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。