論文の概要: MR-Coupler: Automated Metamorphic Test Generation via Functional Coupling Analysis
- arxiv url: http://arxiv.org/abs/2604.10126v2
- Date: Fri, 17 Apr 2026 00:57:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 13:38:49.198315
- Title: MR-Coupler: Automated Metamorphic Test Generation via Functional Coupling Analysis
- Title(参考訳): MR-Coupler:機能結合解析によるメタモルフィックテストの自動生成
- Authors: Congying Xu, Hengcheng Zhu, Songqiang Chen, Jiarong Wu, Valerio Terragni, Shing-Chi Cheung,
- Abstract要約: メタモルフィックテストケース(MTC)を自動構築する手法間の機能的結合を利用する新しい手法を提案する。
MR-Couplerは,機能的に結合した手法ペアを同定し,大規模言語モデルを用いて候補MCCを生成し,試験増幅と突然変異解析により検証する。
100個の人書きMCCと50個の実世界のバグに対するMR-Couplerの評価は、タスクの90%以上に対して有効なMCCを生成し、有効なMCC生成を64.90%改善し、ベースラインと比較して誤報を36.56%低減したことを示している。
- 参考スコア(独自算出の注目度): 6.084056210043934
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Metamorphic testing (MT) is a widely recognized technique for alleviating the oracle problem in software testing. However, its adoption is hindered by the difficulty of constructing effective metamorphic relations (MRs), which often require domain-specific or hard-to-obtain knowledge. In this work, we propose a novel approach that leverages the functional coupling between methods, which is readily available in source code, to automatically construct MRs and generate metamorphic test cases (MTCs). Our technique, MR-Coupler, identifies functionally coupled method pairs, employs large language models to generate candidate MTCs, and validates them through test amplification and mutation analysis. In particular, we leverage three functional coupling features to avoid expensive enumeration of possible method pairs, and a novel validation mechanism to reduce false alarms. Our evaluation of MR-Coupler on 100 human-written MTCs and 50 real-world bugs shows that it generates valid MTCs for over 90% of tasks, improves valid MTC generation by 64.90%, and reduces false alarms by 36.56% compared to baselines. Furthermore, the MTCs generated by MR-Coupler detect 44% of the real bugs. Our results highlight the effectiveness of leveraging functional coupling for automated MR construction and the potential of MR-Coupler to facilitate the adoption of MT in practice. We also released the tool and experimental data to support future research.
- Abstract(参考訳): メタモルフィックテスト(MT)は、ソフトウェアテストにおけるオラクルの問題を緩和する技術として広く認知されている。
しかし、その採用は、しばしばドメイン固有の知識や難解な知識を必要とする効果的なメタモルフィック関係(MR)を構築することの難しさによって妨げられている。
本研究では,ソースコードで容易に利用できるメソッド間の機能的結合を利用してMRを自動構築し,メタモルフィックテストケース(MTC)を生成する手法を提案する。
MR-Couplerは,機能的に結合した手法ペアを同定し,大規模言語モデルを用いて候補MCCを生成し,試験増幅と突然変異解析により検証する。
特に、3つの機能的結合機能を活用して、起こりうるメソッドペアの高価な列挙を回避し、偽アラームを減らすための新しいバリデーション機構を提案する。
100個の人書きMCCと50個の実世界のバグに対するMR-Couplerの評価は、タスクの90%以上に対して有効なMCCを生成し、有効なMCC生成を64.90%改善し、ベースラインと比較して誤報を36.56%低減したことを示している。
さらにMR-Couplerが生成したMCCは、実際のバグの44%を検知する。
本研究は, 自動MR構築における機能結合の活用の有効性と, MT導入を促進するMR-Couplerの可能性を明らかにするものである。
また、今後の研究を支援するためのツールと実験データもリリースしました。
関連論文リスト
- Beyond Raw Detection Scores: Markov-Informed Calibration for Boosting Machine-Generated Text Detection [105.14032334647932]
機械生成テキスト(MGT)は偽情報やフィッシングなどのリスクを生じさせ、信頼性の高い検出の必要性を強調している。
MGTの統計的に区別可能な特徴を抽出するメトリックベース法は、オーバーフィットしがちな複雑なモデルベース法よりも実用的であることが多い。
本稿では,2つのコンテキスト検出スコアの関係をモデル化したマルコフ情報を用いたスコアキャリブレーション手法を提案する。
論文 参考訳(メタデータ) (2026-02-08T16:06:12Z) - Towards Generating Executable Metamorphic Relations Using Large Language Models [46.26208489175692]
大規模言語モデル(LLM)を用いた要件から実行可能なMRを自動的に抽出する手法を提案する。
提案手法の有効性を評価するため,シーメンス・インダストリー・ソフトウェアと共同で質問紙調査を行った。
論文 参考訳(メタデータ) (2024-01-30T13:52:47Z) - GenMorph: Automatically Generating Metamorphic Relations via Genetic Programming [14.417892080404544]
GenMorphはJavaメソッドのメタモーフィックリレーション(MR)を自動的に生成するテクニックである。
進化的アルゴリズムを使って、有効なオーラクルを探索し、誤報を起こさず、テスト中のメソッドにソフトウェア欠陥を暴露する。
以上の結果から,GenMorphは23手法中18手法に対して有効MRを生成できる(突然変異スコアは20%)。
論文 参考訳(メタデータ) (2023-12-23T17:20:45Z) - Towards a Complete Metamorphic Testing Pipeline [56.75969180129005]
システムアンダーテスト(SUT)の連続実行における入出力ペア間の関係を調べてテストオラクル問題に対処するメタモルフィックテスト(MT)
これらの関係は、メタモルフィック関係 (MRs) と呼ばれ、特定の入力変化に起因する期待される出力変化を規定する。
本研究の目的は,MR の生成,制約の定義,MR 結果の説明可能性の提供を支援する手法とツールの開発である。
論文 参考訳(メタデータ) (2023-09-30T10:49:22Z) - Exploring a Test Data-Driven Method for Selecting and Constraining
Metamorphic Relations [46.889513596156185]
本稿では,メタトリマーの予備評価について述べる。メタトリマーは,テストデータに基づくメタモルフィック関係の選択と制約を行う手法である。
MetaTrimmerの新規性は、MRの適用性に関してラベル付きデータセットを必要とする複雑な予測モデルを避けることである。
予備評価では、MetaTrimmerが既存の制限を克服し、MRの有効性を高める可能性を示している。
論文 参考訳(メタデータ) (2023-07-28T12:27:34Z) - Progressive-Hint Prompting Improves Reasoning in Large Language Models [63.98629132836499]
本稿では,プログレッシブ・ヒント・プロンプト(PHP)と呼ばれる新しいプロンプト手法を提案する。
事前に生成された回答をヒントとして使用することで、ユーザとLLM(Large Language Models)間の自動多元的対話を可能にする。
我々は7つのベンチマークで広範囲かつ包括的な実験を行った。その結果、PHPは高い効率を保ちながら精度を大幅に向上することが示された。
論文 参考訳(メタデータ) (2023-04-19T16:29:48Z) - MR-Scout: Automated Synthesis of Metamorphic Relations from Existing Test Cases [9.00297842984345]
オープンソースソフトウェアプロジェクトのテストケースからMRを自動的に合成するMR-Scoutを提案する。
符号化されたMRの97%以上は、自動テストケース生成に高品質である。
我々の質的研究は、コード化されたMRの55.76%から76.92%が開発者にとって容易に理解可能であることを示している。
論文 参考訳(メタデータ) (2023-04-15T12:53:32Z) - Error Analysis Prompting Enables Human-Like Translation Evaluation in Large Language Models [57.80514758695275]
機械翻訳(MT)の品質を評価するために,大規模言語モデル(LLM)を用いることで,システムレベルでの最先端のパフォーマンスを実現する。
我々はtextbftexttError Analysis Prompting (EAPrompt) と呼ばれる新しいプロンプト手法を提案する。
本手法は,多次元品質指標 (MQM) とtextitproduces を用いて,システムレベルとセグメントレベルの両方で説明可能かつ信頼性の高いMT評価を行う。
論文 参考訳(メタデータ) (2023-03-24T05:05:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。