論文の概要: Revisiting and Improving Retrieval-Augmented Deep Assertion Generation
- arxiv url: http://arxiv.org/abs/2309.10264v1
- Date: Tue, 19 Sep 2023 02:39:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 07:08:15.102491
- Title: Revisiting and Improving Retrieval-Augmented Deep Assertion Generation
- Title(参考訳): 検索型深部沈降生成の再検討と改善
- Authors: Weifeng Sun, Hongyan Li, Meng Yan, Yan Lei, Hongyu Zhang
- Abstract要約: 単体テストはソフトウェア開発プロセスにおいて重要な活動となっている。
Yuらは単体テストのためのアサーションを生成する統合的なアプローチ(略して積分)を提案した。
有望であるにもかかわらず、なぜ統合が機能するのか、それとも機能しないのかについては、いまだに知識のギャップがあります。
- 参考スコア(独自算出の注目度): 13.373681113601982
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unit testing validates the correctness of the unit under test and has become
an essential activity in software development process. A unit test consists of
a test prefix that drives the unit under test into a particular state, and a
test oracle (e.g., assertion), which specifies the behavior in that state. To
reduce manual efforts in conducting unit testing, Yu et al. proposed an
integrated approach (integration for short), combining information retrieval
(IR) with a deep learning-based approach, to generate assertions for a unit
test. Despite promising, there is still a knowledge gap as to why or where
integration works or does not work. In this paper, we describe an in-depth
analysis of the effectiveness of integration. Our analysis shows that: 1) The
overall performance of integration is mainly due to its success in retrieving
assertions. 2) integration struggles to understand the semantic differences
between the retrieved focal-test (focal-test includes a test prefix and a unit
under test) and the input focal-test; 3) integration is limited to specific
types of edit operations and cannot handle token addition or deletion. To
improve the effectiveness of assertion generation, this paper proposes a novel
retrieve-and-edit approach named EditAS. Specifically, EditAS first retrieves a
similar focal-test from a pre-defined corpus and treats its assertion as a
prototype. Then, EditAS reuses the information in the prototype and edits the
prototype automatically. EditAS is more generalizable than integration. We
conduct experiments on two large-scale datasets and experimental results
demonstrate that EditAS outperforms the state-of-the-art approaches, with an
average improvement of 10.00%-87.48% and 3.30%-42.65% in accuracy and BLEU
score, respectively.
- Abstract(参考訳): 単体テストは、テスト中のユニットの正しさを検証し、ソフトウェア開発プロセスにおいて不可欠な活動となっている。
ユニットテストは、テスト対象のユニットを特定の状態に駆動するテストプレフィックスと、その状態の振る舞いを特定するテストオラクル(例:アサーション)で構成される。
単体テストの実施における手作業を減らすため、Yuらは情報検索(IR)と深層学習に基づくアプローチを組み合わせて、単体テストのアサーションを生成する統合的アプローチ(短期的な統合)を提案した。
将来性はありますが,統合が機能するのか,あるいは機能しないのか,というナレッジギャップは依然としてあります。
本稿では,統合の有効性に関する詳細な分析を行う。
私たちの分析では、
1) 統合の全体的なパフォーマンスは、主にアサーションの回収に成功したためです。
2) 検索された焦点テスト(焦点テストはテスト対象のプレフィックスとテスト対象のユニットを含む。)と入力焦点テストとの意味的差異を理解するのに苦労している。
3) 統合は特定のタイプの編集操作に限定され、トークンの追加や削除は処理できない。
本稿では,アサーション生成の有効性を向上させるために,EditASという新しい検索・編集手法を提案する。
具体的には、EditASは事前に定義されたコーパスから同様のフォーカステストを取得し、そのアサーションをプロトタイプとして扱う。
そして、EditASはプロトタイプの情報を再利用し、自動的にプロトタイプを編集する。
EditASは統合よりも一般化できる。
2つの大規模データセットを実験した結果、editasは最先端のアプローチよりも優れており、それぞれ10.00%-87.48%と3.30%-42.65%の精度とbleuスコアが向上した。
関連論文リスト
- CasModaTest: A Cascaded and Model-agnostic Self-directed Framework for Unit Test Generation [5.450831103980871]
CasModaTestは、カスケードされた、モデルに依存しない、エンドツーエンドのユニットテスト生成フレームワークである。
テストプレフィックスを生成し、オークルをテストし、それらの有効性をチェックするためにコンパイルまたは実行します。
論文 参考訳(メタデータ) (2024-06-22T05:52:39Z) - Active Test-Time Adaptation: Theoretical Analyses and An Algorithm [51.84691955495693]
テスト時間適応(TTA)は、教師なし設定でストリーミングテストデータの分散シフトに対処する。
完全TTA設定内に能動学習を統合する能動テスト時間適応(ATTA)の新たな問題設定を提案する。
論文 参考訳(メタデータ) (2024-04-07T22:31:34Z) - Towards Automatic Generation of Amplified Regression Test Oracles [44.45138073080198]
回帰テストオラクルを増幅するためのテストオラクル導出手法を提案する。
このアプローチはテスト実行中にオブジェクトの状態を監視し、以前のバージョンと比較して、SUTの意図した振る舞いに関連する変更を検出する。
論文 参考訳(メタデータ) (2023-07-28T12:38:44Z) - Pre-trained Embeddings for Entity Resolution: An Experimental Analysis
[Experiment, Analysis & Benchmark] [65.11858854040544]
我々は、17の確立されたベンチマークデータセットに対して、12のポピュラー言語モデルの徹底的な実験分析を行う。
まず、全ての入力エンティティを高密度な埋め込みベクトルに変換するためのベクトル化のオーバーヘッドを評価する。
次に,そのブロッキング性能を調査し,詳細なスケーラビリティ解析を行い,最先端のディープラーニングベースのブロッキング手法と比較する。
第3に、教師なしマッチングと教師なしマッチングの両方に対して、相対的な性能で締めくくります。
論文 参考訳(メタデータ) (2023-04-24T08:53:54Z) - Listen, Adapt, Better WER: Source-free Single-utterance Test-time
Adaptation for Automatic Speech Recognition [65.84978547406753]
Test-time Adaptationは、ソースドメインでトレーニングされたモデルに適応して、テストサンプルの予測を改善することを目的としている。
単一発話テスト時間適応 (SUTA) は音声領域における最初のTTA研究である。
論文 参考訳(メタデータ) (2022-03-27T06:38:39Z) - Reliable Shot Identification for Complex Event Detection via
Visual-Semantic Embedding [72.9370352430965]
本稿では,映像中の事象検出のための視覚的意味的誘導損失法を提案する。
カリキュラム学習に動機付け,高い信頼性の事例で分類器の訓練を開始するために,負の弾性正規化項を導入する。
提案する非ネット正規化問題の解法として,代替最適化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-10-12T11:46:56Z) - ReAssert: Deep Learning for Assert Generation [3.8174671362014956]
本稿では、JUnitテストアサーションの自動生成のためのアプローチであるRE-ASSERTを提案する。
これは、学習に正確なコード・トゥ・テストのトレーサビリティを使用して、プロジェクトを個別にターゲットすることで達成される。
我々はまた、最先端のディープラーニングモデルであるReformerと、ReAssertと既存のアプローチであるATLASを評価するための以前の2つのモデルも利用しています。
論文 参考訳(メタデータ) (2020-11-19T11:55:59Z) - Generating Accurate Assert Statements for Unit Test Cases using
Pretrained Transformers [10.846226514357866]
単体テストは、ソフトウェアテストピラミッドの基礎となる基礎である。
正確で有用なアサーション文を生成することによって、開発者が単体テストケースを書くのを支援するアプローチを提案する。
論文 参考訳(メタデータ) (2020-09-11T19:35:09Z) - Unit Test Case Generation with Transformers and Focal Context [10.220204860586582]
AthenaTestは、現実世界の焦点メソッドと開発者が記述したテストケースから学習することで、単体テストケースを生成することを目的としている。
我々は,Javaにおける単体テストケースメソッドとそれに対応する焦点メソッドの並列コーパスとして最大規模で公開されているMethods2Testを紹介する。
AthenaTestを5つの欠陥4jプロジェクトで評価し、30回の試行で焦点メソッドの43.7%をカバーする25Kパステストケースを生成した。
論文 参考訳(メタデータ) (2020-09-11T18:57:36Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z) - Novel Human-Object Interaction Detection via Adversarial Domain
Generalization [103.55143362926388]
本研究では,新たな人-物間相互作用(HOI)検出の問題点を考察し,モデルの一般化能力を向上させることを目的とした。
この課題は、主に対象と述語の大きな構成空間に起因し、全ての対象と述語の組み合わせに対する十分な訓練データが欠如している。
本稿では,予測のためのオブジェクト指向不変の特徴を学習するために,対数領域の一般化の統一的な枠組みを提案する。
論文 参考訳(メタデータ) (2020-05-22T22:02:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。