Fugu-MT 論文翻訳(概要): Improving Deep Assertion Generation via Fine-Tuning Retrieval-Augmented Pre-trained Language Models

論文の概要: Improving Deep Assertion Generation via Fine-Tuning Retrieval-Augmented Pre-trained Language Models

arxiv url: http://arxiv.org/abs/2502.16071v1
Date: Sat, 22 Feb 2025 04:17:04 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-25 22:36:55.961138
Title: Improving Deep Assertion Generation via Fine-Tuning Retrieval-Augmented Pre-trained Language Models
Title（参考訳）: 微調整検索型事前学習言語モデルによる深部挿入生成の改善
Authors: Quanjun Zhang, Chunrong Fang, Yi Zheng, Yaxin Zhang, Yuan Zhao, Rubing Huang, Jianyi Zhou, Yun Yang, Tao Zheng, Zhenyu Chen,
Abstract要約: RetriGenは検索強化されたディープアサーション生成アプローチである。我々はRetriGenを6つの最先端アプローチに対して評価する実験を行っている。
参考スコア（独自算出の注目度）: 20.71745514142851
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Unit testing validates the correctness of the units of the software system under test and serves as the cornerstone in improving software quality and reliability. To reduce manual efforts in writing unit tests, some techniques have been proposed to automatically generate test assertions, with recent integration-based approaches considered state-of-the-art. Despite being promising, such integration-based approaches face several limitations, including reliance on lexical matching for assertion retrieval and a limited training corpus for assertion generation. This paper proposes a novel retrieval-augmented deep assertion generation approach, namely RetriGen, based on a hybrid retriever and a pre-trained language model (PLM)-based generator. Given a focal-test, RetriGen first builds a hybrid assertion retriever to search for the most relevant Test-Assert Pair from external codebases. The retrieval process considers lexical similarity and semantical similarity via a token-based and an embedding-based retriever, respectively. RetriGen then treats assertion generation as a sequence-to-sequence task and designs a PLM-based assertion generator to predict a correct assertion. We conduct extensive experiments to evaluate RetriGen against six state-of-the-art approaches across two large-scale datasets and two metrics. The results demonstrate that RetriGen achieves 57.66% accuracy and 73.24% CodeBLEU, outperforming all baselines with average improvements of 50.66% and 14.14%, respectively.
Abstract（参考訳）: 単体テストは、テスト中のソフトウェアシステムのユニットの正しさを検証し、ソフトウェアの品質と信頼性を改善するための基盤となる。単体テストを書く際の手作業を減らすため、テストアサーションを自動生成する手法が提案されている。有望であるにもかかわらず、このような統合ベースのアプローチは、アサーション検索のための語彙マッチングへの依存や、アサーション生成のための限定的なトレーニングコーパスなど、いくつかの制限に直面している。本稿では,ハイブリッドレトリバーとプレトレーニング言語モデル(PLM)に基づく新たな検索強化深層アサーション生成手法,すなわちRetriGenを提案する。フォーカステストが与えられた後、RetriGenはまず、外部コードベースから最も関連性の高いTest-Assert Pairを検索するハイブリッドアサーションレトリバーを構築した。検索プロセスは、それぞれトークンベースと埋め込みベースレトリバーを介して語彙的類似性と意味的類似性を考察する。 RetriGenは、アサーション生成をシーケンス・ツー・シーケンスタスクとして扱い、正しいアサーションを予測するためにPLMベースのアサーションジェネレータを設計する。 2つの大規模データセットと2つのメトリクスにわたる6つの最先端アプローチに対して、RetriGenを評価するための広範な実験を行う。その結果、RetriGenは57.66%の精度と73.24%のCodeBLEUを達成し、平均50.66%、14.14%の精度で全てのベースラインを上回った。

関連論文リスト

Learning to Solve and Verify: A Self-Play Framework for Code and Test Generation [69.62857948698436]
大規模言語モデル(LLM)の最近の進歩は、コーディングベンチマークのパフォーマンスを改善している。しかし、手軽に利用できる高品質なデータの枯渇により、改善は停滞している。本稿では,単一モデルのコードとテスト生成能力を共同で改善するセルフプレイ・ソルバ検証フレームワークであるSol-Verを提案する。
論文参考訳（メタデータ） (2025-02-20T18:32:19Z)
Improving Retrieval-Augmented Deep Assertion Generation via Joint Training [21.2001651233287]
検索強化された自動アサーション生成手法 AG-RAG を提案する。 AG-RAGは、関連するテスト-アサートペア(TAP)をセマンティックマッチングで検索するために、密集したレトリバーを構築する。我々はAG-RAGを2つのベンチマークと3つのメトリクスに関する6つの最先端のAGアプローチに対して広範囲に評価する。
論文参考訳（メタデータ） (2025-02-15T07:02:27Z)
Chain-of-Retrieval Augmented Generation [72.06205327186069]
本稿では,o1-like RAGモデルを学習し,最終回答を生成する前に段階的に関連情報を抽出・推論する手法を提案する。提案手法であるCoRAGは,進化状態に基づいて動的にクエリを再構成する。
論文参考訳（メタデータ） (2025-01-24T09:12:52Z)
Improving Retrieval-Augmented Code Comment Generation by Retrieving for Generation [3.123049150077741]
本稿では,生成者のフィードバックから学習し,生成のための模範を検索するための新しい学習手法を提案する。検索者が検索したハイスコアな例題とジェネレータが観測した低損失な例題とを合わせることで、検索者は生成したコメントの質を最も良くする例題を検索することができる。
論文参考訳（メタデータ） (2024-08-07T08:32:55Z)
Enriching Automatic Test Case Generation by Extracting Relevant Test Inputs from Bug Reports [10.587260348588064]
BRMinerは,バグレポートから関連するインプットを抽出する従来の手法と組み合わせて,LLM(Large Language Models)を利用した新しいアプローチである。本研究では,Defects4JベンチマークとEvoSuiteやRandoopといったテスト生成ツールを用いたBRMinerの評価を行った。その結果、BRMinerは60.03%の関連入力レート(RIR)と31.71%の関連入力抽出精度(RIEAR)を達成した。
論文参考訳（メタデータ） (2023-12-22T18:19:33Z)
Sequencing Matters: A Generate-Retrieve-Generate Model for Building Conversational Agents [9.191944519634111]
Georgetown InfoSense GroupはTREC iKAT 2023の課題を解決するために活動している。提案手法は, 各カット数, 総合成功率において, nDCG において高い性能を示した。我々のソリューションは、初期回答にLarge Language Models (LLMs) を用いること、BM25による回答基盤、ロジスティック回帰による通過品質フィルタリング、LLMによる回答生成である。
論文参考訳（メタデータ） (2023-11-16T02:37:58Z)
RAP-Gen: Retrieval-Augmented Patch Generation with CodeT5 for Automatic Program Repair [75.40584530380589]
新たな検索型パッチ生成フレームワーク(RAP-Gen)を提案する。 RAP-Gen 以前のバグ修正ペアのリストから取得した関連する修正パターンを明示的に活用する。 RAP-GenをJavaScriptのTFixベンチマークとJavaのCode RefinementとDefects4Jベンチマークの2つのプログラミング言語で評価する。
論文参考訳（メタデータ） (2023-09-12T08:52:56Z)
DORE: Document Ordered Relation Extraction based on Generative Framework [56.537386636819626]
本稿では,既存のDocREモデルの根本原因について検討する。本稿では,モデルが学習しやすく,決定論的な関係行列から記号列と順序列を生成することを提案する。 4つのデータセットに対する実験結果から,提案手法は生成型DocREモデルの性能を向上させることができることが示された。
論文参考訳（メタデータ） (2022-10-28T11:18:10Z)
Generating Accurate Assert Statements for Unit Test Cases using Pretrained Transformers [10.846226514357866]
単体テストは、ソフトウェアテストピラミッドの基礎となる基礎である。正確で有用なアサーション文を生成することによって、開発者が単体テストケースを書くのを支援するアプローチを提案する。
論文参考訳（メタデータ） (2020-09-11T19:35:09Z)
POINTER: Constrained Progressive Text Generation via Insertion-based Generative Pre-training [93.79766670391618]
ハードコントラストテキスト生成のための新しい挿入ベースアプローチであるPOINTERを提案する。提案手法は,既存のトークン間で段階的に新しいトークンを並列に挿入することによって動作する。結果として生じる粗大な階層構造は、生成プロセスを直感的で解釈可能である。
論文参考訳（メタデータ） (2020-05-01T18:11:54Z)
Self-Adversarial Learning with Comparative Discrimination for Text Generation [111.18614166615968]
本稿では,テキスト生成におけるGANの性能向上のための,新たな自己逆学習(SAL)パラダイムを提案する。トレーニング中、SALは、現在生成された文が以前生成されたサンプルより優れていると判断されたときにジェネレータに報酬を与える。テキスト生成ベンチマークデータセットの実験により,提案手法は品質と多様性の両方を大幅に改善することが示された。
論文参考訳（メタデータ） (2020-01-31T07:50:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。