論文の概要: Large Language Models for Software Testing: A Research Roadmap
- arxiv url: http://arxiv.org/abs/2509.25043v1
- Date: Mon, 29 Sep 2025 16:58:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:20.143326
- Title: Large Language Models for Software Testing: A Research Roadmap
- Title(参考訳): ソフトウェアテストのための大規模言語モデル:研究ロードマップ
- Authors: Cristian Augusto, Antonia Bertolino, Guglielmo De Angelis, Francesca Lonetti, Jesús Morán,
- Abstract要約: 大規模言語モデル(LLM)は、ソフトウェアテスト分野で最も重要な破壊の1つとしてプロファイルされ始めている。
LLMは、テストコードの生成やドキュメントの要約など、ソフトウェアテストタスクにうまく適用されています。
- 参考スコア(独自算出の注目度): 3.264404947368307
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) are starting to be profiled as one of the most significant disruptions in the Software Testing field. Specifically, they have been successfully applied in software testing tasks such as generating test code, or summarizing documentation. This potential has attracted hundreds of researchers, resulting in dozens of new contributions every month, hardening researchers to stay at the forefront of the wave. Still, to the best of our knowledge, no prior work has provided a structured vision of the progress and most relevant research trends in LLM-based testing. In this article, we aim to provide a roadmap that illustrates its current state, grouping the contributions into different categories, and also sketching the most promising and active research directions for the field. To achieve this objective, we have conducted a semi-systematic literature review, collecting articles and mapping them into the most prominent categories, reviewing the current and ongoing status, and analyzing the open challenges of LLM-based software testing. Lastly, we have outlined several expected long-term impacts of LLMs over the whole software testing field.
- Abstract(参考訳): 大規模言語モデル(LLM)は、ソフトウェアテスト分野で最も重要な破壊の1つとしてプロファイルされ始めている。
具体的には、テストコードの生成やドキュメントの要約など、ソフトウェアテストタスクにうまく適用されています。
このポテンシャルは何百人もの研究者を惹きつけ、毎月数十の新たな貢献が生まれ、研究者たちは波の最前線に留まることに固執した。
しかし、私たちの知る限りでは、LLMベースのテストにおける進歩と最も関連する研究動向に関する構造化されたビジョンを提供する先行研究はありませんでした。
本稿では,コントリビューションをさまざまなカテゴリに分類し,最も有望かつ活発な研究方向性をスケッチするロードマップの提供を目的とする。
この目的を達成するため、我々は半体系的な文献レビューを行い、論文を収集し、それらを最も顕著なカテゴリにマッピングし、現在および現在進行中の状況をレビューし、LLMベースのソフトウェアテストのオープンな課題を分析する。
最後に、ソフトウェアテスト分野全体に対するLLMの長期的影響について概説した。
関連論文リスト
- Software Testing with Large Language Models: An Interview Study with Practitioners [2.198430261120653]
ソフトウェアテストにおける大きな言語モデルの使用は、多くのタスクをサポートするにつれて急速に増加しています。
しかし、彼らの採用は構造的なガイダンスよりも非公式な実験に依存していることが多い。
本研究は,ソフトウェアテスト専門家が LLM を用いて,予備的,実践的インフォームドガイドラインを提案する方法について考察する。
論文 参考訳(メタデータ) (2025-10-20T05:06:56Z) - Large Language Models for Unit Testing: A Systematic Literature Review [13.465045964128196]
本稿では,2025年3月までの単体テストにおける大規模言語モデルの適用に関する,最初の体系的な文献レビューを示す。
まず、LLM(例えば、テスト生成とオラクル生成)の恩恵を受ける既存の単体テストタスクを分類する。
次に、モデル利用、適応戦略、ハイブリッドアプローチなど、LLMを単体テスト研究に統合するいくつかの重要な側面について論じる。
論文 参考訳(メタデータ) (2025-06-18T08:11:10Z) - IDA-Bench: Evaluating LLMs on Interactive Guided Data Analysis [60.32962597618861]
IDA-Benchは、多ラウンドの対話シナリオで大規模言語モデルを評価する新しいベンチマークである。
エージェント性能は、最終的な数値出力と人間由来のベースラインを比較して判断する。
最先端のコーディングエージェント(Claude-3.7-thinkingなど)でさえ50%のタスクを成功させ、シングルターンテストでは明らかでない制限を強調している。
論文 参考訳(メタデータ) (2025-05-23T09:37:52Z) - From Selection to Generation: A Survey of LLM-based Active Learning [153.8110509961261]
大きな言語モデル(LLM)は、全く新しいデータインスタンスを生成し、よりコスト効率の良いアノテーションを提供するために使われています。
本調査は,LSMに基づくAL手法の直感的な理解を目指して,研究者や実践者の最新のリソースとして機能することを目的としている。
論文 参考訳(メタデータ) (2025-02-17T12:58:17Z) - A Software Engineering Perspective on Testing Large Language Models: Research, Practice, Tools and Benchmarks [2.8061460833143346]
大規模言語モデル(LLM)は、スタンドアロンツールとしても、現在および将来のソフトウェアシステムのコンポーネントとしても、急速に普及しています。
LLMを2030年のハイテイクシステムや安全クリティカルシステムで使用するためには、厳格なテストを実施する必要がある。
論文 参考訳(メタデータ) (2024-06-12T13:45:45Z) - Prompting Large Language Models to Tackle the Full Software Development Lifecycle: A Case Study [72.24266814625685]
DevEvalでソフトウェア開発ライフサイクル全体にわたって、大きな言語モデル(LLM)のパフォーマンスを調査します。
DevEvalは4つのプログラミング言語、複数のドメイン、高品質なデータ収集、各タスクに対して慎重に設計および検証されたメトリクスを備えている。
GPT-4を含む現在のLLMは、DevEvalで提示される課題を解決できないことが実証研究によって示されている。
論文 参考訳(メタデータ) (2024-03-13T15:13:44Z) - Large Language Models for Generative Information Extraction: A Survey [89.71273968283616]
大規模言語モデル(LLM)は、テキスト理解と生成において顕著な能力を示した。
各種IEサブタスクと技術の観点から,これらの作品を分類して概観する。
我々は,最も先進的な手法を実証的に分析し,LLMによるIEタスクの出現傾向を明らかにする。
論文 参考訳(メタデータ) (2023-12-29T14:25:22Z) - Towards an Understanding of Large Language Models in Software Engineering Tasks [29.30433406449331]
大規模言語モデル(LLM)は、テキスト生成や推論タスクにおける驚くべきパフォーマンスのために、広く注目を集め、研究している。
コード生成などのソフトウェア工学タスクにおけるLLMの評価と最適化が研究の焦点となっている。
本稿では,LLMとソフトウェア工学を組み合わせた研究・製品について包括的に検討・検討する。
論文 参考訳(メタデータ) (2023-08-22T12:37:29Z) - A Comprehensive Overview of Large Language Models [68.22178313875618]
大規模言語モデル(LLM)は、最近自然言語処理タスクにおいて顕著な機能を示した。
本稿では, LLM関連概念の幅広い範囲について, 既存の文献について概説する。
論文 参考訳(メタデータ) (2023-07-12T20:01:52Z) - Sentiment Analysis in the Era of Large Language Models: A Reality Check [69.97942065617664]
本稿では,大規模言語モデル(LLM)の様々な感情分析タスクの実行能力について検討する。
26のデータセット上の13のタスクのパフォーマンスを評価し、ドメイン固有のデータセットに基づいて訓練された小言語モデル(SLM)と比較した。
論文 参考訳(メタデータ) (2023-05-24T10:45:25Z) - Fairness Testing: A Comprehensive Survey and Analysis of Trends [30.637712832450525]
機械学習(ML)ソフトウェアの不公平な振る舞いは、ソフトウェアエンジニアの間で注目と関心が高まっている。
本稿では,本分野における既存研究を包括的に調査する。
論文 参考訳(メタデータ) (2022-07-20T22:41:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。