論文の概要: Large Language Models for Software Testing: A Research Roadmap
- arxiv url: http://arxiv.org/abs/2509.25043v1
- Date: Mon, 29 Sep 2025 16:58:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:20.143326
- Title: Large Language Models for Software Testing: A Research Roadmap
- Title(参考訳): ソフトウェアテストのための大規模言語モデル:研究ロードマップ
- Authors: Cristian Augusto, Antonia Bertolino, Guglielmo De Angelis, Francesca Lonetti, Jesús Morán,
- Abstract要約: 大規模言語モデル(LLM)は、ソフトウェアテスト分野で最も重要な破壊の1つとしてプロファイルされ始めている。
LLMは、テストコードの生成やドキュメントの要約など、ソフトウェアテストタスクにうまく適用されています。
- 参考スコア(独自算出の注目度): 3.264404947368307
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) are starting to be profiled as one of the most significant disruptions in the Software Testing field. Specifically, they have been successfully applied in software testing tasks such as generating test code, or summarizing documentation. This potential has attracted hundreds of researchers, resulting in dozens of new contributions every month, hardening researchers to stay at the forefront of the wave. Still, to the best of our knowledge, no prior work has provided a structured vision of the progress and most relevant research trends in LLM-based testing. In this article, we aim to provide a roadmap that illustrates its current state, grouping the contributions into different categories, and also sketching the most promising and active research directions for the field. To achieve this objective, we have conducted a semi-systematic literature review, collecting articles and mapping them into the most prominent categories, reviewing the current and ongoing status, and analyzing the open challenges of LLM-based software testing. Lastly, we have outlined several expected long-term impacts of LLMs over the whole software testing field.
- Abstract(参考訳): 大規模言語モデル(LLM)は、ソフトウェアテスト分野で最も重要な破壊の1つとしてプロファイルされ始めている。
具体的には、テストコードの生成やドキュメントの要約など、ソフトウェアテストタスクにうまく適用されています。
このポテンシャルは何百人もの研究者を惹きつけ、毎月数十の新たな貢献が生まれ、研究者たちは波の最前線に留まることに固執した。
しかし、私たちの知る限りでは、LLMベースのテストにおける進歩と最も関連する研究動向に関する構造化されたビジョンを提供する先行研究はありませんでした。
本稿では,コントリビューションをさまざまなカテゴリに分類し,最も有望かつ活発な研究方向性をスケッチするロードマップの提供を目的とする。
この目的を達成するため、我々は半体系的な文献レビューを行い、論文を収集し、それらを最も顕著なカテゴリにマッピングし、現在および現在進行中の状況をレビューし、LLMベースのソフトウェアテストのオープンな課題を分析する。
最後に、ソフトウェアテスト分野全体に対するLLMの長期的影響について概説した。
関連論文リスト
- Large Language Models for Unit Testing: A Systematic Literature Review [13.465045964128196]
本稿では,2025年3月までの単体テストにおける大規模言語モデルの適用に関する,最初の体系的な文献レビューを示す。
まず、LLM(例えば、テスト生成とオラクル生成)の恩恵を受ける既存の単体テストタスクを分類する。
次に、モデル利用、適応戦略、ハイブリッドアプローチなど、LLMを単体テスト研究に統合するいくつかの重要な側面について論じる。
論文 参考訳(メタデータ) (2025-06-18T08:11:10Z) - A Software Engineering Perspective on Testing Large Language Models: Research, Practice, Tools and Benchmarks [2.8061460833143346]
大規模言語モデル(LLM)は、スタンドアロンツールとしても、現在および将来のソフトウェアシステムのコンポーネントとしても、急速に普及しています。
LLMを2030年のハイテイクシステムや安全クリティカルシステムで使用するためには、厳格なテストを実施する必要がある。
論文 参考訳(メタデータ) (2024-06-12T13:45:45Z) - Prompting Large Language Models to Tackle the Full Software Development Lifecycle: A Case Study [72.24266814625685]
DevEvalでソフトウェア開発ライフサイクル全体にわたって、大きな言語モデル(LLM)のパフォーマンスを調査します。
DevEvalは4つのプログラミング言語、複数のドメイン、高品質なデータ収集、各タスクに対して慎重に設計および検証されたメトリクスを備えている。
GPT-4を含む現在のLLMは、DevEvalで提示される課題を解決できないことが実証研究によって示されている。
論文 参考訳(メタデータ) (2024-03-13T15:13:44Z) - Towards an Understanding of Large Language Models in Software Engineering Tasks [29.30433406449331]
大規模言語モデル(LLM)は、テキスト生成や推論タスクにおける驚くべきパフォーマンスのために、広く注目を集め、研究している。
コード生成などのソフトウェア工学タスクにおけるLLMの評価と最適化が研究の焦点となっている。
本稿では,LLMとソフトウェア工学を組み合わせた研究・製品について包括的に検討・検討する。
論文 参考訳(メタデータ) (2023-08-22T12:37:29Z) - A Comprehensive Overview of Large Language Models [68.22178313875618]
大規模言語モデル(LLM)は、最近自然言語処理タスクにおいて顕著な機能を示した。
本稿では, LLM関連概念の幅広い範囲について, 既存の文献について概説する。
論文 参考訳(メタデータ) (2023-07-12T20:01:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。