論文の概要: Reinforcement Learning for Test Case Prioritization
- arxiv url: http://arxiv.org/abs/2012.11364v1
- Date: Fri, 18 Dec 2020 11:08:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-01 23:57:33.831424
- Title: Reinforcement Learning for Test Case Prioritization
- Title(参考訳): テストケース優先化のための強化学習
- Authors: Jo\~ao Lousada, Miguel Ribeiro
- Abstract要約: 本稿では,強化学習をテスト戦略に応用する最近の研究について述べる。
我々は、金融機関から抽出された新たなデータに基づいて、新しい環境に適応する能力をテストする。
また,記憶表現のモデルとして決定木(DT)近似器を用いた影響についても検討した。
- 参考スコア(独自算出の注目度): 0.24366811507669126
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In modern software engineering, Continuous Integration (CI) has become an
indispensable step towards systematically managing the life cycles of software
development. Large companies struggle with keeping the pipeline updated and
operational, in useful time, due to the large amount of changes and addition of
features, that build on top of each other and have several developers, working
on different platforms. Associated with such software changes, there is always
a strong component of Testing. As teams and projects grow, exhaustive testing
quickly becomes inhibitive, becoming adamant to select the most relevant test
cases earlier, without compromising software quality. This paper extends recent
studies on applying Reinforcement Learning to optimize testing strategies. We
test its ability to adapt to new environments, by testing it on novel data
extracted from a financial institution, yielding a Normalized percentage of
Fault Detection (NAPFD) of over $0.6$ using the Network Approximator and Test
Case Failure Reward. Additionally, we studied the impact of using Decision Tree
(DT) Approximator as a model for memory representation, which failed to produce
significant improvements relative to Artificial Neural Networks.
- Abstract(参考訳): 現代のソフトウエアエンジニアリングでは、継続的インテグレーション(CI)はソフトウェア開発のライフサイクルを体系的に管理するために必要なステップになっています。
大規模な企業はパイプラインの更新と運用の維持に苦労し、多くの変更と機能の追加によって、さまざまなプラットフォームで作業する開発者を抱えている。
このようなソフトウェア変更に関連して、テストには必ず強力なコンポーネントがあります。
チームやプロジェクトが成長するにつれて、徹底的なテストはすぐに阻害的になり、ソフトウェア品質を損なうことなく、最も適切なテストケースを先に選択するようになる。
本稿では,強化学習をテスト戦略に応用する最近の研究について述べる。
我々は,金融機関から抽出された新たなデータを用いて,ネットワーク近似器とテストケースエラーリワードを用いて,障害検出の正規化率(NAPFD)を0.6ドル以上とすることで,新しい環境に適応する能力をテストする。
さらに,記憶表現モデルとして決定木(dt)近似器を用いた場合の影響について検討したが,ニューラルネットワークと比較して大きな改善は得られなかった。
関連論文リスト
- The Future of Software Testing: AI-Powered Test Case Generation and Validation [0.0]
本稿では、テストケースの生成と検証を改善する上で、AIが持つ変革の可能性について考察する。
テストプロセスの効率性、正確性、スケーラビリティを高める能力に重点を置いている。
また、高品質なトレーニングデータの必要性など、テストにAIを適用する際の重要な課題にも対処している。
論文 参考訳(メタデータ) (2024-09-09T17:12:40Z) - Which Combination of Test Metrics Can Predict Success of a Software Project? A Case Study in a Year-Long Project Course [1.553083901660282]
テストはソフトウェア開発プロジェクトの成功を保証する上で重要な役割を担います。
種々のテストが機能的適合性に与える影響を定量化できるかどうかを検討する。
論文 参考訳(メタデータ) (2024-08-22T04:23:51Z) - Leveraging Large Language Models for Efficient Failure Analysis in Game Development [47.618236610219554]
本稿では,テストの失敗の原因となるコードの変更を自動的に識別する手法を提案する。
このメソッドは、LLM(Large Language Models)を利用して、エラーメッセージと対応するコード変更を関連付ける。
当社のアプローチは新たに作成したデータセットで71%の精度に達しています。
論文 参考訳(メタデータ) (2024-06-11T09:21:50Z) - Fuzzy Inference System for Test Case Prioritization in Software Testing [0.0]
テストケース優先順位付け(TCP)は、テスト効率を高めるための重要な戦略である。
本稿では,新しいファジィ論理に基づくTCP自動化手法を提案する。
論文 参考訳(メタデータ) (2024-04-25T08:08:54Z) - TeST: Test-time Self-Training under Distribution Shift [99.68465267994783]
Test-Time Self-Training (TeST)は、あるソースデータとテスト時の新しいデータ分散に基づいてトレーニングされたモデルを入力する技術である。
また,TeSTを用いたモデルでは,ベースラインテスト時間適応アルゴリズムよりも大幅に改善されていることがわかった。
論文 参考訳(メタデータ) (2022-09-23T07:47:33Z) - Improving the Performance of Robust Control through Event-Triggered
Learning [74.57758188038375]
LQR問題における不確実性に直面していつ学習するかを決定するイベントトリガー学習アルゴリズムを提案する。
本研究では,ロバストな制御器ベースライン上での性能向上を数値例で示す。
論文 参考訳(メタデータ) (2022-07-28T17:36:37Z) - SUPERNOVA: Automating Test Selection and Defect Prevention in AAA Video
Games Using Risk Based Testing and Machine Learning [62.997667081978825]
従来の手法では、成長するソフトウェアシステムではスケールできないため、ビデオゲームのテストはますます難しいタスクになります。
自動化ハブとして機能しながら,テスト選択と欠陥防止を行うシステム SUPERNOVA を提案する。
この直接的な影響は、未公表のスポーツゲームタイトルの55%以上のテスト時間を減らすことが観察されている。
論文 参考訳(メタデータ) (2022-03-10T00:47:46Z) - MEMO: Test Time Robustness via Adaptation and Augmentation [131.28104376280197]
テスト時間ロバスト化の問題、すなわちモデルロバスト性を改善するためにテストインプットを用いて検討する。
最近の先行研究ではテスト時間適応法が提案されているが、それぞれ追加の仮定を導入している。
モデルが確率的で適応可能な任意のテスト環境で使用できるシンプルなアプローチを提案する。
論文 参考訳(メタデータ) (2021-10-18T17:55:11Z) - Federated Learning with Unreliable Clients: Performance Analysis and
Mechanism Design [76.29738151117583]
Federated Learning(FL)は、分散クライアント間で効果的な機械学習モデルをトレーニングするための有望なツールとなっている。
しかし、低品質のモデルは信頼性の低いクライアントによってアグリゲータサーバにアップロードすることができ、劣化やトレーニングの崩壊につながる。
クライアントの信頼できない振る舞いをモデル化し、このようなセキュリティリスクを軽減するための防御メカニズムを提案する。
論文 参考訳(メタデータ) (2021-05-10T08:02:27Z) - Neural Network Embeddings for Test Case Prioritization [0.24366811507669126]
NNE-TCP(Neural Network Embeeding for Test Case Prioritization)という新しいツールを開発しました。
NNE-TCPは、テスト状態遷移時にどのファイルが修正されたかを分析し、これらのファイルとテストの関係を多次元ベクトルにマッピングすることで学習する。
我々は、修正されたファイルとテストの間の接続が他の従来の方法と比較して適切で競争力があることを初めて示す。
論文 参考訳(メタデータ) (2020-12-18T10:33:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。