論文の概要: Test-Case Quality -- Understanding Practitioners' Perspectives
- arxiv url: http://arxiv.org/abs/2309.16801v1
- Date: Thu, 28 Sep 2023 19:10:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 05:37:57.214438
- Title: Test-Case Quality -- Understanding Practitioners' Perspectives
- Title(参考訳): テストケースの品質 -- 実践者の視点を理解する
- Authors: Huynh Khanh Vi Tran, Nauman Bin Ali, J\"urgen B\"orstler, Michael
Unterkalmsteiner
- Abstract要約: 本稿では,11種類のテストケースの品質特性からなる品質モデルを提案する。
我々は,実践者と学業者の間で,テストケースの品質を定義する上でのミスアライメントを特定した。
- 参考スコア(独自算出の注目度): 1.7827643249624088
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Background: Test-case quality has always been one of the major concerns in
software testing. To improve test-case quality, it is important to better
understand how practitioners perceive the quality of test-cases. Objective:
Motivated by that need, we investigated how practitioners define test-case
quality and which aspects of test-cases are important for quality assessment.
Method: We conducted semi-structured interviews with professional developers,
testers and test architects from a multinational software company in Sweden.
Before the interviews, we asked participants for actual test cases (written in
natural language) that they perceive as good, normal, and bad respectively
together with rationales for their assessment. We also compared their opinions
on shared test cases and contrasted their views with the relevant literature.
Results: We present a quality model which consists of 11 test-case quality
attributes. We also identify a misalignment in defining test-case quality among
practitioners and between academia and industry, along with suggestions for
improving test-case quality in industry. Conclusion: The results show that
practitioners' background, including roles and working experience, are critical
dimensions of how test-case quality is defined and assessed.
- Abstract(参考訳): 背景: テストケースの品質は常に、ソフトウェアテストの主要な関心事のひとつです。
テストケースの品質を改善するためには、実践者がテストケースの品質をどのように認識するかをよりよく理解する必要がある。
目的: その必要性から, 実践者がテストケースの品質をどのように定義し, テストケースのどの側面が品質評価に重要であるかを検討した。
方法: スウェーデンの多国籍ソフトウェア企業で, プロの開発者, テスタ, テストアーキテクトと半構造化インタビューを行った。
インタビューの前に,実際のテストケース(自然言語で書かれた)に対して,評価の根拠とともに,それぞれが善,正常,悪と認識しているかどうかを質問した。
また,共有テストケースに対する意見を比較検討し,関連する文献と対比した。
結果:11のテストケース品質特性からなる品質モデルを提案する。
また,実践者や産業界におけるテストケースの品質定義の誤りと,業界におけるテストケースの品質向上を提案する。
結論: その結果は,テストケースの品質の定義と評価に関して,役割や作業経験を含む実践者のバックグラウンドが重要な次元であることを示します。
関連論文リスト
- Multi-Facet Counterfactual Learning for Content Quality Evaluation [48.73583736357489]
コンテンツ品質評価の複数の側面を知覚する評価器を効率的に構築する枠組みを提案する。
我々は,コントラスト学習と教師付き学習に基づく共同学習戦略を活用し,評価者が異なる品質面を区別できるようにする。
論文 参考訳(メタデータ) (2024-10-10T08:04:10Z) - Evaluating the Quality of Hallucination Benchmarks for Large Vision-Language Models [67.89204055004028]
LVLM(Large Vision-Language Models)は幻覚に悩まされている。
以前の研究では、さまざまなタイプのタスクと評価指標を特徴とする一連のベンチマークが提案されている。
本稿では,既存の幻覚ベンチマークの信頼性と妥当性を評価するために,幻覚ベンチマーク品質測定フレームワーク(HQM)を提案する。
論文 参考訳(メタデータ) (2024-06-24T20:08:07Z) - Elevating Software Quality in Agile Environments: The Role of Testing Professionals in Unit Testing [0.0]
テストはソフトウェア開発プロセスにおいて不可欠な品質活動です。
本報告では, 産業環境での単体テストにおけるテストエンジニアの関与について考察する。
論文 参考訳(メタデータ) (2024-03-20T00:41:49Z) - QuRating: Selecting High-Quality Data for Training Language Models [64.83332850645074]
データ品質に関する人間の直感をキャプチャできる事前学習データを選択するQuRatingを導入する。
本稿では,書体,専門知識,事実とトリビア,教育的価値の4つの特性について検討する。
ペアの判断からスカラー評価を学習するためにQurモデルをトレーニングし、それを4つの基準ごとに品質評価付き260Bのトレーニングコーパスにアノテートするために使用します。
論文 参考訳(メタデータ) (2024-02-15T06:36:07Z) - Assessing test artifact quality -- A tertiary study [1.7827643249624088]
我々は、ソフトウェアテストアーティファクトの品質面に関する既存の二次研究を特定し、分析するために、系統的な文献レビューを実施してきた。
テストケース/スーツの品質を調査する環境を特徴付けるのに使用できる文脈次元と要因の集約について述べる。
論文 参考訳(メタデータ) (2024-02-14T19:31:57Z) - Automated Test Case Repair Using Language Models [0.5708902722746041]
欠陥のないテストケースは、テストスイートの品質を低下させ、ソフトウェア開発プロセスを破壊します。
テストケースの自動修復に事前訓練されたコード言語モデルを活用する新しいアプローチであるTaRGetを提案する。
TaRGetは、テスト修復を言語翻訳タスクとして扱い、言語モデルを微調整するために2段階のプロセスを使用する。
論文 参考訳(メタデータ) (2024-01-12T18:56:57Z) - A Survey on What Developers Think About Testing [13.086283144520513]
テストに関する開発者の現在の関与を評価することを目的とした21の質問で、包括的な調査を実施しました。
テストに対する開発者のモチベーションに肯定的かつ否定的に影響を及ぼす理由を見つけました。
これらのネガティブな要因を軽減するための反応から生まれるアプローチのひとつは、開発者のテスト活動に対するより良い認識を提供することだ。
論文 参考訳(メタデータ) (2023-09-03T12:18:41Z) - Test case quality: an empirical study on belief and evidence [8.475270520855332]
良好なテストケースを構成するものについて,8つの仮説を考察する。
最善を尽くしたにも拘わらず、我々はこれらの信念を支持する証拠を見つけることができなかった。
論文 参考訳(メタデータ) (2023-07-12T19:02:48Z) - From Static Benchmarks to Adaptive Testing: Psychometrics in AI Evaluation [60.14902811624433]
本稿では,静的評価手法から適応テストへのパラダイムシフトについて論じる。
これには、ベンチマークで各テスト項目の特性と価値を推定し、リアルタイムでアイテムを動的に調整することが含まれる。
我々は、AI評価にサイコメトリックを採用する現在のアプローチ、アドバンテージ、そして根底にある理由を分析します。
論文 参考訳(メタデータ) (2023-06-18T09:54:33Z) - Exploring the Use of Large Language Models for Reference-Free Text
Quality Evaluation: An Empirical Study [63.27346930921658]
ChatGPTは、参照なしで様々な視点からテキスト品質を効果的に評価することができる。
ChatGPTを用いてテキスト品質を測定するExplicit Scoreは、3つの手法の中で最も効果的で信頼性の高い方法である。
論文 参考訳(メタデータ) (2023-04-03T05:29:58Z) - Measuring Uncertainty in Translation Quality Evaluation (TQE) [62.997667081978825]
本研究は,翻訳テキストのサンプルサイズに応じて,信頼区間を精度良く推定する動機づけた研究を行う。
我々はベルヌーイ統計分布モデリング (BSDM) とモンテカルロサンプリング分析 (MCSA) の手法を適用した。
論文 参考訳(メタデータ) (2021-11-15T12:09:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。