論文の概要: Relevant information in TDD experiment reporting
- arxiv url: http://arxiv.org/abs/2406.06405v1
- Date: Mon, 10 Jun 2024 15:57:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-11 13:09:08.305068
- Title: Relevant information in TDD experiment reporting
- Title(参考訳): TDD実験報告における関連情報
- Authors: Fernando Uyaguari, Silvia T. Acuña, John W. Castro, Davide Fucci, Oscar Dieste, Sira Vegas,
- Abstract要約: この記事では、外部品質を研究するTDD実験において、応答変数の操作コンポーネントを特定することを目的としています。
テストスイート、介入タイプ、測定器は、システムマッピング研究(SMS)の測定と結果に影響を及ぼす。
SMSの結果は、TDD実験がテストスイート、テストケース生成方法、あるいは外部品質の測定方法の詳細を報告していないことを確認しています。
- 参考スコア(独自算出の注目度): 40.670930098576775
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Experiments are a commonly used method of research in software engineering (SE). Researchers report their experiments following detailed guidelines. However, researchers do not, in the field of test-driven development (TDD) at least, specify how they operationalized the response variables and the measurement process. This article has three aims: (i) identify the response variable operationalization components in TDD experiments that study external quality; (ii) study their influence on the experimental results;(ii) determine if the experiment reports describe the measurement process components that have an impact on the results. Sequential mixed method. The first part of the research adopts a quantitative approach applying a statistical an\'alisis (SA) of the impact of the operationalization components on the experimental results. The second part follows on with a qualitative approach applying a systematic mapping study (SMS). The test suites, intervention types and measurers have an influence on the measurements and results of the SA of TDD experiments in SE. The test suites have a major impact on both the measurements and the results of the experiments. The intervention type has less impact on the results than on the measurements. While the measurers have an impact on the measurements, this is not transferred to the experimental results. On the other hand, the results of our SMS confirm that TDD experiments do not usually report either the test suites, the test case generation method, or the details of how external quality was measured. A measurement protocol should be used to assure that the measurements made by different measurers are similar. It is necessary to report the test cases, the experimental task and the intervention type in order to be able to reproduce the measurements and SA, as well as to replicate experiments and build dependable families of experiments.
- Abstract(参考訳): 実験は、ソフトウェア工学(SE)における研究の一般的な方法である。
研究者たちは詳細なガイドラインに従って実験を報告します。
しかしながら、少なくともテスト駆動開発(TDD)の分野では、レスポンス変数と測定プロセスをどのように運用したかは、研究者は明記していない。
この記事には3つの目的がある。
一 外部品質を研究するTDD実験において、応答変数の操作コンポーネントを特定すること。
二 実験結果に影響を及ぼすこと。
二 実験報告が結果に影響を及ぼす測定工程成分を記述しているかを判定する。
連続混合法。
研究の第1部では, 実験結果に対する操作成分の影響の統計的アナリシス(SA)を適用した定量的アプローチを採用している。
第2部は、系統地図研究(SMS)を適用した定性的なアプローチで続く。
テストスイート、介入タイプ、測定器は、SEにおけるTDD実験のSAの測定と結果に影響を与えます。
テストスイートは、測定結果と実験結果の両方に大きな影響を与えます。
介入タイプは測定結果よりも影響が少ない。
測定器は測定に影響を及ぼすが、これは実験結果に転送されない。
一方,SMSの結果から,TDD実験ではテストスイートやテストケース生成方法,あるいは外部品質の測定方法の詳細が報告されないことが確認された。
測定プロトコルは、異なる測定器による測定が類似していることを保証するために使用すべきである。
テストケース,実験課題,介入タイプを報告し,測定とSAを再現し,実験を再現し,信頼性の高い実験ファミリを構築することが必要である。
関連論文リスト
- Variance reduction combining pre-experiment and in-experiment data [0.0]
オンライン制御実験(A/Bテスト)は、多くの企業にとって、データ駆動による意思決定に不可欠である。
CUPEDやCUPACのような既存の手法では、実験前のデータを使って分散を減らすが、その効果は実験前のデータと結果の相関に依存する。
実験前データと実験内データを組み合わせて, CUPED や CUPAC よりも高分散化を実現する手法を提案する。
論文 参考訳(メタデータ) (2024-10-11T17:45:29Z) - Identification of Single-Treatment Effects in Factorial Experiments [0.0]
実験において複数の介入がランダム化されている場合、実験環境外において単一の介入が与える影響は、不在の英雄的仮定とは見なされないことを示す。
観測研究と要因実験は、ゼロおよび複数介入による潜在的アウトカム分布に関する情報を提供する。
この種の設計に頼っている研究者は、関数形式の線形性を正当化するか、あるいはDirected Acyclic Graphsで変数が実世界でどのように関連しているかを特定する必要がある。
論文 参考訳(メタデータ) (2024-05-16T04:01:53Z) - Assessing effect sizes, variability, and power in the on-line study of language production [0.0]
実験室とオンラインで行った同じ単語生成実験で得られた応答時間データを比較した。
実験の過程における応答の整合性において,2つの設定が効果の大きさで異なるか否かを判定する。
一連のシミュレーションにおいて,これらの違いが設計のパワーに与える影響を評価する。
論文 参考訳(メタデータ) (2024-03-19T11:49:03Z) - Adaptive Instrument Design for Indirect Experiments [48.815194906471405]
RCTとは異なり、間接的な実験は条件付き機器変数を利用して治療効果を推定する。
本稿では,データ収集ポリシーを適応的に設計することで,間接実験におけるサンプル効率の向上に向けた最初のステップについて述べる。
我々の主な貢献は、影響関数を利用して最適なデータ収集ポリシーを探索する実用的な計算手順である。
論文 参考訳(メタデータ) (2023-12-05T02:38:04Z) - Choosing a Proxy Metric from Past Experiments [54.338884612982405]
多くのランダム化実験では、長期的な計量の処理効果は測定が困難または不可能であることが多い。
一般的な方法は、いくつかの短期的プロキシメトリクスを計測して、長期的メトリックを綿密に追跡することである。
ランダム化実験の同種集団において最適なプロキシメトリックを定義し構築するための新しい統計フレームワークを導入する。
論文 参考訳(メタデータ) (2023-09-14T17:43:02Z) - Learning sources of variability from high-dimensional observational
studies [41.06757602546625]
因果推論は、変数の存在が観測結果に影響を及ぼすかどうかを研究する。
我々の研究は、任意の次元または可測空間を持つ結果に対する因果推定を一般化する。
本稿では,一貫した条件付き独立性テストを調整するための簡単な手法を提案する。
論文 参考訳(メタデータ) (2023-07-26T00:01:16Z) - SPOT: Sequential Predictive Modeling of Clinical Trial Outcome with
Meta-Learning [67.8195828626489]
臨床試験は薬物開発に不可欠であるが、時間を要する、費用がかかる、失敗する傾向がある。
本稿では,まず,複数ソースの臨床試験データを関連するトライアルトピックにクラスタリングするために,臨床トライアル結果の逐次予測mOdeling(SPOT)を提案する。
タスクとして各トライアルシーケンスを考慮して、メタ学習戦略を使用して、モデルが最小限のアップデートで新しいタスクに迅速に適応できるポイントを達成する。
論文 参考訳(メタデータ) (2023-04-07T23:04:27Z) - Experimentally determining the incompatibility of two qubit measurements [55.41644538483948]
2つの量子ビット測定の不整合性を評価するための実験的な手順を記述し、実現した。
この事実を光学的に証明し、量子ビット状態が光子の偏光度に符号化される。
論文 参考訳(メタデータ) (2021-12-15T19:01:44Z) - Dynamic Causal Effects Evaluation in A/B Testing with a Reinforcement
Learning Framework [68.96770035057716]
A/Bテスト(A/B Testing)は、新しい製品を製薬、技術、伝統産業の古い製品と比較するビジネス戦略である。
本稿では,オンライン実験においてA/Bテストを実施するための強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-05T10:25:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。