論文の概要: Teaching Software Metrology: The Science of Measurement for Software Engineering
- arxiv url: http://arxiv.org/abs/2406.14494v1
- Date: Thu, 20 Jun 2024 16:57:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-21 12:33:17.545151
- Title: Teaching Software Metrology: The Science of Measurement for Software Engineering
- Title(参考訳): ソフトウェアメトロロジーを教える:ソフトウェア工学のための計測の科学
- Authors: Paul Ralph, Miikka Kuutila, Hera Arif, Bimpe Ayoola,
- Abstract要約: この章は測定の科学における重要な概念をレビューし、それらをソフトウェア工学の研究に適用する。
読者の研究に重要な測定概念を適用するための一連の演習を含む。
- 参考スコア(独自算出の注目度): 10.23712090082156
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While the methodological rigor of computing research has improved considerably in the past two decades, quantitative software engineering research is hampered by immature measures and inattention to theory. Measurement-the principled assignment of numbers to phenomena-is intrinsically difficult because observation is predicated upon not only theoretical concepts but also the values and perspective of the research. Despite several previous attempts to raise awareness of more sophisticated approaches to measurement and the importance of quantitatively assessing reliability and validity, measurement issues continue to be widely ignored. The reasons are unknown, but differences in typical engineering and computer science graduate training programs (compared to psychology and management, for example) are involved. This chapter therefore reviews key concepts in the science of measurement and applies them to software engineering research. A series of exercises for applying important measurement concepts to the reader's research are included, and a sample dataset for the reader to try some of the statistical procedures mentioned is provided.
- Abstract(参考訳): コンピュータ研究の方法論的厳密さは過去20年間で著しく改善されているが、定量的ソフトウェア工学の研究は未熟な測定と理論への不注意によって妨げられている。
測度-現象に対する数値の原理的な割り当ては本質的に困難である、なぜなら観測は理論的な概念だけでなく、研究の価値や視点にも当てはまるからである。
従来、測定に対するより洗練されたアプローチの認識を高め、信頼性と妥当性を定量的に評価する重要性を高める試みがあったが、測定問題は広く無視され続けている。
その理由は不明だが、典型的な工学とコンピュータサイエンスの卒業訓練プログラム(例えば心理学やマネジメント)の違いが関係している。
したがって、この章は測定の科学における重要な概念をレビューし、それらをソフトウェア工学の研究に適用する。
読者の研究に重要な測定概念を適用するための一連の演習と、上記統計学的手順を試すためのサンプルデータセットが提供される。
関連論文リスト
- Evaluating Generative AI Systems is a Social Science Measurement Challenge [78.35388859345056]
我々は,GenAIシステムの能力,影響,機会,リスクに関連する概念を測定するための枠組みを提案する。
このフレームワークは、背景概念、体系化された概念、測定器、インスタンスレベルの測定そのものの4つのレベルを区別する。
論文 参考訳(メタデータ) (2024-11-17T02:35:30Z) - Between Randomness and Arbitrariness: Some Lessons for Reliable Machine Learning at Scale [2.50194939587674]
dissertation: 信頼性を犠牲にすることなくスケーラビリティを実現するために、MLにおける偏在性のソースの定量化と緩和、不確実性推定と最適化アルゴリズムのランダム性。
論文は、機械学習の信頼性測定に関する研究が法と政策の研究と密接に結びついていることの例による実証的な証明として機能する。
論文 参考訳(メタデータ) (2024-06-13T19:29:37Z) - Understanding and measuring software engineer behavior: What can we learn from the behavioral sciences? [3.2789487559198967]
我々は,心理測定器や様々な情報源からの質的データなど量的尺度を統合する包括的手法を提唱する。
本稿では,行動科学の方法論的スキルを活用することによって,この課題の進展を評価するためのさまざまな方法について述べる。
論文 参考訳(メタデータ) (2024-06-05T14:59:40Z) - Apples, Oranges, and Software Engineering: Study Selection Challenges
for Secondary Research on Latent Variables [8.612556181934291]
抽象概念を測ることができないことは、ソフトウェア工学の二次研究にとって直接的に課題となる。
標準化された測定機器はめったに利用できないが、たとえあるとしても、多くの研究者はそれを使用せず、また研究された概念の定義も提供していない。
したがって、セカンダリリサーチを行うSE研究者は、(a)どの一次研究が同じ構造を測るか、(b)同じ構造を全く異なる測定値と比較し、集約する方法を決定する必要がある。
論文 参考訳(メタデータ) (2024-02-13T17:32:17Z) - Investigating Reproducibility in Deep Learning-Based Software Fault
Prediction [16.25827159504845]
ますます複雑な機械学習モデルが急速に採用されるようになると、学者が文献で報告される結果を再現することがますます困難になる。
特に、適用されたディープラーニングモデルと評価方法論が適切に文書化されていない場合と、コードとデータが共有されていない場合である。
我々は,2019年から2022年にかけて,トップレベルのソフトウェアエンジニアリングカンファレンスにおいて,現在の文献を体系的にレビューし,56件の研究論文のレベルを検討した。
論文 参考訳(メタデータ) (2024-02-08T13:00:18Z) - Research Trends and Applications of Data Augmentation Algorithms [77.34726150561087]
我々は,データ拡張アルゴリズムの適用分野,使用するアルゴリズムの種類,重要な研究動向,時間経過に伴う研究の進展,およびデータ拡張文学における研究ギャップを同定する。
我々は、読者がデータ拡張の可能性を理解し、将来の研究方向を特定し、データ拡張研究の中で質問を開くことを期待する。
論文 参考訳(メタデータ) (2022-07-18T11:38:32Z) - An Extensible Benchmark Suite for Learning to Simulate Physical Systems [60.249111272844374]
我々は、統一されたベンチマークと評価プロトコルへの一歩を踏み出すために、一連のベンチマーク問題を導入する。
本稿では,4つの物理系と,広く使用されている古典的時間ベースおよび代表的なデータ駆動手法のコレクションを提案する。
論文 参考訳(メタデータ) (2021-08-09T17:39:09Z) - A Review of Uncertainty Quantification in Deep Learning: Techniques,
Applications and Challenges [76.20963684020145]
不確実性定量化(UQ)は、最適化と意思決定プロセスの両方において不確実性の低減に重要な役割を果たしている。
ビザレ近似とアンサンブル学習技術は、文学において最も広く使われている2つのUQ手法である。
本研究は, 深層学習におけるUQ手法の最近の進歩を概観し, 強化学習におけるこれらの手法の適用について検討する。
論文 参考訳(メタデータ) (2020-11-12T06:41:05Z) - Targeting Learning: Robust Statistics for Reproducible Research [1.1455937444848387]
ターゲティング・ラーニング(Targeted Learning)は、因果推論、機械学習、統計理論の進歩を統一して、科学的に影響のある質問に統計的信頼性で答えるのに役立つ統計分野である。
ターゲット学習のロードマップは、仮説を最小化し、利用可能な科学的知識にのみ注意深く根ざすように、統計的手続きを調整することを強調する。
論文 参考訳(メタデータ) (2020-06-12T17:17:01Z) - Marginal likelihood computation for model selection and hypothesis
testing: an extensive review [66.37504201165159]
この記事では、このトピックの最先端に関する総合的な研究について紹介する。
さまざまなテクニックの制限、メリット、コネクション、差異を強調します。
また、不適切な事前利用の問題や解決法についても述べる。
論文 参考訳(メタデータ) (2020-05-17T18:31:58Z) - A Survey on Causal Inference [64.45536158710014]
因果推論は統計学、コンピュータ科学、教育、公共政策、経済学など、多くの分野において重要な研究トピックである。
観測データに対する様々な因果効果推定法が誕生した。
論文 参考訳(メタデータ) (2020-02-05T21:35:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。