論文の概要: Teaching Software Metrology: The Science of Measurement for Software Engineering
- arxiv url: http://arxiv.org/abs/2406.14494v1
- Date: Thu, 20 Jun 2024 16:57:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-21 12:33:17.545151
- Title: Teaching Software Metrology: The Science of Measurement for Software Engineering
- Title(参考訳): ソフトウェアメトロロジーを教える:ソフトウェア工学のための計測の科学
- Authors: Paul Ralph, Miikka Kuutila, Hera Arif, Bimpe Ayoola,
- Abstract要約: この章は測定の科学における重要な概念をレビューし、それらをソフトウェア工学の研究に適用する。
読者の研究に重要な測定概念を適用するための一連の演習を含む。
- 参考スコア(独自算出の注目度): 10.23712090082156
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While the methodological rigor of computing research has improved considerably in the past two decades, quantitative software engineering research is hampered by immature measures and inattention to theory. Measurement-the principled assignment of numbers to phenomena-is intrinsically difficult because observation is predicated upon not only theoretical concepts but also the values and perspective of the research. Despite several previous attempts to raise awareness of more sophisticated approaches to measurement and the importance of quantitatively assessing reliability and validity, measurement issues continue to be widely ignored. The reasons are unknown, but differences in typical engineering and computer science graduate training programs (compared to psychology and management, for example) are involved. This chapter therefore reviews key concepts in the science of measurement and applies them to software engineering research. A series of exercises for applying important measurement concepts to the reader's research are included, and a sample dataset for the reader to try some of the statistical procedures mentioned is provided.
- Abstract(参考訳): コンピュータ研究の方法論的厳密さは過去20年間で著しく改善されているが、定量的ソフトウェア工学の研究は未熟な測定と理論への不注意によって妨げられている。
測度-現象に対する数値の原理的な割り当ては本質的に困難である、なぜなら観測は理論的な概念だけでなく、研究の価値や視点にも当てはまるからである。
従来、測定に対するより洗練されたアプローチの認識を高め、信頼性と妥当性を定量的に評価する重要性を高める試みがあったが、測定問題は広く無視され続けている。
その理由は不明だが、典型的な工学とコンピュータサイエンスの卒業訓練プログラム(例えば心理学やマネジメント)の違いが関係している。
したがって、この章は測定の科学における重要な概念をレビューし、それらをソフトウェア工学の研究に適用する。
読者の研究に重要な測定概念を適用するための一連の演習と、上記統計学的手順を試すためのサンプルデータセットが提供される。
関連論文リスト
- DiSciPLE: Learning Interpretable Programs for Scientific Visual Discovery [61.02102713094486]
優れた意思決定を可能にするため、科学的推論において優れた解釈が重要である。
本稿では,ニューラルネットワークをインターリーブする学習プログラムを用いて,そのような解釈可能な設計モデルを得るための自動手法を提案する。
本稿では,大言語モデル (LLM) の常識と事前知識を活用する進化的アルゴリズムであるDiSciPLEを提案し,視覚データを説明するPythonプログラムを作成する。
論文 参考訳(メタデータ) (2025-02-14T10:26:14Z) - A Call for Critically Rethinking and Reforming Data Analysis in Empirical Software Engineering [5.687882380471718]
経験的方法論の正しい適用に関する懸念は、2006年のDagtuhl Seminar on Empirical Software Engineeringから存在する。
LLMを用いて,27,000件の実証研究の文献調査を行い,統計的方法論を適切あるいは不十分と分類した。
我々は,30の初等研究を選定し,統計問題を特定し,解決する能力を評価するために,33人のESE専門家とワークショップを開催した。
論文 参考訳(メタデータ) (2025-01-22T09:05:01Z) - Perspective of Software Engineering Researchers on Machine Learning Practices Regarding Research, Review, and Education [12.716955305620191]
本研究は、機械学習(ML)とソフトウェア工学(SE)の相乗効果に関する知識への貢献を目的とする。
ML に精通した SE 研究者,あるいは ML を用いた SE 記事の執筆者,および記事自体を分析した。
データ収集、モデルトレーニング、評価に重点を置くさまざまなプラクティスを見つけました。
論文 参考訳(メタデータ) (2024-11-28T18:21:24Z) - Evaluating Generative AI Systems is a Social Science Measurement Challenge [78.35388859345056]
我々は,GenAIシステムの能力,影響,機会,リスクに関連する概念を測定するための枠組みを提案する。
このフレームワークは、背景概念、体系化された概念、測定器、インスタンスレベルの測定そのものの4つのレベルを区別する。
論文 参考訳(メタデータ) (2024-11-17T02:35:30Z) - Between Randomness and Arbitrariness: Some Lessons for Reliable Machine Learning at Scale [2.50194939587674]
dissertation: 信頼性を犠牲にすることなくスケーラビリティを実現するために、MLにおける偏在性のソースの定量化と緩和、不確実性推定と最適化アルゴリズムのランダム性。
論文は、機械学習の信頼性測定に関する研究が法と政策の研究と密接に結びついていることの例による実証的な証明として機能する。
論文 参考訳(メタデータ) (2024-06-13T19:29:37Z) - Apples, Oranges, and Software Engineering: Study Selection Challenges
for Secondary Research on Latent Variables [8.612556181934291]
抽象概念を測ることができないことは、ソフトウェア工学の二次研究にとって直接的に課題となる。
標準化された測定機器はめったに利用できないが、たとえあるとしても、多くの研究者はそれを使用せず、また研究された概念の定義も提供していない。
したがって、セカンダリリサーチを行うSE研究者は、(a)どの一次研究が同じ構造を測るか、(b)同じ構造を全く異なる測定値と比較し、集約する方法を決定する必要がある。
論文 参考訳(メタデータ) (2024-02-13T17:32:17Z) - Investigating Reproducibility in Deep Learning-Based Software Fault
Prediction [16.25827159504845]
ますます複雑な機械学習モデルが急速に採用されるようになると、学者が文献で報告される結果を再現することがますます困難になる。
特に、適用されたディープラーニングモデルと評価方法論が適切に文書化されていない場合と、コードとデータが共有されていない場合である。
我々は,2019年から2022年にかけて,トップレベルのソフトウェアエンジニアリングカンファレンスにおいて,現在の文献を体系的にレビューし,56件の研究論文のレベルを検討した。
論文 参考訳(メタデータ) (2024-02-08T13:00:18Z) - An Extensible Benchmark Suite for Learning to Simulate Physical Systems [60.249111272844374]
我々は、統一されたベンチマークと評価プロトコルへの一歩を踏み出すために、一連のベンチマーク問題を導入する。
本稿では,4つの物理系と,広く使用されている古典的時間ベースおよび代表的なデータ駆動手法のコレクションを提案する。
論文 参考訳(メタデータ) (2021-08-09T17:39:09Z) - A Review of Uncertainty Quantification in Deep Learning: Techniques,
Applications and Challenges [76.20963684020145]
不確実性定量化(UQ)は、最適化と意思決定プロセスの両方において不確実性の低減に重要な役割を果たしている。
ビザレ近似とアンサンブル学習技術は、文学において最も広く使われている2つのUQ手法である。
本研究は, 深層学習におけるUQ手法の最近の進歩を概観し, 強化学習におけるこれらの手法の適用について検討する。
論文 参考訳(メタデータ) (2020-11-12T06:41:05Z) - Marginal likelihood computation for model selection and hypothesis
testing: an extensive review [66.37504201165159]
この記事では、このトピックの最先端に関する総合的な研究について紹介する。
さまざまなテクニックの制限、メリット、コネクション、差異を強調します。
また、不適切な事前利用の問題や解決法についても述べる。
論文 参考訳(メタデータ) (2020-05-17T18:31:58Z) - A Survey on Causal Inference [64.45536158710014]
因果推論は統計学、コンピュータ科学、教育、公共政策、経済学など、多くの分野において重要な研究トピックである。
観測データに対する様々な因果効果推定法が誕生した。
論文 参考訳(メタデータ) (2020-02-05T21:35:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。