論文の概要: Qualitative Data Analysis in Software Engineering: Techniques and Teaching Insights
- arxiv url: http://arxiv.org/abs/2406.08228v1
- Date: Wed, 12 Jun 2024 13:56:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-13 16:36:08.336348
- Title: Qualitative Data Analysis in Software Engineering: Techniques and Teaching Insights
- Title(参考訳): ソフトウェア工学における定性データ分析:技術と指導指針
- Authors: Christoph Treude,
- Abstract要約: ソフトウェアリポジトリは、ソースコードコメント、コミットメッセージ、イシュー記述、ドキュメントなど、質的なアーティファクトの豊富なソースである。
この章では、さまざまな定性的データ分析技術を用いて、これらのアーティファクトの解釈に焦点を移す。
データ解釈における一貫性と精度を確保するため、コーディングガイドの戦略的設計とともに様々なコーディング手法について議論する。
- 参考スコア(独自算出の注目度): 10.222207222039048
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Software repositories are rich sources of qualitative artifacts, including source code comments, commit messages, issue descriptions, and documentation. These artifacts offer many interesting insights when analyzed through quantitative methods, as outlined in the chapter on mining software repositories. This chapter shifts the focus towards interpreting these artifacts using various qualitative data analysis techniques. We introduce qualitative coding as an iterative process, which is crucial not only for educational purposes but also to enhance the credibility and depth of research findings. Various coding methods are discussed along with the strategic design of a coding guide to ensure consistency and accuracy in data interpretation. The chapter also discusses quality assurance in qualitative data analysis, emphasizing principles such as credibility, transferability, dependability, and confirmability. These principles are vital to ensure that the findings are robust and can be generalized in different contexts. By sharing best practices and lessons learned, we aim to equip all readers with the tools necessary to conduct rigorous qualitative research in the field of software engineering.
- Abstract(参考訳): ソフトウェアリポジトリは、ソースコードコメント、コミットメッセージ、イシュー記述、ドキュメントなど、質的なアーティファクトの豊富なソースである。
これらのアーティファクトは、ソフトウェアリポジトリのマイニングに関する章で概説されているように、定量的手法によって分析されたときに、多くの興味深い洞察を提供する。
この章では、さまざまな定性的データ分析技術を用いて、これらのアーティファクトの解釈に焦点を移す。
質的コーディングは,教育目的だけでなく,研究成果の信頼性や深度向上にも不可欠である。
データ解釈における一貫性と精度を確保するため、コーディングガイドの戦略的設計とともに様々なコーディング手法について議論する。
この章では質的なデータ分析の品質保証についても論じており、信頼性、転送可能性、信頼性、確認可能性といった原則を強調している。
これらの原則は、発見が堅牢で、異なる文脈で一般化できることを保証するために不可欠である。
学習したベストプラクティスと教訓を共有することで、ソフトウェア工学の分野で厳密な質的研究を行うために必要なツールを、すべての読者に提供することを目指している。
関連論文リスト
- Multi-Facet Counterfactual Learning for Content Quality Evaluation [48.73583736357489]
コンテンツ品質評価の複数の側面を知覚する評価器を効率的に構築する枠組みを提案する。
我々は,コントラスト学習と教師付き学習に基づく共同学習戦略を活用し,評価者が異なる品質面を区別できるようにする。
論文 参考訳(メタデータ) (2024-10-10T08:04:10Z) - Natural Language Processing for Requirements Traceability [47.93107382627423]
トレーサビリティは、特に安全クリティカルなシステムにおいて、要件とソフトウェアエンジニアリングにおいて重要な役割を果たす。
自然言語処理(NLP)とその関連技術は、過去10年間に大きく進歩してきた。
論文 参考訳(メタデータ) (2024-05-17T15:17:00Z) - Automating the Information Extraction from Semi-Structured Interview
Transcripts [0.0]
本稿では,半構造化面接書から情報を取り出す自動システムの開発と応用について検討する。
本稿では,研究者がインタビューデータのテーマ構造を効率的に処理し,視覚化できる,ユーザフレンドリーなソフトウェアプロトタイプを提案する。
論文 参考訳(メタデータ) (2024-03-07T13:53:03Z) - Exploring Precision and Recall to assess the quality and diversity of LLMs [82.21278402856079]
我々はtextscLlama-2 や textscMistral のような大規模言語モデル (LLM) のための新しい評価フレームワークを提案する。
このアプローチにより、コーパスの整合を必要とせず、生成したテキストの品質と多様性を微妙に評価できる。
論文 参考訳(メタデータ) (2024-02-16T13:53:26Z) - Investigating the Impact of Vocabulary Difficulty and Code Naturalness
on Program Comprehension [3.35803394416914]
本研究の目的は,言語習得の観点から可読性と可読性を評価することである。
我々は,それらの相関関係を理解するために統計的解析を行い,可読性および可読性予測法の性能向上にコード自然性および語彙難易度を用いることができるか分析する。
論文 参考訳(メタデータ) (2023-08-25T15:15:00Z) - Analyzing Dataset Annotation Quality Management in the Wild [63.07224587146207]
最先端モデルのトレーニングと評価に使用される一般的なデータセットでさえ、誤ったアノテーションやバイアス、アーティファクトの量は無視できない。
データセット作成プロジェクトに関するプラクティスやガイドラインは存在するが、品質管理の実施方法に関する大規模な分析はまだ行われていない。
論文 参考訳(メタデータ) (2023-07-16T21:22:40Z) - KGEA: A Knowledge Graph Enhanced Article Quality Identification Dataset [4.811084336809668]
Baidu Encyclopediaに基づく知識グラフ強化記事品質識別データセット(KGEA)を提案する。
論文を7次元で定量化し,記事とBaidu百科事典の実体の共起を利用して,各記事の知識グラフを構築した。
また、いくつかのテキスト分類ベースラインを比較して、外部知識が、グラフニューラルネットワークとのより競争力のある分類に導くことができることを示した。
論文 参考訳(メタデータ) (2022-06-15T14:15:41Z) - Human-in-the-Loop Disinformation Detection: Stance, Sentiment, or
Something Else? [93.91375268580806]
政治とパンデミックは、機械学習対応の偽ニュース検出アルゴリズムの開発に十分な動機を与えている。
既存の文献は、主に完全自動化されたケースに焦点を当てているが、その結果得られた技術は、軍事応用に必要な様々なトピック、ソース、時間スケールに関する偽情報を確実に検出することはできない。
既に利用可能なアナリストを人間のループとして活用することにより、感情分析、アスペクトベースの感情分析、姿勢検出といった標準的な機械学習技術は、部分的に自動化された偽情報検出システムに使用するためのもっとも有効な方法となる。
論文 参考訳(メタデータ) (2021-11-09T13:30:34Z) - A Survey on Machine Learning Techniques for Source Code Analysis [14.129976741300029]
ソースコード解析に応用された機械学習の領域における現在の知識を要約することを目的としている。
そこで本研究では,2002年から2021年にかけて,広範囲にわたる文献検索を行い,初等研究364点を同定した。
論文 参考訳(メタデータ) (2021-10-18T20:13:38Z) - CORAL: COde RepresentAtion Learning with Weakly-Supervised Transformers
for Analyzing Data Analysis [33.190021245507445]
ソースコード、特に科学的なソースコードの大規模解析は、データサイエンスのプロセスをよりよく理解する約束を持っている。
本稿では,抽象構文木と周辺自然言語コメントからコードの共同表現を計算するための,弱い教師付きトランスフォーマーベースのアーキテクチャを提案する。
本モデルでは,手軽に手軽に管理できる弱さを生かし,専門家による供給よりも38%の精度向上を実現し,ベースラインを上回ります。
論文 参考訳(メタデータ) (2020-08-28T19:57:49Z) - A Transformer-based Approach for Source Code Summarization [86.08359401867577]
コードトークン間のペア関係をモデル化することにより,要約のためのコード表現を学習する。
アプローチは単純であるにもかかわらず、最先端技術よりもかなりの差があることが示される。
論文 参考訳(メタデータ) (2020-05-01T23:29:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。