論文の概要: A Systematic Mapping Study of Crowd Knowledge Enhanced Software Engineering Research Using Stack Overflow
- arxiv url: http://arxiv.org/abs/2408.07913v1
- Date: Thu, 15 Aug 2024 03:40:44 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-16 15:09:23.212227
- Title: A Systematic Mapping Study of Crowd Knowledge Enhanced Software Engineering Research Using Stack Overflow
- Title(参考訳): スタックオーバーフローを用いたクラウド知識強化ソフトウェア工学研究の体系的マッピング
- Authors: Minaoar Tanzil, Shaiful Chowdhury, Somayeh Modaberi, Gias Uddin, Hadi Hemmati,
- Abstract要約: すべてのソフトウェアプロフェッショナルの30%が、最も人気のあるQ&AサイトStackOverflow (SO)を毎日訪問している。
SOデータを利用した傾向,含意,影響,今後の研究の可能性を明らかにするためには,系統地図研究が必要である。
我々は384のSOに基づく研究論文を収集し、それらを10の面(テーマ)に分類した。
私たちは、SOが、QuoraやRedditのような人気のあるQ&Aサイトと比較して、SE研究の85%に寄与していることを発見しました。
- 参考スコア(独自算出の注目度): 0.8621608193534838
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Developers continuously interact in crowd-sourced community-based question-answer (Q&A) sites. Reportedly, 30% of all software professionals visit the most popular Q&A site StackOverflow (SO) every day. Software engineering (SE) research studies are also increasingly using SO data. To find out the trend, implication, impact, and future research potential utilizing SO data, a systematic mapping study needs to be conducted. Following a rigorous reproducible mapping study approach, from 18 reputed SE journals and conferences, we collected 384 SO-based research articles and categorized them into 10 facets (i.e., themes). We found that SO contributes to 85% of SE research compared with popular Q&A sites such as Quora, and Reddit. We found that 18 SE domains directly benefited from SO data whereas Recommender Systems, and API Design and Evolution domains use SO data the most (15% and 16% of all SO-based research studies, respectively). API Design and Evolution, and Machine Learning with/for SE domains have consistent upward publication. Deep Learning Bug Analysis and Code Cloning research areas have the highest potential research impact recently. With the insights, recommendations, and facet-based categorized paper list from this mapping study, SE researchers can find potential research areas according to their interest to utilize large-scale SO data.
- Abstract(参考訳): 開発者はクラウドソースのコミュニティベースのQ&Aサイト(Q&A)で継続的に対話する。
報告によると、すべてのソフトウェアプロフェッショナルの30%が、最も人気のあるQ&AサイトStackOverflow(SO)を毎日訪問している。
ソフトウェア工学(SE)の研究もSOデータの利用が増えている。
SOデータを利用した傾向,含意,影響,今後の研究の可能性を明らかにするためには,系統地図研究が必要である。
厳密な再現性のあるマッピング研究のアプローチに続き,18のSEジャーナルやカンファレンスから,384のSOベースの研究論文を収集し,それらを10のファセット(テーマ)に分類した。
私たちは、SOが、QuoraやRedditのような人気のあるQ&Aサイトと比較して、SE研究の85%に寄与していることを発見しました。
その結果、18のSEドメインがSOデータから直接恩恵を受けているのに対し、Recommender SystemsとAPI DesignとEvolutionドメインはSOデータが最も多く利用している(各SOベース研究の15%と16%)。
API設計と進化、SEドメインでの機械学習は一貫して上向きに公開されています。
ディープラーニングバグ分析とコードクローンの研究領域は、最近、最も可能性の高い研究影響がある。
本研究から得られた知見,レコメンデーション,およびファセットに基づく分類論文リストから,SE研究者は大規模SOデータの利用に関心を持って,潜在的研究領域を見つけることができる。
関連論文リスト
- A Survey on Data Selection for Language Models [148.300726396877]
データ選択方法は、トレーニングデータセットに含まれるデータポイントを決定することを目的としている。
ディープラーニングは、主に実証的な証拠によって駆動され、大規模なデータに対する実験は高価である。
広範なデータ選択研究のリソースを持つ組織はほとんどない。
論文 参考訳(メタデータ) (2024-02-26T18:54:35Z) - Conflating point of interest (POI) data: A systematic review of matching
methods [5.439489511940086]
関心のポイント(POI)データは、現実世界の場所のデジタル表現を提供する。
多くのPOIデータセットが開発されており、地理的カバレッジ、属性フォーカス、データ品質が異なることが多い。
研究者は、研究領域の場所をよりよく表現するために、2つ以上のPOIデータセットを分割する必要があるかもしれない。
論文 参考訳(メタデータ) (2023-10-23T19:38:31Z) - The Quantum Frontier of Software Engineering: A Systematic Mapping Study [16.93115872272979]
量子ソフトウェアエンジニアリング(QSE)は、開発者が量子プログラムを設計、開発できる新しい分野として登場しつつある。
本稿では,QSE研究の現状に関する系統地図研究について述べる。
論文 参考訳(メタデータ) (2023-05-31T09:26:10Z) - Deep learning for table detection and structure recognition: A survey [49.09628624903334]
本調査の目的は,テーブル検出の分野での大きな進展を深く理解することである。
この分野における古典的アプリケーションと新しいアプリケーションの両方について分析する。
既存のモデルのデータセットとソースコードは、読者にこの膨大な文献のコンパスを提供するために組織されている。
論文 参考訳(メタデータ) (2022-11-15T19:42:27Z) - A Comparative Study of Question Answering over Knowledge Bases [2.6135123648293717]
知識ベースに対する質問応答 (KBQA) は,ユーザが知識ベースから情報を取り出すための一般的なアプローチとなっている。
8つのベンチマークデータセット上で6つの代表的なKBQAシステムの比較研究を行った。
本稿では,既存のモデルに優れた結果をもたらすための高度なマッピングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-11-15T14:23:47Z) - Research Trends and Applications of Data Augmentation Algorithms [77.34726150561087]
我々は,データ拡張アルゴリズムの適用分野,使用するアルゴリズムの種類,重要な研究動向,時間経過に伴う研究の進展,およびデータ拡張文学における研究ギャップを同定する。
我々は、読者がデータ拡張の可能性を理解し、将来の研究方向を特定し、データ拡張研究の中で質問を開くことを期待する。
論文 参考訳(メタデータ) (2022-07-18T11:38:32Z) - DeepShovel: An Online Collaborative Platform for Data Extraction in
Geoscience Literature with AI Assistance [48.55345030503826]
地質学者は、関連する結果やデータを発見、抽出、集約するために膨大な量の文献を読む必要がある。
DeepShovelは、彼らのニーズをサポートするAI支援データ抽出システムである。
14人の研究者によるユーザ評価の結果、DeepShovelは科学データベース構築のためのデータ抽出の効率を改善した。
論文 参考訳(メタデータ) (2022-02-21T12:18:08Z) - Studying the characteristics of scientific communities using
individual-level bibliometrics: the case of Big Data research [2.208242292882514]
我々は,ビッグデータ研究に携わる作家コミュニティの学齢,生産,研究の焦点について検討する。
以上の結果から,「ビッグデータ」の学術領域は,著者のコミュニティが拡大する中で,近年の話題となっている。
論文 参考訳(メタデータ) (2021-06-10T08:17:09Z) - A Survey of Knowledge Tracing: Models, Variants, and Applications [70.69281873057619]
知識追跡は、学生の行動データ分析の基本的なタスクの1つである。
我々は、異なる技術経路を持つ3種類の基本KTモデルを示す。
この急速に成長する分野における今後の研究の方向性について論じる。
論文 参考訳(メタデータ) (2021-05-06T13:05:55Z) - Domain Generalization: A Survey [146.68420112164577]
ドメイン一般化(DG)は、モデル学習にソースドメインデータを使用するだけでOOD一般化を実現することを目的としています。
初めて、DGの10年の開発をまとめるために包括的な文献レビューが提供されます。
論文 参考訳(メタデータ) (2021-03-03T16:12:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。