論文の概要: Different Debt: An Addition to the Technical Debt Dataset and a
Demonstration Using Developer Personality
- arxiv url: http://arxiv.org/abs/2403.01157v1
- Date: Sat, 2 Mar 2024 10:11:07 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-05 14:57:58.423828
- Title: Different Debt: An Addition to the Technical Debt Dataset and a
Demonstration Using Developer Personality
- Title(参考訳): 異なる負債: 技術的負債データセットの追加と開発者パーソナリティを用いたデモ
- Authors: Lorenz Graf-Vlachy, Stefan Wagner
- Abstract要約: 技術的負債データセット(TDD)は、30以上のJavaプロジェクトのメインブランチにおける技術的負債(TD)に関する包括的なデータセットである。
SonarQubeによって生成されるいくつかのTDアイテムは、例えばコミットがコンパイルに失敗したため、多くのコミットには含まれない。
Teamscaleを使って37のプロジェクトからなるスーパーセットにおいて、すべてのブランチの278,320のコミットの分析を含むデータセットの追加を提供します。
- 参考スコア(独自算出の注目度): 7.013919006895036
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Background: The "Technical Debt Dataset" (TDD) is a comprehensive dataset on
technical debt (TD) in the main branches of more than 30 Java projects.
However, some TD items produced by SonarQube are not included for many commits,
for instance because the commits failed to compile. This has limited previous
studies using the dataset. Aims and Method: In this paper, we provide an
addition to the dataset that includes an analysis of 278,320 commits of all
branches in a superset of 37 projects using Teamscale. We then demonstrate the
utility of the dataset by exploring the relationship between developer
personality by replicating a prior study. Results: The new dataset allows us to
use a larger sample than prior work could, and we analyze the personality of
111 developers and 5,497 of their commits. The relationships we find between
developer personality and the introduction and removal of TD differ from those
found in prior work. Conclusions: We offer a dataset that may enable future
studies into the topic of TD and we provide additional insights on how
developer personality relates to TD.
- Abstract(参考訳): 背景: "技術的負債データセット(TDD)"は、30以上のJavaプロジェクトのメインブランチにおける技術的負債(TD)に関する包括的なデータセットである。
しかし、SonarQubeによって生成されるいくつかのTDアイテムは、例えばコミットがコンパイルに失敗したため、多くのコミットには含まれない。
これはデータセットを使った以前の研究に制限がある。
目的と方法: この論文では、Teamscaleを使って37のプロジェクトからなるスーパーセットにおいて、すべてのブランチの278,320のコミットの分析を含むデータセットを追加します。
次に,先行研究の再現により,開発者のパーソナリティの関係を探究し,データセットの有用性を示す。
結果: 新しいデータセットは、以前の作業よりも大きなサンプルを使用することができ、111人の開発者と5,497人のコミットのパーソナリティを分析します。
開発者のパーソナリティとtdの導入と削除の間の関係は、以前の仕事に見られるものと異なる。
結論:TDのトピックに関する今後の研究を可能にするデータセットを提供し、開発者の性格がTDとどのように関係しているかについて、さらなる洞察を提供する。
関連論文リスト
- Improving the detection of technical debt in Java source code with an enriched dataset [12.07607688189035]
技術的負債(Technical debt, TD)とは、開発者が問題に対して迅速かつ簡単なソリューションを選択すると、追加の作業とコストが発生すること。
近年の研究では、ソースコードに埋め込まれたコメントを分析することで、SATD(Self-Admitted Technical Debts)の検出に焦点が当てられている。
コードコメントによって識別された最初のTDデータセットを、関連するソースコードとともにキュレートしました。
論文 参考訳(メタデータ) (2024-11-08T10:12:33Z) - MADE-WIC: Multiple Annotated Datasets for Exploring Weaknesses In Code [2.399010142304227]
MADE-WICは、機能とコメントの大規模なデータセットであり、技術的負債とコードの弱点に対する複数のアノテーションがある。
約860Kのコード関数と、12のオープンソースプロジェクトからの2.7M以上の関連コメントが含まれている。
論文 参考訳(メタデータ) (2024-08-09T16:32:38Z) - Towards Realistic Few-Shot Relation Extraction: A New Meta Dataset and Evaluation [17.398872494876365]
数ショットの関係抽出のためのメタデータセットを提案する。
我々は最近の6つの連写関係抽出手法の総合評価を行う。
このタスクの全体的なパフォーマンスは低く、将来の研究に相当なニーズがあることを示唆している。
論文 参考訳(メタデータ) (2024-04-05T23:12:46Z) - UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction [93.77809355002591]
さまざまなデータセット、モデル、評価基準を統一する包括的なフレームワークであるUniTrajを紹介する。
我々は広範な実験を行い、他のデータセットに転送するとモデルの性能が大幅に低下することがわかった。
これらの知見を説明するために,データセットの特徴に関する洞察を提供する。
論文 参考訳(メタデータ) (2024-03-22T10:36:50Z) - SATDAUG -- A Balanced and Augmented Dataset for Detecting Self-Admitted
Technical Debt [6.699060157800401]
自己承認技術的負債(Self-admitted Technical debt、SATD)とは、開発者が技術的ショートカットの存在を明確に認識し、文書化する技術的負債の一種である。
textitSATDAUGデータセットは、ソースコードコメント、イシュートラッカ、プルリクエスト、コミットメッセージを含む既存のSATDデータセットの拡張バージョンです。
論文 参考訳(メタデータ) (2024-03-12T14:33:53Z) - Improving Limited Labeled Dialogue State Tracking with Self-Supervision [91.68515201803986]
既存の対話状態追跡(DST)モデルには多くのラベル付きデータが必要である。
本稿では,潜在的一貫性の維持と対話行動のモデル化という,自己指導型の2つの目的について検討する。
提案する自己教師型信号は,1%のラベル付きデータのみを使用する場合,関節ゴール精度を8.95%向上させることができる。
論文 参考訳(メタデータ) (2020-10-26T21:57:42Z) - Partially-Aligned Data-to-Text Generation with Distant Supervision [69.15410325679635]
我々はPADTG(Partially-Aligned Data-to-Text Generation)と呼ばれる新しい生成タスクを提案する。
自動的にアノテートされたデータをトレーニングに利用し、アプリケーションドメインを大幅に拡張するため、より実用的です。
我々のフレームワークは、全てのベースラインモデルより優れており、部分整合データの利用の可能性を検証する。
論文 参考訳(メタデータ) (2020-10-03T03:18:52Z) - Rapidly Bootstrapping a Question Answering Dataset for COVID-19 [88.86456834766288]
我々は、新型コロナウイルスに特化して設計された質問応答データセットの始まりであるCovidQAを紹介する。
これは、そのタイプの最初の公開リソースであり、より実質的な評価資源が利用可能になるまで研究を導くためのストップギャップとして意図されている。
論文 参考訳(メタデータ) (2020-04-23T17:35:11Z) - REVISE: A Tool for Measuring and Mitigating Bias in Visual Datasets [64.76453161039973]
REVISE(Revealing VIsual biaSEs)は、視覚的データセットの調査を支援するツールである。
1)オブジェクトベース,(2)個人ベース,(3)地理ベースという3つの次元に沿った潜在的なバイアスを呈示する。
論文 参考訳(メタデータ) (2020-04-16T23:54:37Z) - DeGAN : Data-Enriching GAN for Retrieving Representative Samples from a
Trained Classifier [58.979104709647295]
我々は、トレーニングされたネットワークの将来の学習タスクのために、利用可能なデータの豊富さと関連するデータの欠如の間のギャップを埋める。
利用可能なデータは、元のトレーニングデータセットまたは関連するドメインデータセットの不均衡なサブセットである可能性があるため、代表サンプルを検索するために使用します。
関連ドメインからのデータを活用して最先端のパフォーマンスを実現することを実証する。
論文 参考訳(メタデータ) (2019-12-27T02:05:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。