論文の概要: Tag that issue: Applying API-domain labels in issue tracking systems
- arxiv url: http://arxiv.org/abs/2304.02877v1
- Date: Thu, 6 Apr 2023 05:49:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-07 15:04:44.412420
- Title: Tag that issue: Applying API-domain labels in issue tracking systems
- Title(参考訳): 問題のタグ:イシュートラッキングシステムにAPIドメインラベルを適用する
- Authors: Fabio Santos, Joseph Vargovich, Bianca Trinkenreich, Italo Santos,
Jacob Penney, Ricardo Britto, Jo\~ao Felipe Pimentel, Igor Wiese, Igor
Steinmacher, Anita Sarma, Marco A. Gerosa
- Abstract要約: 完了に必要なスキルをラベル付けすることで、コントリビュータがオープンソースプロジェクトのタスクを選択するのに役立ちます。
ハイレベルなAPIカテゴリである“APIドメイン”と呼ばれる問題の自動ラベリングの実現可能性と妥当性について検討する。
以上の結果から, 課題選択に有用なAPIドメインラベル, (ii) ラベルの精度は84%, 平均で78.6%, (iii) 予測結果が71.3%, 52.5%まで到達した。
- 参考スコア(独自算出の注目度): 20.701637107734996
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Labeling issues with the skills required to complete them can help
contributors to choose tasks in Open Source Software projects. However,
manually labeling issues is time-consuming and error-prone, and current
automated approaches are mostly limited to classifying issues as bugs/non-bugs.
We investigate the feasibility and relevance of automatically labeling issues
with what we call "API-domains," which are high-level categories of APIs.
Therefore, we posit that the APIs used in the source code affected by an issue
can be a proxy for the type of skills (e.g., DB, security, UI) needed to work
on the issue. We ran a user study (n=74) to assess API-domain labels' relevancy
to potential contributors, leveraged the issues' descriptions and the project
history to build prediction models, and validated the predictions with
contributors (n=20) of the projects. Our results show that (i) newcomers to the
project consider API-domain labels useful in choosing tasks, (ii) labels can be
predicted with a precision of 84% and a recall of 78.6% on average, (iii) the
results of the predictions reached up to 71.3% in precision and 52.5% in recall
when training with a project and testing in another (transfer learning), and
(iv) project contributors consider most of the predictions helpful in
identifying needed skills. These findings suggest our approach can be applied
in practice to automatically label issues, assisting developers in finding
tasks that better match their skills.
- Abstract(参考訳): 完了に必要なスキルをラベル付けすることで、コントリビュータがオープンソースプロジェクトのタスクを選択するのに役立つ。
しかし、手動で問題をラベリングするのは時間がかかり、エラーが発生しやすいため、現在の自動化アプローチは、主にバグ/非バグとして問題を分類することに限られている。
ハイレベルなAPIカテゴリである“APIドメイン”と呼ばれる問題の自動ラベリングの実現可能性と妥当性について検討する。
したがって、問題によって影響を受けるソースコードで使用されるAPIは、この問題に取り組むために必要なスキル(DB、セキュリティ、UIなど)のプロキシになり得ると仮定する。
ユーザ調査(n=74)を実施し,潜在的コントリビュータに対するapiドメインラベルの関連性を評価し,問題の記述とプロジェクト履歴を活用して予測モデルを構築し,プロジェクトのコントリビュータ(n=20)による予測を検証する。
私たちの結果は
i) プロジェクトの新参者は、タスクの選択に有用なAPIドメインラベルを検討する。
(ii)ラベルは、84%の精度で平均78.6%のリコールで予測できる。
三 プロジェクトと訓練し、他の分野での試験を行うときの精度が71.3%、リコール率52.5%に達すること。
(iv)プロジェクトコントリビュータは、必要なスキルを特定するのに役立つ予測のほとんどを考慮する。
これらの結果から,我々のアプローチは問題を自動的にラベル付けするために実践的に適用可能であることが示唆された。
関連論文リスト
- Leveraging Large Language Models for Efficient Failure Analysis in Game Development [47.618236610219554]
本稿では,テストの失敗の原因となるコードの変更を自動的に識別する手法を提案する。
このメソッドは、LLM(Large Language Models)を利用して、エラーメッセージと対応するコード変更を関連付ける。
当社のアプローチは新たに作成したデータセットで71%の精度に達しています。
論文 参考訳(メタデータ) (2024-06-11T09:21:50Z) - MaintainoMATE: A GitHub App for Intelligent Automation of Maintenance
Activities [3.2228025627337864]
ソフトウェア開発プロジェクトは、バグ報告や強化要求といったメンテナンスタスクの追跡の中心にある問題追跡システムに依存している。
問題レポートの処理は極めて重要であり、問題レポートに入力されたテキストを徹底的にスキャンする必要があるため、労働集約的な作業となる。
各カテゴリのイシューレポートを自動的に分類し,関連する専門知識を持つ開発者にイシューレポートを割り当てることのできる,MaintainoMATEという統合フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-31T05:15:42Z) - GiveMeLabeledIssues: An Open Source Issue Recommendation System [9.312780130838952]
開発者はしばしば、オープンソースソフトウェア(OSS)プロジェクトのイシュートラッキングシステムをナビゲートして、適切なタスクを見つけるのに苦労します。
本稿では,プロジェクトリポジトリをマイニングし,課題を解決に必要なスキルに基づいてラベル付けするツールを提案する。
GiveMeLabeledIssuesは開発者のスキルとタスクのマッチングを容易にし、プロジェクトのメンテナの負担を軽減する。
論文 参考訳(メタデータ) (2023-03-23T16:39:31Z) - Supporting the Task-driven Skill Identification in Open Source Project
Issue Tracking Systems [0.0]
コントリビュータがコントリビュータのタスクを選択するのを支援するために,オープンイシュー戦略の自動ラベル付けについて検討する。
スキルを特定することで、コントリビュータ候補はより適切なタスクを選択するべきだ、と私たちは主張する。
本研究では,実験におけるラベルの関連性を定量的に分析し,戦略の相対的重要性を比較した。
論文 参考訳(メタデータ) (2022-11-02T14:17:22Z) - Automatic Issue Classifier: A Transfer Learning Framework for
Classifying Issue Reports [0.0]
私たちはRoBERTaと呼ばれる既製のニューラルネットワークを使って、問題を分類しています。
本稿では,問題レポートを複数ラベル設定で分類するアプローチを提案する。我々はRoBERTaと呼ばれる市販のニューラルネットワークを用いて,問題レポートの分類を行う。
論文 参考訳(メタデータ) (2022-02-12T21:43:08Z) - Competency Problems: On Finding and Removing Artifacts in Language Data [50.09608320112584]
複雑な言語理解タスクでは、すべての単純な特徴相関が突発的であると論じる。
人間バイアスを考慮したコンピテンシー問題に対するデータ作成の難しさを理論的に分析します。
論文 参考訳(メタデータ) (2021-04-17T21:34:10Z) - Just Label What You Need: Fine-Grained Active Selection for Perception
and Prediction through Partially Labeled Scenes [78.23907801786827]
提案手法は,コストに配慮した手法と,部分的にラベル付けされたシーンを通じて詳細なサンプル選択を可能にする一般化を導入している。
実世界の大規模自動運転データセットに関する我々の実験は、微粒な選択が知覚、予測、下流計画タスクのパフォーマンスを向上させることを示唆している。
論文 参考訳(メタデータ) (2021-04-08T17:57:41Z) - Can I Solve It? Identifying APIs Required to Complete OSS Task [16.13269535068818]
タスク完了に必要なAPIのドメインに対するラベリング問題の実現可能性と関連性を検討する。
問題の記述とプロジェクト履歴を利用して予測モデルを構築し,精度を最大82%まで向上させ,最大97.8%をリコールした。
私たちの結果は、問題を自動的にラベル付けするツールの作成を刺激し、開発者がスキルに合致するタスクを見つけるのに役立ちます。
論文 参考訳(メタデータ) (2021-03-23T16:16:09Z) - Exploiting Context for Robustness to Label Noise in Active Learning [47.341705184013804]
本稿では,どのラベルが間違っているのかをシステムがどのように識別するか,ラベルノイズの負の影響を最小限に抑えるために,マルチクラスアクティブラーニングシステムをどのように適用できるか,といった課題に対処する。
我々は、これらの関係を符号化し、ノイズラベルが利用できる場合にグラフ上の新しい信念を得るために、ラベルなしデータのグラフィカルな表現を構築した。
これはシーン分類、アクティビティ分類、文書分類の3つの異なる応用で実証されている。
論文 参考訳(メタデータ) (2020-10-18T18:59:44Z) - Adaptive Self-training for Few-shot Neural Sequence Labeling [55.43109437200101]
ニューラルシークエンスラベリングモデルにおけるラベル不足問題に対処する手法を開発した。
自己学習は、大量のラベルのないデータから学ぶための効果的なメカニズムとして機能する。
メタラーニングは、適応的なサンプル再重み付けにおいて、ノイズのある擬似ラベルからのエラー伝播を軽減するのに役立つ。
論文 参考訳(メタデータ) (2020-10-07T22:29:05Z) - Adversarial Knowledge Transfer from Unlabeled Data [62.97253639100014]
本稿では,インターネット規模の未ラベルデータから知識を伝達し,分類器の性能を向上させるための新しいAdversarial Knowledge Transferフレームワークを提案する。
我々の手法の重要な新しい側面は、ラベル付けされていないソースデータは、ラベル付けされたターゲットデータと異なるクラスであることができ、個別のプリテキストタスクを定義する必要がないことである。
論文 参考訳(メタデータ) (2020-08-13T08:04:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。