論文の概要: Supporting the Task-driven Skill Identification in Open Source Project
Issue Tracking Systems
- arxiv url: http://arxiv.org/abs/2211.08143v1
- Date: Wed, 2 Nov 2022 14:17:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-20 13:41:08.784771
- Title: Supporting the Task-driven Skill Identification in Open Source Project
Issue Tracking Systems
- Title(参考訳): オープンソースプロジェクト課題追跡システムにおけるタスク駆動スキル識別支援
- Authors: Fabio Santos
- Abstract要約: コントリビュータがコントリビュータのタスクを選択するのを支援するために,オープンイシュー戦略の自動ラベル付けについて検討する。
スキルを特定することで、コントリビュータ候補はより適切なタスクを選択するべきだ、と私たちは主張する。
本研究では,実験におけるラベルの関連性を定量的に分析し,戦略の相対的重要性を比較した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Selecting an appropriate task is challenging for contributors to Open Source
Software (OSS), mainly for those who are contributing for the first time.
Therefore, researchers and OSS projects have proposed various strategies to aid
newcomers, including labeling tasks. We investigate the automatic labeling of
open issues strategy to help the contributors to pick a task to contribute. We
label the issues with API-domains--categories of APIs parsed from the source
code used to solve the issues. We plan to add social network analysis metrics
from the issues conversations as new predictors. By identifying the skills, we
claim the contributor candidates should pick a task more suitable. We analyzed
interview transcripts and the survey's open-ended questions to comprehend the
strategies used to assist in onboarding contributors and used to pick up an
issue. We applied quantitative studies to analyze the relevance of the labels
in an experiment and compare the strategies' relative importance. We also mined
issue data from OSS repositories to predict the API-domain labels with
comparable precision, recall, and F-measure with the state-of-art. We plan to
use a skill ontology to assist the matching process between contributors and
tasks. By analyzing the confidence level of the matching instances in
ontologies describing contributors' skills and tasks, we might recommend issues
for contribution. So far, the results showed that organizing the issues--which
includes assigning labels is seen as an essential strategy for diverse roles in
OSS communities. The API-domain labels are relevant for experienced
practitioners. The predictions have an average precision of 75.5%. Labeling the
issues indicates the skills involved in an issue. The labels represent possible
skills in the source code related to an issue. By investigating this research
topic, we expect to assist the new contributors in finding a task.
- Abstract(参考訳): 適切なタスクを選択することは、オープンソースソフトウェア(OSS)へのコントリビュータにとって難しい。
そのため、研究者やOSSプロジェクトは、ラベル付けタスクを含む新参者を支援するための様々な戦略を提案している。
コントリビュータが貢献するタスクを選択するのを支援するために,オープンイシュー戦略の自動ラベル付けについて検討する。
apiドメインの問題をラベル付けします – 問題を解決するために使用するソースコードからパースされたapiのカテゴリです。
問題会話からソーシャルネットワーク分析のメトリクスを新しい予測指標として追加する計画である。
スキルを特定することで、コントリビュート候補はより適切なタスクを選択するべきだと主張する。
インタビューの書き起こしと調査の未解決の質問を分析して,参加者の参加を支援する戦略を理解し,問題に対処した。
実験におけるラベルの関連性を分析するために定量的研究を行い,戦略の相対的重要性を比較した。
またOSSレポジトリのイシューデータをマイニングして,最先端のAPIドメインラベルと同等の精度,リコール,F尺度を予測しました。
コントリビュータとタスクのマッチングプロセスを支援するために,スキルオントロジーを使用する予定です。
コントリビュータのスキルとタスクを説明するオントロジーにおけるマッチングインスタンスの信頼性レベルを分析することで、コントリビュータの課題を推奨する。
これまでのところ、ラベルの割り当てを含む課題の整理はOSSコミュニティにおける多様な役割にとって不可欠な戦略であると考えられている。
apiドメインのラベルは経験豊富な実践者に関連する。
平均精度は75.5%である。
問題のラベル付けは、問題に関わるスキルを示しています。
ラベルは、問題に関連するソースコードの潜在的なスキルを表す。
この研究トピックを調査することで、新しいコントリビュータがタスクを見つけるのを支援できることを期待する。
関連論文リスト
- A Unified Causal View of Instruction Tuning [76.1000380429553]
メタ構造因果モデル(meta-SCM)を開発し、異なるNLPタスクをデータの単一因果構造の下で統合する。
主なアイデアは、タスク要求因果関係を学習し、タスクの予測にのみそれらを使用することである。
論文 参考訳(メタデータ) (2024-02-09T07:12:56Z) - Can GitHub Issues Help in App Review Classifications? [0.7366405857677226]
GitHubイシューから抽出した情報を活用することでラベル付きデータセットの拡張を支援する新しいアプローチを提案する。
以上の結果から,データ拡張にラベル付き問題を用いることで,F1スコアが6.3,機能要求が7.2に向上することが示された。
論文 参考訳(メタデータ) (2023-08-27T22:01:24Z) - Tag that issue: Applying API-domain labels in issue tracking systems [20.701637107734996]
完了に必要なスキルをラベル付けすることで、コントリビュータがオープンソースプロジェクトのタスクを選択するのに役立ちます。
ハイレベルなAPIカテゴリである“APIドメイン”と呼ばれる問題の自動ラベリングの実現可能性と妥当性について検討する。
以上の結果から, 課題選択に有用なAPIドメインラベル, (ii) ラベルの精度は84%, 平均で78.6%, (iii) 予測結果が71.3%, 52.5%まで到達した。
論文 参考訳(メタデータ) (2023-04-06T05:49:46Z) - Relational Multi-Task Learning: Modeling Relations between Data and
Tasks [84.41620970886483]
マルチタスク学習における主要な前提は、推論時にモデルが与えられたデータポイントにのみアクセスできるが、他のタスクからのデータポイントのラベルにはアクセスできないことである。
ここでは、補助的なタスクからデータポイントラベルを活用してより正確な予測を行う、新しいリレーショナルマルチタスク学習環境を提案する。
私たちはMetaLinkを開発し、そこではデータポイントとタスクを接続するナレッジグラフを構築します。
論文 参考訳(メタデータ) (2023-03-14T07:15:41Z) - UniKGQA: Unified Retrieval and Reasoning for Solving Multi-hop Question
Answering Over Knowledge Graph [89.98762327725112]
KGQA(Multi-hop Question Answering over Knowledge Graph)は、自然言語の質問で言及されているトピックエンティティから、複数のホップを持つ回答エンティティを見つけることを目的としている。
我々は、モデルアーキテクチャとパラメータ学習の両方において、検索と推論を統合することで、マルチホップKGQAタスクの新しいアプローチであるUniKGQAを提案する。
論文 参考訳(メタデータ) (2022-12-02T04:08:09Z) - Identify ambiguous tasks combining crowdsourced labels by weighting
Areas Under the Margin [13.437403258942716]
曖昧なタスクは専門家の労働者を騙しかねない。
我々は、クラウドソースの学習シナリオにおいて、誤ってラベル付けされたデータを識別するために、AUM(Area Under the Margin)を適用する。
WAUMは、トレーニングセットからあいまいなタスクを捨てるのに役立ち、一般化性能が向上することを示す。
論文 参考訳(メタデータ) (2022-09-30T11:16:20Z) - Algorithmic Fairness Datasets: the Story so Far [68.45921483094705]
データ駆動アルゴリズムは、人々の幸福に直接影響し、批判的な決定をサポートするために、さまざまな領域で研究されている。
研究者のコミュニティは、既存のアルゴリズムの株式を調査し、新しいアルゴリズムを提案し、歴史的に不利な人口に対する自動意思決定のリスクと機会の理解を深めてきた。
公正な機械学習の進歩はデータに基づいており、適切に文書化された場合にのみ適切に使用できる。
残念なことに、アルゴリズムフェアネスコミュニティは、特定のリソース(オパシティ)に関する情報の不足と利用可能な情報の分散(スパーシティ)によって引き起こされる、集合的なデータドキュメント負債に悩まされている。
論文 参考訳(メタデータ) (2022-02-03T17:25:46Z) - Competency Problems: On Finding and Removing Artifacts in Language Data [50.09608320112584]
複雑な言語理解タスクでは、すべての単純な特徴相関が突発的であると論じる。
人間バイアスを考慮したコンピテンシー問題に対するデータ作成の難しさを理論的に分析します。
論文 参考訳(メタデータ) (2021-04-17T21:34:10Z) - Can I Solve It? Identifying APIs Required to Complete OSS Task [16.13269535068818]
タスク完了に必要なAPIのドメインに対するラベリング問題の実現可能性と関連性を検討する。
問題の記述とプロジェクト履歴を利用して予測モデルを構築し,精度を最大82%まで向上させ,最大97.8%をリコールした。
私たちの結果は、問題を自動的にラベル付けするツールの作成を刺激し、開発者がスキルに合致するタスクを見つけるのに役立ちます。
論文 参考訳(メタデータ) (2021-03-23T16:16:09Z) - Attention-based model for predicting question relatedness on Stack
Overflow [0.0]
Stack Overflowにおける質問間の関連性を自動的に予測するアテンションベースの文対相互作用モデル(ASIM)を提案する。
ASIMは、Precision、Recall、Micro-F1評価メトリクスのベースラインアプローチを大幅に改善しました。
私たちのモデルは、Ask Ubuntuの重複質問検出タスクでもうまく機能します。
論文 参考訳(メタデータ) (2021-03-19T12:18:03Z) - Mining Implicit Relevance Feedback from User Behavior for Web Question
Answering [92.45607094299181]
本研究は,ユーザ行動と通過関連性との関連性を検討するための最初の研究である。
提案手法は,追加のラベル付きデータを使わずにパスランキングの精度を大幅に向上させる。
実際にこの研究は、グローバルな商用検索エンジンにおけるQAサービスの人為的ラベリングコストを大幅に削減する効果が証明されている。
論文 参考訳(メタデータ) (2020-06-13T07:02:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。