論文の概要: Semantically-enhanced Topic Recommendation System for Software Projects
- arxiv url: http://arxiv.org/abs/2206.00085v1
- Date: Tue, 31 May 2022 19:54:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-02 13:37:36.746027
- Title: Semantically-enhanced Topic Recommendation System for Software Projects
- Title(参考訳): ソフトウェアプロジェクトのためのセマンティックなトピック推薦システム
- Authors: Maliheh Izadi, Mahtab Nejati, Abbas Heydarnoori
- Abstract要約: ソフトウェアリポジトリに関連するトピックをタグ付けすることで、さまざまなダウンストリームタスクを容易にすることができる。
ソフトウェアプロジェクトにトピックを推奨する作業は行われているが、これらのトピック間のセマンティックな関係は、これまで利用されていない。
トピック間のセマンティックな関係を組み込んだ,ソフトウェアプロジェクトへのタグ付けのための2つの推奨モデルを提案する。
- 参考スコア(独自算出の注目度): 2.0625936401496237
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Software-related platforms have enabled their users to collaboratively label
software entities with topics. Tagging software repositories with relevant
topics can be exploited for facilitating various downstream tasks. For
instance, a correct and complete set of topics assigned to a repository can
increase its visibility. Consequently, this improves the outcome of tasks such
as browsing, searching, navigation, and organization of repositories.
Unfortunately, assigned topics are usually highly noisy, and some repositories
do not have well-assigned topics. Thus, there have been efforts on recommending
topics for software projects, however, the semantic relationships among these
topics have not been exploited so far. We propose two recommender models for
tagging software projects that incorporate the semantic relationship among
topics. Our approach has two main phases; (1) we first take a collaborative
approach to curate a dataset of quality topics specifically for the domain of
software engineering and development. We also enrich this data with the
semantic relationships among these topics and encapsulate them in a knowledge
graph we call SED-KGraph. Then, (2) we build two recommender systems; The first
one operates only based on the list of original topics assigned to a repository
and the relationships specified in our knowledge graph. The second predictive
model, however, assumes there are no topics available for a repository, hence
it proceeds to predict the relevant topics based on both textual information of
a software project and SED-KGraph. We built SED-KGraph in a crowd-sourced
project with 170 contributors from both academia and industry. The experiment
results indicate that our solutions outperform baselines that neglect the
semantic relationships among topics by at least 25% and 23% in terms of ASR and
MAP metrics.
- Abstract(参考訳): ソフトウェア関連プラットフォームは、ユーザがソフトウェアエンティティにトピックを共同でラベル付けできるようにする。
ソフトウェアリポジトリに関連するトピックをタグ付けすることで、さまざまなダウンストリームタスクを容易にすることができる。
例えば、リポジトリに割り当てられたトピックの正しい完全なセットは、その可視性を高めることができる。
これにより、レポジトリのブラウジング、検索、ナビゲーション、組織化などのタスクの結果が改善される。
残念なことに、割り当てられたトピックは通常非常に騒がしく、いくつかのリポジトリは適切に割り当てられたトピックを持っていない。
このように、ソフトウェアプロジェクトにトピックを推奨する取り組みは行われているが、これらのトピック間のセマンティックな関係は、これまで利用されていない。
トピック間の意味的関係を包含するソフトウェアプロジェクトにタグづけするための2つの推奨モデルを提案する。
1)ソフトウェア工学と開発の分野に特化して品質トピックのデータセットをキュレートするための協調的なアプローチをとる。
また,これらのトピック間の意味的関係を強調し,sed-kgraphと呼ばれる知識グラフにカプセル化する。
ひとつはリポジトリに割り当てられたオリジナルのトピックのリストと,私たちのナレッジグラフで指定された関係に基づいてのみ動作します。
しかし、第2の予測モデルは、リポジトリにトピックが存在しないと仮定するため、ソフトウェアプロジェクトのテキスト情報とSED-KGraphの両方に基づいて関連するトピックを予測する。
私たちはSED-KGraphをクラウドソースプロジェクトとして開発しました。
その結果,ASRとMAPの指標では,トピック間のセマンティックな関係を少なくとも25%,23%無視するベースラインよりも優れた結果が得られた。
関連論文リスト
- Towards a Classification of Open-Source ML Models and Datasets for Software Engineering [52.257764273141184]
オープンソースの事前訓練モデル(PTM)とデータセットは、さまざまな機械学習(ML)タスクに広範なリソースを提供する。
これらのリソースには、ソフトウェア工学(SE)のニーズに合わせた分類がない。
我々は、人気のあるオープンソースのMLリポジトリであるHugging Face (HF)上で、SE指向の分類をPTMとデータセットに適用し、時間とともにPTMの進化を分析する。
論文 参考訳(メタデータ) (2024-11-14T18:52:05Z) - RepoGraph: Enhancing AI Software Engineering with Repository-level Code Graph [63.87660059104077]
RepoGraphは、現代のAIソフトウェアエンジニアリングソリューションのためのリポジトリレベルの構造を管理するプラグインモジュールである。
RepoGraphはすべてのシステムのパフォーマンスを大幅に向上させ、オープンソースフレームワークの間で新たな最先端技術を生み出している。
論文 参考訳(メタデータ) (2024-10-03T05:45:26Z) - Don't mention it: An approach to assess challenges to using software
mentions for citation and discoverability research [0.3268055538225029]
本研究では,このようなデータセットのユーザビリティを研究ソフトウェア研究のために評価する手法を提案する。
1つのデータセットは、前述のソフトウェアへのリンクをまったく提供しないが、もう1つのデータセットは、定量的研究の取り組みを妨げることができる。
ソフトウェア参照データセットを扱う際の最大の課題と根底にある問題は、ソフトウェア引用のまだ最適なプラクティスである。
論文 参考訳(メタデータ) (2024-02-22T14:51:17Z) - MaintainoMATE: A GitHub App for Intelligent Automation of Maintenance
Activities [3.2228025627337864]
ソフトウェア開発プロジェクトは、バグ報告や強化要求といったメンテナンスタスクの追跡の中心にある問題追跡システムに依存している。
問題レポートの処理は極めて重要であり、問題レポートに入力されたテキストを徹底的にスキャンする必要があるため、労働集約的な作業となる。
各カテゴリのイシューレポートを自動的に分類し,関連する専門知識を持つ開発者にイシューレポートを割り当てることのできる,MaintainoMATEという統合フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-31T05:15:42Z) - KMF: Knowledge-Aware Multi-Faceted Representation Learning for Zero-Shot
Node Classification [75.95647590619929]
Zero-Shot Node Classification (ZNC)は、グラフデータ分析において、新しく重要なタスクである。
ラベルセマンティクスの豊かさを向上する知識認識型多面的フレームワーク(KMF)を提案する。
ノード情報集約によるプロトタイプドリフトの問題を軽減するために,新しい幾何学的制約を開発した。
論文 参考訳(メタデータ) (2023-08-15T02:38:08Z) - UniKGQA: Unified Retrieval and Reasoning for Solving Multi-hop Question
Answering Over Knowledge Graph [89.98762327725112]
KGQA(Multi-hop Question Answering over Knowledge Graph)は、自然言語の質問で言及されているトピックエンティティから、複数のホップを持つ回答エンティティを見つけることを目的としている。
我々は、モデルアーキテクチャとパラメータ学習の両方において、検索と推論を統合することで、マルチホップKGQAタスクの新しいアプローチであるUniKGQAを提案する。
論文 参考訳(メタデータ) (2022-12-02T04:08:09Z) - Supporting the Task-driven Skill Identification in Open Source Project
Issue Tracking Systems [0.0]
コントリビュータがコントリビュータのタスクを選択するのを支援するために,オープンイシュー戦略の自動ラベル付けについて検討する。
スキルを特定することで、コントリビュータ候補はより適切なタスクを選択するべきだ、と私たちは主張する。
本研究では,実験におけるラベルの関連性を定量的に分析し,戦略の相対的重要性を比較した。
論文 参考訳(メタデータ) (2022-11-02T14:17:22Z) - Code Recommendation for Open Source Software Developers [32.181023933552694]
CODERは、オープンソースのソフトウェア開発者のための新しいグラフベースのコードレコメンデーションフレームワークである。
本フレームワークは,プロジェクト内,クロスプロジェクト,コールドスタートレコメンデーションなど,様々な実験環境下での優れた性能を実現する。
論文 参考訳(メタデータ) (2022-10-15T16:40:36Z) - Curriculum Graph Co-Teaching for Multi-Target Domain Adaptation [78.28390172958643]
マルチターゲットドメイン適応(MTDA)における複数のドメインシフトを軽減するのに役立つ2つの重要な側面を同定する。
本論文では,二重分類器ヘッドを用いたCGCT(Curriculum Graph Co-Teaching)を提案する。そのうちの1つがグラフ畳み込みネットワーク(GCN)である。
ドメインラベルが利用可能になると、まずより簡単なターゲットドメインに適応し、続いて難しいドメインに適応する逐次適応戦略であるDomain-Aware Curriculum Learning (DCL)を提案する。
論文 参考訳(メタデータ) (2021-04-01T23:41:41Z) - LabelGit: A Dataset for Software Repositories Classification using
Attributed Dependency Graphs [11.523471275501857]
LabelGitと呼ばれるGitHubプロジェクトの新しいデータセットを作成します。
私たちのデータセットは、依存関係グラフや識別子からのソースコードニューラル表現など、ソースコードからの直接的な情報を使用します。
プロキシに頼らず、ソースコード全体を分類するために使用するソリューションの開発を支援することを願っています。
論文 参考訳(メタデータ) (2021-03-16T07:28:58Z) - Bidirectional Graph Reasoning Network for Panoptic Segmentation [126.06251745669107]
本稿では,BGRNet(Bidirectional Graph Reasoning Network)を導入し,前景物と背景物間のモジュラー内およびモジュラー間関係について検討する。
BGRNetはまず、インスタンスとセマンティックセグメンテーションの両方でイメージ固有のグラフを構築し、提案レベルとクラスレベルで柔軟な推論を可能にする。
論文 参考訳(メタデータ) (2020-04-14T02:32:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。