論文の概要: IssueCourier: Multi-Relational Heterogeneous Temporal Graph Neural Network for Open-Source Issue Assignment
- arxiv url: http://arxiv.org/abs/2505.11205v3
- Date: Tue, 10 Jun 2025 07:57:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-11 12:52:34.236078
- Title: IssueCourier: Multi-Relational Heterogeneous Temporal Graph Neural Network for Open-Source Issue Assignment
- Title(参考訳): IssueCourier:オープンソース課題割り当てのためのマルチリレーショナル異種時間グラフニューラルネットワーク
- Authors: Chunying Zhou, Xiaoyuan Xie, Gong Chen, Peng He, Bing Li,
- Abstract要約: 課題割り当ては、オープンソースソフトウェア(OSS)のメンテナンスにおいて重要な役割を果たす。
本稿では,課題割当てのための新しいマルチリレーショナル不均一な時間グラフニューラルネットワークである IssueCourier を提案する。
IssueCourierはトップ-1で45.49%、MRRで31.97%まで改善可能である。
- 参考スコア(独自算出の注目度): 5.1987901165589
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Issue assignment plays a critical role in open-source software (OSS) maintenance, which involves recommending the most suitable developers to address the reported issues. Given the high volume of issue reports in large-scale projects, manually assigning issues is tedious and costly. Previous studies have proposed automated issue assignment approaches that primarily focus on modeling issue report textual information, developers' expertise, or interactions between issues and developers based on historical issue-fixing records. However, these approaches often suffer from performance limitations due to the presence of incorrect and missing labels in OSS datasets, as well as the long tail of developer contributions and the changes of developer activity as the project evolves. To address these challenges, we propose IssueCourier, a novel Multi-Relational Heterogeneous Temporal Graph Neural Network approach for issue assignment. Specifically, we formalize five key relationships among issues, developers, and source code files to construct a heterogeneous graph. Then, we further adopt a temporal slicing technique that partitions the graph into a sequence of time-based subgraphs to learn stage-specific patterns. Furthermore, we provide a benchmark dataset with relabeled ground truth to address the problem of incorrect and missing labels in existing OSS datasets. Finally, to evaluate the performance of IssueCourier, we conduct extensive experiments on our benchmark dataset. The results show that IssueCourier can improve over the best baseline up to 45.49% in top-1 and 31.97% in MRR.
- Abstract(参考訳): 課題の割り当ては、報告された問題に対処するために最も適した開発者を推奨するオープンソースソフトウェア(OSS)のメンテナンスにおいて重要な役割を果たす。
大規模プロジェクトにおける大量のイシューレポートを考えると、手動でイシューを割り当てるのは面倒でコストがかかる。
従来の研究では、主にレポートのテキスト情報、開発者の専門知識、過去の問題修正記録に基づく問題と開発者間のインタラクションのモデリングに焦点を当てた、自動的な課題割り当てアプローチが提案されている。
しかしながら、これらのアプローチは、OSSデータセットに不正なラベルと欠落しているラベルの存在と、開発者のコントリビューションの長い尾と、プロジェクトが進化するにつれて開発者の活動の変化によって、パフォーマンス上の制限に悩まされることが多い。
これらの課題に対処するために,課題割当てのための新しいマルチリレーショナル・ヘテロジニア・テンポラルグラフニューラルネットワークである IssueCourier を提案する。
具体的には、問題、開発者、ソースコードファイル間の5つの重要な関係を形式化し、異種グラフを構築する。
そこで我々はさらに,グラフを時系列の時系列に分割し,ステージ固有のパターンを学習する時間スライシング手法を採用した。
さらに,既存のOSSデータセットにおける誤りラベルと欠落ラベルの問題に対処するために,既知の真理を緩和したベンチマークデータセットを提供する。
最後に、IssageCourierの性能を評価するために、ベンチマークデータセットで広範な実験を行う。
その結果、イシュークーリエはトップ-1では45.49%、MRRでは31.97%まで改善できることがわかった。
関連論文リスト
- Towards an Interpretable Analysis for Estimating the Resolution Time of Software Issues [1.4039240369201997]
プロジェクトごとに問題を修正するのに必要な実際の労力を抽出する問題監視システムを構築します。
提案手法では,トピックモデリングを用いて問題セマンティクスを抽出し,メタデータを解釈可能な解像度時間解析に活用する。
論文 参考訳(メタデータ) (2025-05-02T08:38:59Z) - Automated Bug Report Prioritization in Large Open-Source Projects [3.9134031118910264]
本稿では,バグレポートの自然言語テキストに基づく自動バグ優先順位付け手法を提案する。
我々は、TopicMiner-MTMと呼ばれるLDAの変種を用いてトピックモデリングを行い、BERT大言語モデルを用いてテキスト分類を行う。
Eclipse Platformプロジェクトの85,156のバグレポートを含む既存のリファレンスデータセットを用いた実験結果から、バグレポートの優先度予測の正確性、正確性、リコール、F1測定の点で、既存のアプローチよりも優れています。
論文 参考訳(メタデータ) (2025-04-22T13:57:48Z) - Graph-based Approaches and Functionalities in Retrieval-Augmented Generation: A Comprehensive Survey [15.60128530639056]
大規模な言語モデル(LLM)は、十分なトレーニングデータと最も更新された知識が不足しているため、推論中に事実エラーに悩まされる。
検索・拡張生成(RAG)はLLMの限界に対処するための有望な解決策として注目されている。
この調査は、RAG内のグラフの機能とパフォーマンス向上への影響について、新たな視点を提供する。
論文 参考訳(メタデータ) (2025-04-08T03:52:05Z) - Federated Neural Graph Databases [53.03085605769093]
プライバシを保ちながらマルチソースグラフベースのデータの推論を可能にする新しいフレームワークであるFederated Neural Graph Database (FedNGDB)を提案する。
既存の方法とは異なり、FedNGDBは複雑なグラフ構造と関係を扱うことができ、様々な下流タスクに適合する。
論文 参考訳(メタデータ) (2024-02-22T14:57:44Z) - Challenging the Myth of Graph Collaborative Filtering: a Reasoned and Reproducibility-driven Analysis [50.972595036856035]
本稿では,6つの人気グラフと最近のグラフ推薦モデルの結果を再現するコードを提案する。
これらのグラフモデルと従来の協調フィルタリングモデルを比較する。
ユーザの近所からの情報フローを調べることにより,データセット構造における内在的特徴にどのようなモデルが影響するかを同定することを目的とする。
論文 参考訳(メタデータ) (2023-08-01T09:31:44Z) - Supporting the Task-driven Skill Identification in Open Source Project
Issue Tracking Systems [0.0]
コントリビュータがコントリビュータのタスクを選択するのを支援するために,オープンイシュー戦略の自動ラベル付けについて検討する。
スキルを特定することで、コントリビュータ候補はより適切なタスクを選択するべきだ、と私たちは主張する。
本研究では,実験におけるラベルの関連性を定量的に分析し,戦略の相対的重要性を比較した。
論文 参考訳(メタデータ) (2022-11-02T14:17:22Z) - GeoQA: A Geometric Question Answering Benchmark Towards Multimodal
Numerical Reasoning [172.36214872466707]
我々は、テキスト記述、視覚図、定理知識の包括的理解を必要とする幾何学的問題を解くことに注力する。
そこで本研究では,5,010の幾何学的問題を含む幾何学的質問応答データセットGeoQAを提案する。
論文 参考訳(メタデータ) (2021-05-30T12:34:17Z) - Competency Problems: On Finding and Removing Artifacts in Language Data [50.09608320112584]
複雑な言語理解タスクでは、すべての単純な特徴相関が突発的であると論じる。
人間バイアスを考慮したコンピテンシー問題に対するデータ作成の難しさを理論的に分析します。
論文 参考訳(メタデータ) (2021-04-17T21:34:10Z) - Partially-Aligned Data-to-Text Generation with Distant Supervision [69.15410325679635]
我々はPADTG(Partially-Aligned Data-to-Text Generation)と呼ばれる新しい生成タスクを提案する。
自動的にアノテートされたデータをトレーニングに利用し、アプリケーションドメインを大幅に拡張するため、より実用的です。
我々のフレームワークは、全てのベースラインモデルより優れており、部分整合データの利用の可能性を検証する。
論文 参考訳(メタデータ) (2020-10-03T03:18:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。