論文の概要: Beyond Duplicates: Towards Understanding and Predicting Link Types in
Issue Tracking Systems
- arxiv url: http://arxiv.org/abs/2204.12893v1
- Date: Wed, 27 Apr 2022 12:57:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-28 14:09:49.231795
- Title: Beyond Duplicates: Towards Understanding and Predicting Link Types in
Issue Tracking Systems
- Title(参考訳): Beyond Duplicates: 問題追跡システムにおけるリンクタイプ理解と予測
- Authors: Clara Marie L\"uders, Abir Bouraffa and Walid Maalej
- Abstract要約: 15のパブリックリポジトリで698,790件のリンクを607,208件調べました。
一般関係リンクは、重複や時間/因果関係よりも非常に高い推移性スコアを持つ。
- 参考スコア(独自算出の注目度): 8.916420423563478
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Software projects use Issue Tracking Systems (ITS) like JIRA to track issues
and organize the workflows around them. Issues are often inter-connected via
different links such as the default JIRA link types Duplicate, Relate, Block,
or Subtask. While previous research has mostly focused on analyzing and
predicting duplication links, this work aims at understanding the various other
link types, their prevalence, and characteristics towards a more reliable link
type prediction. For this, we studied 607,208 links connecting 698,790 issues
in 15 public JIRA repositories. Besides the default types, the custom types
Depend, Incorporate, Split, and Cause were also common. We manually grouped all
75 link types used in the repositories into five general categories: General
Relation, Duplication, Composition, Temporal / Causal, and Workflow. Comparing
the structures of the corresponding graphs, we observed several trends. For
instance, Duplication links tend to represent simpler issue graphs often with
two components and Composition links present the highest amount of hierarchical
tree structures (97.7%). Surprisingly, General Relation links have a
significantly higher transitivity score than Duplication and Temporal / Causal
links. Motivated by the differences between the link types and by their
popularity, we evaluated the robustness of two state-of-the-art duplicate
detection approaches from the literature on the JIRA dataset. We found that
current deep-learning approaches confuse between Duplication and other links in
almost all repositories. On average, the classification accuracy dropped by 6%
for one approach and 12% for the other. Extending the training sets with other
link types seems to partly solve this issue. We discuss our findings and their
implications for research and practice.
- Abstract(参考訳): ソフトウェアプロジェクトはjiraのようなイシュートラッキングシステム(it)を使用してイシューを追跡し、それを取り巻くワークフローを整理する。
問題は、しばしば、デフォルトのJIRAリンクタイプDuplicate、Relate、Block、Subtaskなど、異なるリンクを介して接続される。
従来の研究は主に重複リンクの分析と予測に重点を置いてきたが、本研究は、他の様々なリンクタイプ、その頻度、およびより信頼性の高いリンクタイプ予測に対する特性を理解することを目的としている。
このために15のパブリックJIRAリポジトリで698,790の問題を接続する607,208のリンクを調査した。
デフォルト型に加えて、カスタム型は依存、インクルード、分割、および原因も共通していた。
リポジトリで使用される75のリンクタイプはすべて、ジェネリックリレーション、重複、コンポジション、テンポラル/因果、ワークフローの5つの一般的なカテゴリに手動でグループ化しました。
対応するグラフの構造を比較すると,いくつかの傾向が見られた。
例えば、重複リンクは2つのコンポーネントを持つ単純な問題グラフを表すことが多く、構成リンクは最も高い階層木構造(97.7%)を示す。
驚いたことに、一般関係リンクは重複や時間/因果関係よりも非常に高い推移性スコアを持つ。
リンクタイプの違いと人気の高さから,JIRAデータセットの文献からの2つの最先端重複検出手法の堅牢性を評価した。
現在のディープラーニングアプローチは,ほぼすべてのリポジトリの重複とリンクを混同していることが分かりました。
平均的な分類精度は1つのアプローチで6%、もう1つのアプローチで12%低下した。
他のリンクタイプでトレーニングセットを拡張することは、この問題を部分的に解決しているようだ。
研究と実践における知見とその意義について論じる。
関連論文リスト
- Hydra-SGG: Hybrid Relation Assignment for One-stage Scene Graph Generation [57.69385990442078]
Hydra-SGGはVG150で10.6 mR@20と16.0 mR@50で最先端のパフォーマンスを達成し、訓練期間は12時間に過ぎなかった。
また、Open Images V6とGQAに新たな最先端技術が設定されている。
論文 参考訳(メタデータ) (2024-09-16T13:13:06Z) - Link-aware link prediction over temporal graph by pattern recognition [0.0]
時間グラフはリンクのストリームと見なすことができ、それぞれが特定の時間に2つのノード間の相互作用を表す。
時間グラフでは、リンク予測は一般的なタスクであり、クエリリンクが真かどうかに答えることを目的としている。
本稿では,リンク認識モデルを提案する。 履歴リンクとクエリリンクは,以下のモデル層にまとめて入力される。
6つのデータセットの実験により、我々のモデルは最先端のベースラインと比較して高い性能を達成できた。
論文 参考訳(メタデータ) (2024-02-11T13:26:06Z) - List-aware Reranking-Truncation Joint Model for Search and
Retrieval-augmented Generation [80.12531449946655]
本稿では,2つのタスクを同時に実行可能なRe rank-Truncation joint model(GenRT)を提案する。
GenRTは、エンコーダ-デコーダアーキテクチャに基づく生成パラダイムによるリランクとトランケーションを統合している。
提案手法は,Web検索および検索拡張LLMにおけるリランクタスクとトラルケーションタスクの両方においてSOTA性能を実現する。
論文 参考訳(メタデータ) (2024-02-05T06:52:53Z) - UniKGQA: Unified Retrieval and Reasoning for Solving Multi-hop Question
Answering Over Knowledge Graph [89.98762327725112]
KGQA(Multi-hop Question Answering over Knowledge Graph)は、自然言語の質問で言及されているトピックエンティティから、複数のホップを持つ回答エンティティを見つけることを目的としている。
我々は、モデルアーキテクチャとパラメータ学習の両方において、検索と推論を統合することで、マルチホップKGQAタスクの新しいアプローチであるUniKGQAを提案する。
論文 参考訳(メタデータ) (2022-12-02T04:08:09Z) - Pre-training for Information Retrieval: Are Hyperlinks Fully Explored? [19.862211305690916]
本稿では,事前学習におけるハイパーリンクの利用を検討するために,プログレッシブハイパーリンク予測(PHP)フレームワークを提案する。
2つの大規模アドホック検索データセットと6つの質問回答データセットの実験結果は、既存の事前学習手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-09-14T12:03:31Z) - Automated Recovery of Issue-Commit Links Leveraging Both Textual and
Non-textual Data [2.578242050187029]
自動コミット-イシューリンクに対する最先端のアプローチは、精度の低下に悩まされ、信頼性の低い結果に繋がる。
本稿では,2つの情報チャネルを活用することで,このような制限を克服するハイブリッドリンクを提案する。
我々は、競合するアプローチであるFRLinkとDeepLinkに対して、12のプロジェクトのデータセットでHybrid-Linkerを評価した。
論文 参考訳(メタデータ) (2021-07-05T09:38:44Z) - SIRE: Separate Intra- and Inter-sentential Reasoning for Document-level
Relation Extraction [16.106186007445146]
本稿では,異なる方法で文内関係と文間関係を表現する効果的なアーキテクチャであるSIREを提案する。
公開データセットの実験では、SIREは以前の最先端メソッドよりも優れていた。
論文 参考訳(メタデータ) (2021-06-03T09:25:44Z) - Learning Relation Prototype from Unlabeled Texts for Long-tail Relation
Extraction [84.64435075778988]
本稿では,ラベルのないテキストから関係プロトタイプを学習するための一般的なアプローチを提案する。
我々は、エンティティ間の暗黙的な要因として関係プロトタイプを学習する。
私たちは、New York TimesとGoogle Distant Supervisionの2つの公開データセットで実験を行います。
論文 参考訳(メタデータ) (2020-11-27T06:21:12Z) - Learning to Decouple Relations: Few-Shot Relation Classification with
Entity-Guided Attention and Confusion-Aware Training [49.9995628166064]
本稿では,2つのメカニズムを備えたモデルであるCTEGを提案する。
一方、注意を誘導するEGA機構を導入し、混乱を引き起こす情報をフィルタリングする。
一方,コンフュージョン・アウェア・トレーニング(CAT)法は,関係の識別を明示的に学習するために提案されている。
論文 参考訳(メタデータ) (2020-10-21T11:07:53Z) - Connecting the Dots: Multivariate Time Series Forecasting with Graph
Neural Networks [91.65637773358347]
多変量時系列データに特化して設計された汎用グラフニューラルネットワークフレームワークを提案する。
グラフ学習モジュールを用いて,変数間の一方向関係を自動的に抽出する。
提案手法は,4つのベンチマークデータセットのうち3つにおいて,最先端のベースライン手法よりも優れている。
論文 参考訳(メタデータ) (2020-05-24T04:02:18Z) - Analyzing Knowledge Graph Embedding Methods from a Multi-Embedding
Interaction Perspective [3.718476964451589]
実世界の知識グラフは通常不完全であるため、この問題に対処するために知識グラフ埋め込み法が提案されている。
これらの方法は、実体と関係を意味空間に埋め込まれたベクトルとして表現し、それらの間のリンクを予測する。
四元数代数に基づく新しいマルチエンベディングモデルを提案し、人気のあるベンチマークを用いて有望な結果が得られることを示す。
論文 参考訳(メタデータ) (2019-03-27T13:09:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。