論文の概要: Automated Recovery of Issue-Commit Links Leveraging Both Textual and
Non-textual Data
- arxiv url: http://arxiv.org/abs/2107.01894v1
- Date: Mon, 5 Jul 2021 09:38:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-06 14:43:24.266916
- Title: Automated Recovery of Issue-Commit Links Leveraging Both Textual and
Non-textual Data
- Title(参考訳): テキストデータと非テキストデータの両方を利用した課題コミットリンクの自動復元
- Authors: Pooya Rostami Mazrae, Maliheh Izadi, Abbas Heydarnoori
- Abstract要約: 自動コミット-イシューリンクに対する最先端のアプローチは、精度の低下に悩まされ、信頼性の低い結果に繋がる。
本稿では,2つの情報チャネルを活用することで,このような制限を克服するハイブリッドリンクを提案する。
我々は、競合するアプローチであるFRLinkとDeepLinkに対して、12のプロジェクトのデータセットでHybrid-Linkerを評価した。
- 参考スコア(独自算出の注目度): 2.578242050187029
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An issue documents discussions around required changes in issue-tracking
systems, while a commit contains the change itself in the version control
systems. Recovering links between issues and commits can facilitate many
software evolution tasks such as bug localization, and software documentation.
A previous study on over half a million issues from GitHub reports only about
42.2% of issues are manually linked by developers to their pertinent commits.
Automating the linking of commit-issue pairs can contribute to the improvement
of the said tasks. By far, current state-of-the-art approaches for automated
commit-issue linking suffer from low precision, leading to unreliable results,
sometimes to the point that imposes human supervision on the predicted links.
The low performance gets even more severe when there is a lack of textual
information in either commits or issues. Current approaches are also proven
computationally expensive.
We propose Hybrid-Linker to overcome such limitations by exploiting two
information channels; (1) a non-textual-based component that operates on
non-textual, automatically recorded information of the commit-issue pairs to
predict a link, and (2) a textual-based one which does the same using textual
information of the commit-issue pairs. Then, combining the results from the two
classifiers, Hybrid-Linker makes the final prediction. Thus, every time one
component falls short in predicting a link, the other component fills the gap
and improves the results. We evaluate Hybrid-Linker against competing
approaches, namely FRLink and DeepLink on a dataset of 12 projects.
Hybrid-Linker achieves 90.1%, 87.8%, and 88.9% based on recall, precision, and
F-measure, respectively. It also outperforms FRLink and DeepLink by 31.3%, and
41.3%, regarding the F-measure. Moreover, Hybrid-Linker exhibits extensive
improvements in terms of performance as well.
- Abstract(参考訳): 課題は課題追跡システムに必要な変更に関する議論を文書化し、コミットはバージョン管理システムにその変更自体を含む。
問題とコミットの間のリンクを回復することで、バグローカライゼーションやソフトウェアドキュメントなど、多くのソフトウェア進化タスクが促進される。
GitHubの50万件以上のイシューに関する以前の調査では、開発者が手動で関連するコミットにリンクしている問題の42.2%しか報告されていない。
コミットとイシューのペアのリンクを自動化することは、そのタスクの改善に貢献します。
これまでのところ、コミット発行の自動リンクに関する最先端のアプローチは、精度が低く、信頼性が低く、予測されたリンクに人的監督を課すことがある。
コミットや問題のいずれかにテキスト情報がない場合、パフォーマンスの低下はさらに深刻になる。
現在のアプローチは計算コストも高いことが証明されている。
このような制約を克服するために,(1)非テキストベースコンポーネント,(2)コミット発行ペアの情報を自動記録してリンクを予測する,(2)コミット発行ペアのテキスト情報を用いたテキストベースコンポーネントという,2つの情報チャネルを活用するハイブリッドリンカを提案する。
そして、2つの分類器の結果を組み合わせることで、hybrid-linkerは最終的な予測を行う。
したがって、あるコンポーネントがリンクの予測に不足するたびに、他のコンポーネントがそのギャップを埋め、結果を改善する。
12プロジェクトのデータセット上で,frlinkとdeeplinkという競合するアプローチに対して,ハイブリッドリンカを評価する。
ハイブリッドリンカーはそれぞれリコール、精度、f測定に基づいて90.1%、87.8%、88.9%を達成する。
またFRLinkとDeepLinkを31.3%、F対策に関して41.3%上回っている。
さらに、Hybrid-Linkerはパフォーマンスも大幅に改善されている。
関連論文リスト
- Localizing Factual Inconsistencies in Attributable Text Generation [91.981439746404]
本稿では,帰属可能なテキスト生成における事実の不整合をローカライズするための新しい形式であるQASemConsistencyを紹介する。
まず,人間のアノテーションに対するQASemConsistency法の有効性を示す。
そこで我々は,局所的な事実の不整合を自動的に検出するいくつかの手法を実装した。
論文 参考訳(メタデータ) (2024-10-09T22:53:48Z) - Relation Rectification in Diffusion Model [64.84686527988809]
本稿では,最初に生成できない関係を正確に表現するためにモデルを洗練することを目的とした,リレーション・リクティフィケーション(Relation Rectification)と呼ばれる新しいタスクを紹介する。
異種グラフ畳み込みネットワーク(HGCN)を利用した革新的な解を提案する。
軽量HGCNは、テキストエンコーダによって生成されたテキスト埋め込みを調整し、埋め込み空間におけるテキスト関係の正確な反映を保証する。
論文 参考訳(メタデータ) (2024-03-29T15:54:36Z) - EALink: An Efficient and Accurate Pre-trained Framework for Issue-Commit
Link Recovery [54.34661595290837]
本稿では,イシュー・コミット・リンク・リカバリのためのEALinkという,効率的かつ正確な事前学習フレームワークを提案する。
大規模なデータセットを構築し、EALinkのパワーを実証するための広範な実験を行う。
その結果、EALinkは様々な評価指標において、最先端の手法よりも大きなマージン(15.23%-408.65%)優れていることがわかった。
論文 参考訳(メタデータ) (2023-08-21T14:46:43Z) - CONVERT:Contrastive Graph Clustering with Reliable Augmentation [110.46658439733106]
信頼性オーグメンテーション(CONVERT)を用いたContrastiVe Graph ClustEringネットワークを提案する。
本手法では,データ拡張を可逆的パーターブ・リカバリネットワークにより処理する。
セマンティクスの信頼性をさらに保証するために、ネットワークを制約する新たなセマンティクス損失が提示される。
論文 参考訳(メタデータ) (2023-08-17T13:07:09Z) - Delving into Commit-Issue Correlation to Enhance Commit Message
Generation Models [13.605167159285374]
コミットメッセージ生成は、自動化されたソフトウェアエンジニアリングにおいて難しいタスクである。
ツールとは,コミットとイシューの相関関係をモデルのトレーニングフェーズに導入する,新たなパラダイムだ。
その結果,元モデルと比較して,ツール強化モデルの性能は大幅に向上した。
論文 参考訳(メタデータ) (2023-07-31T20:35:00Z) - Beyond Duplicates: Towards Understanding and Predicting Link Types in
Issue Tracking Systems [8.916420423563478]
15のパブリックリポジトリで698,790件のリンクを607,208件調べました。
一般関係リンクは、重複や時間/因果関係よりも非常に高い推移性スコアを持つ。
論文 参考訳(メタデータ) (2022-04-27T12:57:12Z) - Sketch and Refine: Towards Faithful and Informative Table-to-Text
Generation [58.320248632121476]
自己回帰世代と非自己回帰世代(SANA)を組み合わせた新しい2段階法を提案する。
提案手法は,(1)ソーステーブルからキートークンを選択するための自己回帰ポインタネットワークを用いた骨格生成,(2)反復挿入と削除操作によるテキスト生成のための編集ベースの非自己回帰生成モデルを含む。
骨格から厳しい制約を統合することで、非自己回帰モデルはソーステーブル上の生成のカバレッジを改善し、その忠実性を高める。
論文 参考訳(メタデータ) (2021-05-31T08:18:13Z) - Predicting Links on Wikipedia with Anchor Text Information [0.571097144710995]
英語ウィキペディアのいくつかのサブセットにおけるリンク予測の帰納的タスクと帰納的タスクについて検討する。
本稿では,適切な評価サンプリング手法を提案し,いくつかのアルゴリズムを比較した。
論文 参考訳(メタデータ) (2021-05-25T07:57:57Z) - Automated Mapping of Vulnerability Advisories onto their Fix Commits in
Open Source Repositories [7.629717457706326]
実践経験と機械学習(ML)を組み合わせたアプローチを提案する。
アドバイザリから脆弱性に関する鍵情報を含むアドバイザリレコードを抽出する。
影響を受けるプロジェクトのソースコードリポジトリから、候補となる修正コミットのサブセットを取得する。
論文 参考訳(メタデータ) (2021-03-24T17:50:35Z) - Conditioned Text Generation with Transfer for Closed-Domain Dialogue
Systems [65.48663492703557]
条件付き変分オートエンコーダを用いて,意図特化文の生成を最適に学習し,制御する方法を示す。
クエリ転送と呼ばれる新しいプロトコルを導入し、大規模で遅延のないデータセットを活用できるようにします。
論文 参考訳(メタデータ) (2020-11-03T14:06:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。