論文の概要: On Using GUI Interaction Data to Improve Text Retrieval-based Bug
Localization
- arxiv url: http://arxiv.org/abs/2310.08083v1
- Date: Thu, 12 Oct 2023 07:14:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 03:01:57.744457
- Title: On Using GUI Interaction Data to Improve Text Retrieval-based Bug
Localization
- Title(参考訳): GUIインタラクションデータを用いたテキスト検索に基づくバグの局所化
- Authors: Junayed Mahmud, Nadeeshan De Silva, Safwat Ali Khan, Seyed Hooman
Mostafavi, SM Hasan Mansur, Oscar Chaparro, Andrian Marcus, and Kevin Moran
- Abstract要約: エンドユーザー向けアプリケーションでは、バグレポート内の情報とGUIの情報とを結びつけることにより、既存のバグローカライゼーション技術を改善することができるという仮説を考察する。
当社は,Androidアプリの完全ローカライズおよび再現可能な真のバグに関する現在の最大のデータセットを,対応するバグレポートとともに公開しています。
- 参考スコア(独自算出の注目度): 10.717184444794505
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One of the most important tasks related to managing bug reports is localizing
the fault so that a fix can be applied. As such, prior work has aimed to
automate this task of bug localization by formulating it as an information
retrieval problem, where potentially buggy files are retrieved and ranked
according to their textual similarity with a given bug report. However, there
is often a notable semantic gap between the information contained in bug
reports and identifiers or natural language contained within source code files.
For user-facing software, there is currently a key source of information that
could aid in bug localization, but has not been thoroughly investigated -
information from the GUI.
We investigate the hypothesis that, for end user-facing applications,
connecting information in a bug report with information from the GUI, and using
this to aid in retrieving potentially buggy files, can improve upon existing
techniques for bug localization. To examine this phenomenon, we conduct a
comprehensive empirical study that augments four baseline techniques for bug
localization with GUI interaction information from a reproduction scenario to
(i) filter out potentially irrelevant files, (ii) boost potentially relevant
files, and (iii) reformulate text-retrieval queries. To carry out our study, we
source the current largest dataset of fully-localized and reproducible real
bugs for Android apps, with corresponding bug reports, consisting of 80 bug
reports from 39 popular open-source apps. Our results illustrate that
augmenting traditional techniques with GUI information leads to a marked
increase in effectiveness across multiple metrics, including a relative
increase in Hits@10 of 13-18%. Additionally, through further analysis, we find
that our studied augmentations largely complement existing techniques.
- Abstract(参考訳): バグレポートの管理に関する最も重要なタスクの1つは、修正を適用できるように障害をローカライズすることである。
そこで,従来の作業では,このタスクを情報検索問題として定式化し,与えられたバグレポートとテキストの類似性に応じて,潜在的バグファイルの検索とランク付けを行うことで,このタスクを自動化することを目標にしている。
しかしながら、バグレポートに含まれる情報と、ソースコードファイルに含まれる識別子や自然言語の間には、しばしば顕著な意味的ギャップがある。
ユーザ向けソフトウェアには、現在、バグのローカライゼーションに役立つ重要な情報ソースがあるが、GUIから徹底的に調査されていない。
エンドユーザー向けアプリケーションでは、バグレポート内の情報とGUIの情報とを結びつけることにより、潜在的なバグファイルの検索を支援することによって、既存のバグローカライゼーション技術を改善することができるという仮説を考察する。
この現象を調べるために,本研究は,再現シナリオからguiインタラクション情報を含む4つのバグローカライズ手法を補完する総合的な実証実験を行った。
i) 潜在的に無関係なファイルをフィルタリングする。
(ii)潜在的関連ファイルの増加、及び
(iii)テキスト検索クエリを書き換える。
調査を実施するため、39の人気のあるオープンソースアプリから80のバグレポートを含む、Androidアプリの完全にローカライズされ再現可能な真のバグのデータセットを、現在最大規模で公開しています。
以上の結果から,GUI情報を用いた従来手法の強化は,Hits@10の13-18%の相対的な増加を含む,複数の指標において顕著な有効性向上につながることが示された。
さらに,さらなる分析により,本研究は既存の手法を補完するものであることがわかった。
関連論文リスト
- Multi-View Adaptive Contrastive Learning for Information Retrieval Based Fault Localization [5.1987901165589]
MACL-IRFL(Multi-View Adaptive Contrastive Learning for Information Retrieval Fault Localization)という新しい手法を提案する。
まず、レポート・コード・インタラクション・ビュー、レポート・レポートの類似性ビュー、コード・コードの共引用ビューを別々に生成し、グラフニューラルネットワークを用いて、埋め込みプロセスの3つのビューからバグレポートやソースコードファイルの情報を集約する。
コントラスト学習タスクの設計では,バグレポートの表現は,レポートレポートやレポートコードビューで共有される情報をエンコードし,ソースコードファイルの表現はコードコードとレポートコードビューで共有する。
論文 参考訳(メタデータ) (2024-09-19T07:20:10Z) - BLAZE: Cross-Language and Cross-Project Bug Localization via Dynamic Chunking and Hard Example Learning [1.9854146581797698]
BLAZEは動的チャンキングとハードサンプル学習を採用するアプローチである。
プロジェクト横断と言語横断のバグローカライゼーションを強化するために、難しいバグケースを使用してGPTベースのモデルを微調整する。
BLAZEは、トップ1の精度で120%、平均平均精度(MAP)で144%、平均相互ランク(MRR)で100%上昇する。
論文 参考訳(メタデータ) (2024-07-24T20:44:36Z) - Language Modeling with Editable External Knowledge [90.7714362827356]
本稿では,新たな文書取得時のモデル動作を改善するERASEを提案する。
ドキュメントを追加するたびに、知識ベースで他のエントリを段階的に削除または書き直します。
7-13%(Mixtral-8x7B)と6-10%(Llama-3-8B)の精度を向上する。
論文 参考訳(メタデータ) (2024-06-17T17:59:35Z) - Too Few Bug Reports? Exploring Data Augmentation for Improved
Changeset-based Bug Localization [7.884766610628946]
本稿では,バグレポートの異なる構成要素に作用する新しいデータ拡張演算子を提案する。
また、拡張バグレポートのコーパス作成を目的としたデータバランス戦略についても述べる。
論文 参考訳(メタデータ) (2023-05-25T19:06:01Z) - Enhancing Retrieval-Augmented Large Language Models with Iterative
Retrieval-Generation Synergy [164.83371924650294]
検索と生成を反復的に同期させるIter-RetGenと呼ばれる手法により,高い性能が得られることを示す。
モデル出力は、タスクを完了するために必要なものを示し、より関連する知識を取得するための情報的コンテキストを提供する。
Iter-RetGenプロセスは、すべての知識を全体として取得し、構造的な制約なしに生成時の柔軟性をほとんど保持します。
論文 参考訳(メタデータ) (2023-05-24T16:17:36Z) - Auto-labelling of Bug Report using Natural Language Processing [0.0]
ルールとクエリベースのソリューションは、明確なランキングのない、潜在的な類似バグレポートの長いリストを推奨します。
本論文では,NLP手法の組み合わせによる解を提案する。
カスタムデータトランスフォーマー、ディープニューラルネットワーク、および非汎用機械学習メソッドを使用して、既存の同一バグレポートを検索する。
論文 参考訳(メタデータ) (2022-12-13T02:32:42Z) - Using Developer Discussions to Guide Fixing Bugs in Software [51.00904399653609]
我々は,タスク実行前に利用可能であり,また自然発生しているバグレポートの議論を,開発者による追加情報の必要性を回避して利用することを提案する。
このような議論から派生したさまざまな自然言語コンテキストがバグ修正に役立ち、オラクルのバグ修正コミットに対応するコミットメッセージの使用よりもパフォーマンスの向上につながることを実証する。
論文 参考訳(メタデータ) (2022-11-11T16:37:33Z) - Automatic Classification of Bug Reports Based on Multiple Text
Information and Reports' Intention [37.67372105858311]
本稿では,バグレポートの自動分類手法を提案する。
イノベーションは、バグレポートを分類する際に、レポートのテキスト情報に加えて、レポートの意図も考慮することである。
提案手法は性能が向上し,F-Measureは87.3%から95.5%に向上した。
論文 参考訳(メタデータ) (2022-08-02T06:44:51Z) - BigIssue: A Realistic Bug Localization Benchmark [89.8240118116093]
BigIssueは、現実的なバグローカライゼーションのためのベンチマークである。
実際のJavaバグと合成Javaバグの多様性を備えた一般的なベンチマークを提供する。
われわれは,バグローカライゼーションの最先端技術として,APRの性能向上と,現代の開発サイクルへの適用性の向上を期待している。
論文 参考訳(メタデータ) (2022-07-21T20:17:53Z) - S3M: Siamese Stack (Trace) Similarity Measure [55.58269472099399]
本稿では、深層学習に基づくスタックトレースの類似性を計算する最初のアプローチであるS3Mを紹介します。
BiLSTMエンコーダと、類似性を計算するための完全接続型分類器をベースとしている。
私たちの実験は、オープンソースデータとプライベートなJetBrainsデータセットの両方において、最先端のアプローチの優位性を示しています。
論文 参考訳(メタデータ) (2021-03-18T21:10:41Z) - KILT: a Benchmark for Knowledge Intensive Language Tasks [102.33046195554886]
知識集約型言語タスク(KILT)のベンチマークを示す。
KILTのすべてのタスクはウィキペディアのスナップショットと同じだ。
共有密度ベクトル指数とSeq2seqモデルとの結合が強いベースラインであることが分かる。
論文 参考訳(メタデータ) (2020-09-04T15:32:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。