論文の概要: LadyBug: A GitHub Bot for UI-Enhanced Bug Localization in Mobile Apps
- arxiv url: http://arxiv.org/abs/2508.05085v1
- Date: Thu, 07 Aug 2025 07:09:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-08 18:59:39.737677
- Title: LadyBug: A GitHub Bot for UI-Enhanced Bug Localization in Mobile Apps
- Title(参考訳): LadyBug: モバイルアプリのUI強化バグローカライゼーションのためのGitHubボット
- Authors: Junayed Mahmud, James Chen, Terry Achille, Camilo Alvarez-Velez, Darren Dean Bansil, Patrick Ijieh, Samar Karanch, Nadeeshan De Silva, Oscar Chaparro, Andrian Marcus, Kevin Moran,
- Abstract要約: LadyBugは、Androidアプリのバグを自動的にローカライズするGitHubボットである。
AndroidアプリのGitHubリポジトリに接続し、対応するイシュートラッカにバグが報告された時にトリガーされる。
開発者はバグの再現トレースをデバイスに記録し、GitHubイシュートラッカ経由でLadyBugにアップロードすることができる。
- 参考スコア(独自算出の注目度): 8.063100944978608
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces LadyBug, a GitHub bot that automatically localizes bugs for Android apps by combining UI interaction information with text retrieval. LadyBug connects to an Android app's GitHub repository, and is triggered when a bug is reported in the corresponding issue tracker. Developers can then record a reproduction trace for the bug on a device or emulator and upload the trace to LadyBug via the GitHub issue tracker. This enables LadyBug to utilize both the text from the original bug description, and UI information from the reproduction trace to accurately retrieve a ranked list of files from the project that most likely contain the reported bug. We empirically evaluated LadyBug using an automated testing pipeline and benchmark called RedWing that contains 80 fully-localized and reproducible bug reports from 39 Android apps. Our results illustrate that LadyBug outperforms text-retrieval-based baselines and that the utilization of UI information leads to a substantial increase in localization accuracy. LadyBug is an open-source tool, available at https://github.com/LadyBugML/ladybug. A video showing the capabilities of Ladybug can be viewed here: https://youtu.be/hI3tzbRK0Cw
- Abstract(参考訳): 本稿では,UIインタラクション情報とテキスト検索を組み合わせることで,Androidアプリのバグを自動的にローカライズするGitHubボットであるLadyBugを紹介する。
LadyBugはAndroidアプリのGitHubリポジトリに接続し、対応するイシュートラッカにバグが報告された時にトリガーされる。
開発者はバグの再現トレースをデバイスやエミュレータに記録し、GitHubイシュートラッカ経由でLadyBugにアップロードすることができる。
これによって、LadyBugは、オリジナルのバグ記述からのテキストと、再生トレースからのUI情報の両方を使用して、報告されたバグを含む可能性が高いプロジェクトから、ランク付けされたファイルのリストを正確に取得することができる。
私たちは、39のAndroidアプリから80の完全ローカライズされた再現可能なバグレポートを含むRedWingという自動テストパイプラインとベンチマークを使用して、LadyBugを実証的に評価しました。
以上の結果から,LadyBugはテキスト検索ベースラインよりも優れており,UI情報の利用が局所化精度を大幅に向上させることが示された。
LadyBugはオープンソースのツールで、https://github.com/LadyBugML/ladybugで入手できる。
Ladybugの機能を示すビデオはこちらで見ることができる。
関連論文リスト
- VeriDebug: A Unified LLM for Verilog Debugging via Contrastive Embedding and Guided Correction [36.69082579950107]
コントラスト表現とガイド付き修正機能を統合するアプローチであるVeri Debugを提案する。
我々のモデルは、既存のオープンソースSOTA 11.3から大幅に改善されたバグ修正(Acc1)において64.7の精度を実現している。
この性能はオープンソースの代替品より優れているだけでなく、GPT-3.5-turbo (36.6)のような大型のクローズドソースモデルよりも優れている。
論文 参考訳(メタデータ) (2025-04-27T04:09:48Z) - Feedback-Driven Automated Whole Bug Report Reproduction for Android Apps [23.460238111094608]
ReBLは、Androidのバグレポートを再現するための、フィードバック駆動のアプローチである。
従来のステップバイステップのエンティティマッチングアプローチよりも柔軟でコンテキスト対応です。
非クラッシュな機能的なバグレポートを処理できる。
論文 参考訳(メタデータ) (2024-07-06T19:58:03Z) - Leveraging Stack Traces for Spectrum-based Fault Localization in the Absence of Failing Tests [44.13331329339185]
我々は,スタックトレースデータをテストカバレッジと統合し,障害局所化を強化する新しいアプローチであるSBESTを導入する。
提案手法では,平均精度(MAP)が32.22%向上し,平均相互ランク(MRR)が17.43%向上した。
論文 参考訳(メタデータ) (2024-05-01T15:15:52Z) - DebugBench: Evaluating Debugging Capability of Large Language Models [80.73121177868357]
DebugBench - LLM(Large Language Models)のベンチマーク。
C++、Java、Pythonの4つの主要なバグカテゴリと18のマイナータイプをカバーする。
ゼロショットシナリオで2つの商用および4つのオープンソースモデルを評価する。
論文 参考訳(メタデータ) (2024-01-09T15:46:38Z) - Can LLMs Demystify Bug Reports? [0.6650227510403052]
ChatGPTは報告されたバグの50%を解読し、再現することができた。
報告されたバグの半数に自動的に対処できることは、バグに対処するために機械学習を適用することで、バグを報告できるのは人力のみである、という有望な可能性を示している。
論文 参考訳(メタデータ) (2023-10-10T05:07:00Z) - Bugsplainer: Leveraging Code Structures to Explain Software Bugs with
Neural Machine Translation [4.519754139322585]
Bugsplainerは、バグ修正コミットの大規模なコーパスから学ぶことによって、ソフトウェアバグの自然言語説明を生成する。
Bugsplainerはバグを推論するためにコード構造を利用し、テキスト生成モデルの微調整バージョンであるCodeT5を採用している。
論文 参考訳(メタデータ) (2023-08-23T17:35:16Z) - Prompting Is All You Need: Automated Android Bug Replay with Large Language Models [28.69675481931385]
本稿では,バグ報告から迅速なエンジニアリングを通じてバグを自動的に再現する,新しい軽量なアプローチであるAdbGPTを提案する。
AdbGPTは、LLMから人間の知識と論理的推論を引き出すために、少数ショットの学習と連鎖推論を活用する。
この評価は,253.6秒で81.3%のバグレポートを再現するAdbGPTの有効性と有効性を示すものである。
論文 参考訳(メタデータ) (2023-06-03T03:03:52Z) - WELL: Applying Bug Detectors to Bug Localization via Weakly Supervised
Learning [37.09621161662761]
本稿では,バグローカライゼーションモデルをトレーニングするためのWEakly supervised bug LocaLization (WELL) 手法を提案する。
CodeBERTはバギーまたはノーのバイナリラベル付きデータに基づいて微調整されるため、WELLはバグのローカライゼーションを弱教師付きで解決することができる。
論文 参考訳(メタデータ) (2023-05-27T06:34:26Z) - torchgfn: A PyTorch GFlowNet library [56.071033896777784]
torchgfnはPyTorchライブラリで、このニーズに対処することを目指している。
環境のためのシンプルなAPIと、サンプルと損失のための有用な抽象化を提供する。
論文 参考訳(メタデータ) (2023-05-24T00:20:59Z) - Teaching Large Language Models to Self-Debug [62.424077000154945]
大規模言語モデル(LLM)は、コード生成において素晴らしいパフォーマンスを達成した。
本稿では,大規模言語モデルで予測プログラムを数発のデモでデバッグする自己デバッグを提案する。
論文 参考訳(メタデータ) (2023-04-11T10:43:43Z) - App Review Driven Collaborative Bug Finding [5.024930832959602]
我々は、同じカテゴリーのモバイルアプリが、進化過程における同様のバグによって影響を受ける可能性があるという仮説に基づいて構築する。
ある履歴アプリの体験を移して、新しいアプリのバグを素早く見つけることができる。
我々は、BugRMSysアプローチを設計し、同じカテゴリのアプリの履歴バグレポートとターゲットアプリのユーザアプリレビューをマッチングすることで、ターゲットアプリのバグレポートを推奨する。
論文 参考訳(メタデータ) (2023-01-07T09:38:06Z) - Explaining Software Bugs Leveraging Code Structures in Neural Machine Translation [4.519754139322584]
Bugsplainerは、バグ修正コミットの大規模なコーパスから学ぶことによって、ソフトウェアバグの自然言語説明を生成する。
3つのパフォーマンス指標を用いて評価したところ、BugsplainerはGoogleの標準に従って理解しやすく良い説明を生成できることがわかった。
また、Bugsplainerによる説明がベースラインよりも正確で、より正確で、より有用であることが判明した、20人の参加者を対象にした開発者スタディも実施しました。
論文 参考訳(メタデータ) (2022-12-08T22:19:45Z) - Using Developer Discussions to Guide Fixing Bugs in Software [51.00904399653609]
我々は,タスク実行前に利用可能であり,また自然発生しているバグレポートの議論を,開発者による追加情報の必要性を回避して利用することを提案する。
このような議論から派生したさまざまな自然言語コンテキストがバグ修正に役立ち、オラクルのバグ修正コミットに対応するコミットメッセージの使用よりもパフォーマンスの向上につながることを実証する。
論文 参考訳(メタデータ) (2022-11-11T16:37:33Z) - BigIssue: A Realistic Bug Localization Benchmark [89.8240118116093]
BigIssueは、現実的なバグローカライゼーションのためのベンチマークである。
実際のJavaバグと合成Javaバグの多様性を備えた一般的なベンチマークを提供する。
われわれは,バグローカライゼーションの最先端技術として,APRの性能向上と,現代の開発サイクルへの適用性の向上を期待している。
論文 参考訳(メタデータ) (2022-07-21T20:17:53Z) - S3M: Siamese Stack (Trace) Similarity Measure [55.58269472099399]
本稿では、深層学習に基づくスタックトレースの類似性を計算する最初のアプローチであるS3Mを紹介します。
BiLSTMエンコーダと、類似性を計算するための完全接続型分類器をベースとしている。
私たちの実験は、オープンソースデータとプライベートなJetBrainsデータセットの両方において、最先端のアプローチの優位性を示しています。
論文 参考訳(メタデータ) (2021-03-18T21:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。