論文の概要: Automated Generation of High-Quality Bug Reports for Android Applications
- arxiv url: http://arxiv.org/abs/2604.01148v1
- Date: Wed, 01 Apr 2026 17:05:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:32.107193
- Title: Automated Generation of High-Quality Bug Reports for Android Applications
- Title(参考訳): Androidアプリケーション向け高品質バグレポートの自動生成
- Authors: Antu Saha, Atish Kumar Dipongkor, Sam Bennett, Kevin Moran, Andrian Marcus, Oscar Chaparro,
- Abstract要約: 低品質のレポートは、開発者が欠陥を理解して再現する能力を妨げます。
この方法でバグレポートを生成する新しいアプローチであるBugScribeを構築し評価する。
我々は、BugScribeがオリジナルのレポートよりも高品質で精度の高いコンポーネントを生産していることを示す。
- 参考スコア(独自算出の注目度): 15.222247601251015
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Most defects in mobile applications are visually observable on the device screen. To track these defects, users, testers, and developers must manually submit bug reports, especially in the absence of crashes. However, these reports are frequently ambiguous or inaccurate, often omitting essential components such as the Observed Behavior (OB), Expected Behavior (EB), or Steps to Reproduce (S2Rs). Low-quality reports hinder developers' ability to understand and reproduce defects, delaying resolution and leading to incorrect or unresolvable fixes. In this paper, we posit that providing specific app-related information (e.g., GUI interactions or specific screens where bugs appear) to LLMs as key points of context can assist in automatically generating clear, detailed, and accurate OB, EB, and S2Rs. We built and evaluated a novel approach, BugScribe, that generates bug reports in this way. To support the evaluation, we introduce a unified quality framework that defines correctness and completeness dimensions for OB, EB, and S2Rs. Using 48 bug reports from 26 Android apps, we show that BugScribe produces higher-quality and more accurate components than the original reports and outperforms recent LLM-based baselines. We envision that BugScribe can serve as a practical assistant for testers and developers by enhancing incomplete bug reports with reliable and accurate OB, EB, and S2Rs, thereby streamlining bug resolution and improving mobile app quality.
- Abstract(参考訳): モバイルアプリケーションのほとんどの欠陥は、デバイス画面上で視覚的に観察可能である。
これらの欠陥を追跡するには、特にクラッシュがない場合には、ユーザ、テスタ、開発者が手動でバグレポートを提出する必要がある。
しかしながら、これらの報告はしばしば曖昧で不正確であり、観察行動(OB)、期待行動(EB)、再現のためのステップ(S2R)といった重要なコンポーネントを省略することが多い。
低品質のレポートは、欠陥を理解して再現する能力を妨げ、解決を遅らせ、誤った修正や解決不可能な修正につながる。
本稿では,特定のアプリケーション関連情報(GUIインタラクションやバグが現れる特定のスクリーンなど)をLLMにコンテキストのキーポイントとして提供することで,明確で詳細かつ正確なOB,EB,S2Rの自動生成を支援することを提案する。
私たちは、この方法でバグレポートを生成する新しいアプローチ、BugScribeを構築し、評価しました。
評価を支援するために,OB,EB,S2Rの正確性と完全性ディメンションを定義する統一品質フレームワークを導入する。
26のAndroidアプリから48のバグレポートを使用して、BugScribeが元のレポートよりも高品質で正確なコンポーネントを生成し、最近のLCMベースのベースラインを上回っていることを示す。
我々は,BugScribeが信頼性の高いOB,EB,およびS2Rで不完全なバグレポートを強化し,バグ解決の合理化とモバイルアプリの品質向上により,テスタや開発者の実用的なアシスタントとして機能することを期待している。
関連論文リスト
- Outrunning LLM Cutoffs: A Live Kernel Crash Resolution Benchmark for All [57.23434868678603]
Live-kBenchは、新たに発見されたカーネルバグのエージェントをスクラップし、評価するセルフ進化ベンチマークの評価フレームワークである。
kEnvは、カーネルのコンパイル、実行、フィードバックのためのエージェントに依存しないクラッシュ解決環境である。
kEnvを用いて3つの最先端エージェントをベンチマークし、最初の試行で74%のクラッシュを解決したことを示す。
論文 参考訳(メタデータ) (2026-02-02T19:06:15Z) - BugPilot: Complex Bug Generation for Efficient Learning of SWE Skills [59.003563837981886]
高品質なバグは、次世代の言語モデルベースソフトウェアエンジニアリング(SWE)エージェントをトレーニングする鍵となる。
難易度および多種多様なバグを合成する新しい方法を提案する。
論文 参考訳(メタデータ) (2025-10-22T17:58:56Z) - BugRepro: Enhancing Android Bug Reproduction with Domain-Specific Knowledge Integration [4.833035081314386]
BugReproは、バグ再現の正確性と効率を高めるために、ドメイン固有の知識を統合する新しいテクニックである。
BugReproは2つの最先端メソッドを著しく上回っている。
論文 参考訳(メタデータ) (2025-05-20T15:48:34Z) - DebugBench: Evaluating Debugging Capability of Large Language Models [80.73121177868357]
DebugBench - LLM(Large Language Models)のベンチマーク。
C++、Java、Pythonの4つの主要なバグカテゴリと18のマイナータイプをカバーする。
ゼロショットシナリオで2つの商用および4つのオープンソースモデルを評価する。
論文 参考訳(メタデータ) (2024-01-09T15:46:38Z) - Toward Rapid Bug Resolution for Android Apps [0.4759142872591625]
本稿では,既存のバグレポートの限界について述べるとともに,それに対応するための潜在的戦略を明らかにする。
私たちのビジョンは、これらの制限の緩和と、提案された新しい研究の方向性の実行が、レポーターと開発者の両方に利益をもたらす、未来を包含しています。
論文 参考訳(メタデータ) (2023-12-23T18:29:06Z) - Prompting Is All You Need: Automated Android Bug Replay with Large Language Models [28.69675481931385]
本稿では,バグ報告から迅速なエンジニアリングを通じてバグを自動的に再現する,新しい軽量なアプローチであるAdbGPTを提案する。
AdbGPTは、LLMから人間の知識と論理的推論を引き出すために、少数ショットの学習と連鎖推論を活用する。
この評価は,253.6秒で81.3%のバグレポートを再現するAdbGPTの有効性と有効性を示すものである。
論文 参考訳(メタデータ) (2023-06-03T03:03:52Z) - Auto-labelling of Bug Report using Natural Language Processing [0.0]
ルールとクエリベースのソリューションは、明確なランキングのない、潜在的な類似バグレポートの長いリストを推奨します。
本論文では,NLP手法の組み合わせによる解を提案する。
カスタムデータトランスフォーマー、ディープニューラルネットワーク、および非汎用機械学習メソッドを使用して、既存の同一バグレポートを検索する。
論文 参考訳(メタデータ) (2022-12-13T02:32:42Z) - Using Developer Discussions to Guide Fixing Bugs in Software [51.00904399653609]
我々は,タスク実行前に利用可能であり,また自然発生しているバグレポートの議論を,開発者による追加情報の必要性を回避して利用することを提案する。
このような議論から派生したさまざまな自然言語コンテキストがバグ修正に役立ち、オラクルのバグ修正コミットに対応するコミットメッセージの使用よりもパフォーマンスの向上につながることを実証する。
論文 参考訳(メタデータ) (2022-11-11T16:37:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。