論文の概要: Combining Language and App UI Analysis for the Automated Assessment of Bug Reproduction Steps
- arxiv url: http://arxiv.org/abs/2502.04251v1
- Date: Thu, 06 Feb 2025 17:40:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-07 14:34:22.389662
- Title: Combining Language and App UI Analysis for the Automated Assessment of Bug Reproduction Steps
- Title(参考訳): バグ再現ステップの自動評価のための言語とアプリのUI分析
- Authors: Junayed Mahmud, Antu Saha, Oscar Chaparro, Kevin Moran, Andrian Marcus,
- Abstract要約: バグレポートは重要な情報を見逃したり、不明瞭に書かれたりすることが多い。
問題となるレポートの最も一般的なコンポーネントの1つは、バグを再現するステップである(S2R)。
- 参考スコア(独自算出の注目度): 10.026503132278634
- License:
- Abstract: Bug reports are essential for developers to confirm software problems, investigate their causes, and validate fixes. Unfortunately, reports often miss important information or are written unclearly, which can cause delays, increased issue resolution effort, or even the inability to solve issues. One of the most common components of reports that are problematic is the steps to reproduce the bug(s) (S2Rs), which are essential to replicate the described program failures and reason about fixes. Given the proclivity for deficiencies in reported S2Rs, prior work has proposed techniques that assist reporters in writing or assessing the quality of S2Rs. However, automated understanding of S2Rs is challenging, and requires linking nuanced natural language phrases with specific, semantically related program information. Prior techniques often struggle to form such language to program connections - due to issues in language variability and limitations of information gleaned from program analyses. To more effectively tackle the problem of S2R quality annotation, we propose a new technique called AstroBR, which leverages the language understanding capabilities of LLMs to identify and extract the S2Rs from bug reports and map them to GUI interactions in a program state model derived via dynamic analysis. We compared AstroBR to a related state-of-the-art approach and we found that AstroBR annotates S2Rs 25.2% better (in terms of F1 score) than the baseline. Additionally, AstroBR suggests more accurate missing S2Rs than the baseline (by 71.4% in terms of F1 score).
- Abstract(参考訳): バグレポートは、開発者がソフトウェア問題を確認し、原因を調査し、修正を検証するために不可欠である。
残念なことに、レポートは重要な情報を見逃したり、不明瞭に書かれることが多いため、遅延や問題解決の努力の増加、さらには問題解決のできないことさえも生じます。
問題となるレポートの最も一般的なコンポーネントの1つはバグ(s)を再現するステップである(S2R)。
報告されたS2Rの欠陥の確率を考えると、以前の研究では、記者がS2Rの質を書けるか評価するのを助ける技術が提案されている。
しかし、S2Rの自動理解は困難であり、ニュアンス付き自然言語句を特定の意味的に関連付けられたプログラム情報とリンクする必要がある。
以前のテクニックは、しばしば、プログラム接続のためのそのような言語を形成するのに苦労する - 言語変数の問題と、プログラム分析から得られる情報の制限のため。
本稿では,S2Rの品質アノテーションの問題をより効果的に解決するために,LSMの言語理解機能を活用してバグレポートからS2Rを識別・抽出し,動的解析によって導出されたプログラム状態モデルにおけるGUIインタラクションにマッピングするAstroBRという手法を提案する。
我々はAstroBRを最先端のアプローチと比較し、AstroBRがベースラインよりも25.2%良い(F1スコア)ことを見出した。
さらに、AstroBRはベースラインよりも正確なS2Rの欠落を示唆している(F1スコアの71.4%)。
関連論文リスト
- Harnessing Large Language Models for Knowledge Graph Question Answering via Adaptive Multi-Aspect Retrieval-Augmentation [81.18701211912779]
本稿では,KG(Amar)フレームワーク上での適応型マルチアスペクト検索手法を提案する。
この方法は、エンティティ、リレーション、サブグラフを含む知識を検索し、検索した各テキストを即時埋め込みに変換する。
提案手法は2つの共通データセットに対して最先端の性能を達成した。
論文 参考訳(メタデータ) (2024-12-24T16:38:04Z) - Enhancing AAC Software for Dysarthric Speakers in e-Health Settings: An Evaluation Using TORGO [0.13108652488669734]
脳性麻痺 (CP) と筋萎縮性側索硬化症 (ALS) の患者は, 関節症に悩まされ, 変形性関節症, 非典型的発声パターンを呈する。
我々は、Whisper や Wav2vec2.0 のような最先端の音声認識(SOTA)技術が、訓練データがないために非定型話者を疎外することがわかった。
我々の研究は、SOTA ASRとドメイン固有のエラー訂正を活用することを目指している。
論文 参考訳(メタデータ) (2024-11-01T19:11:54Z) - SEDAC: A CVAE-Based Data Augmentation Method for Security Bug Report
Identification [0.0]
現実の世界では、セキュリティバグ報告の割合は極めて低い。
SEDACは、同様のバグレポートベクターを生成する新しいSBR識別方法である。
g測定の基準線は14.24%から50.10%の改善で上回っている。
論文 参考訳(メタデータ) (2024-01-22T15:53:52Z) - ML-LMCL: Mutual Learning and Large-Margin Contrastive Learning for
Improving ASR Robustness in Spoken Language Understanding [55.39105863825107]
本稿では,ML-LMCL(Multual Learning and Large-Margin Contrastive Learning)を提案する。
微調整では、相互学習を適用し、手書き文字とASR文字の2つのSLUモデルを訓練する。
3つのデータセットの実験では、ML-LMCLは既存のモデルより優れ、新しい最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-19T16:53:35Z) - Generative error correction for code-switching speech recognition using
large language models [49.06203730433107]
コードスイッチング(英: Code-switching, CS)とは、2つ以上の言語が同じ文内に混在する現象である。
本稿では,大規模言語モデル (LLM) と ASR が生成する仮説のリストを利用して,CS 問題に対処することを提案する。
論文 参考訳(メタデータ) (2023-10-17T14:49:48Z) - Employing Deep Learning and Structured Information Retrieval to Answer
Clarification Questions on Bug Reports [3.462843004438096]
本稿では,CodeT5 と Lucene を併用して質問に対する回答を推薦する手法を提案する。
我々は,正規化Smooth BLEUスコア, METEOR, Word Mover's Distance, Semantic similarity などの類似度指標を用いて,手動で注釈付き回答を評価した。
論文 参考訳(メタデータ) (2023-04-24T23:29:14Z) - BigIssue: A Realistic Bug Localization Benchmark [89.8240118116093]
BigIssueは、現実的なバグローカライゼーションのためのベンチマークである。
実際のJavaバグと合成Javaバグの多様性を備えた一般的なベンチマークを提供する。
われわれは,バグローカライゼーションの最先端技術として,APRの性能向上と,現代の開発サイクルへの適用性の向上を期待している。
論文 参考訳(メタデータ) (2022-07-21T20:17:53Z) - Building an ASR Error Robust Spoken Virtual Patient System in a Highly
Class-Imbalanced Scenario Without Speech Data [20.357369521268417]
仮想患者(VP)は、医学生に患者の歴史を学ばせるための強力なツールである。
提案手法は, 単語誤り率設定におけるVP意図分類タスクに対して, 強いベースラインよりも大幅に改善されたことを示す。
論文 参考訳(メタデータ) (2022-04-11T15:13:33Z) - D2A: A Dataset Built for AI-Based Vulnerability Detection Methods Using
Differential Analysis [55.15995704119158]
静的解析ツールによって報告されたラベル問題に対する差分解析に基づくアプローチであるD2Aを提案する。
D2Aを使用して大きなラベル付きデータセットを生成し、脆弱性識別のためのモデルをトレーニングします。
論文 参考訳(メタデータ) (2021-02-16T07:46:53Z) - Joint Contextual Modeling for ASR Correction and Language Understanding [60.230013453699975]
言語理解(LU)と協調してASR出力の文脈的言語補正を行うマルチタスクニューラルアプローチを提案する。
そこで本研究では,市販のASRおよびLUシステムの誤差率を,少量のドメイン内データを用いてトレーニングしたジョイントモデルと比較して14%削減できることを示した。
論文 参考訳(メタデータ) (2020-01-28T22:09:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。