Fugu-MT 論文翻訳(概要): Can You Mimic Me? Exploring the Use of Android Record & Replay Tools in Debugging

論文の概要: Can You Mimic Me? Exploring the Use of Android Record & Replay Tools in Debugging

arxiv url: http://arxiv.org/abs/2504.20237v1
Date: Mon, 28 Apr 2025 20:15:59 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-02 19:15:54.661572
Title: Can You Mimic Me? Exploring the Use of Android Record & Replay Tools in Debugging
Title（参考訳）: Androidのレコード&再生ツールをデバッグに使おう
Authors: Zihe Song, S M Hasan Mansur, Ravishka Rathnasuriya, Yumna Fatima, Wei Yang, Kevin Moran, Wing Lam,
Abstract要約: 記録と再生(R&R)ツールは、UIアクションを記録してテストシナリオを実行し、バグを再生することによって、手動および自動UIテストを容易にする。我々は、R&Rツールを使用して、非クラッシング障害、バグのクラッシュ、機能ベースのユーザシナリオを記録し、再生する経験的な研究を行います。その結果、シナリオの17%、非クラッシュバグの38%、クラッシュするバグの44%が確実に記録され、再生できないことがわかった。
参考スコア（独自算出の注目度）: 13.79592937352459
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Android User Interface (UI) testing is a critical research area due to the ubiquity of apps and the challenges faced by developers. Record and replay (R&R) tools facilitate manual and automated UI testing by recording UI actions to execute test scenarios and replay bugs. These tools typically support (i) regression testing, (ii) non-crashing functional bug reproduction, and (iii) crashing bug reproduction. However, prior work only examines these tools in fragmented settings, lacking a comprehensive evaluation across common use cases. We address this gap by conducting an empirical study on using R&R tools to record and replay non-crashing failures, crashing bugs, and feature-based user scenarios, and explore combining R&R with automated input generation (AIG) tools to replay crashing bugs. Our study involves one industrial and three academic R&R tools, 34 scenarios from 17 apps, 90 non-crashing failures from 42 apps, and 31 crashing bugs from 17 apps. Results show that 17% of scenarios, 38% of non-crashing bugs, and 44% of crashing bugs cannot be reliably recorded and replayed, mainly due to action interval resolution, API incompatibility, and Android tooling limitations. Our findings highlight key future research directions to enhance the practical application of R&R tools.
Abstract（参考訳）: Android User Interface(UI)テストは、アプリの多様さと開発者が直面している課題のために重要な研究領域である。記録と再生(R&R)ツールは、UIアクションを記録してテストシナリオを実行し、バグを再生することによって、手動および自動UIテストを容易にする。これらのツールは一般的にサポートします (i)回帰テスト (二)非クラッシング機能バグ再生、及び (3)バグの再現をクラッシュさせる。しかしながら、以前の作業では、これらのツールを断片化された設定でのみ調べており、一般的なユースケース全体にわたって包括的な評価が欠如している。このギャップに対処するために、非クラッシング障害の記録と再生にR&Rツールを使うこと、バグのクラッシュ、機能ベースのユーザシナリオについて実証的研究を行い、クラッシュするバグを再生するためにR&Rツールと自動入力生成(AIG)ツールを組み合わせることを検討する。私たちの調査では、産業用と3つの学術的なR&Rツール、17のアプリから34のシナリオ、42のアプリから90の非クラッシュ障害、17のアプリから31のバグがクラッシュしました。その結果、シナリオの17%、非クラッシュバグの38%、クラッシュするバグの44%は、主にアクション間隔の解決、APIの不互換性、Androidツールの制限のために、確実に記録および再生できないことがわかった。本研究は,R&Rツールの実用化に向けた研究の方向性を明らかにするものである。

関連論文リスト

AssertFlip: Reproducing Bugs via Inversion of LLM-Generated Passing Tests [0.7564784873669823]
本稿では,大規模な言語モデル(LLM)を用いたバグ再現性テスト(BRT)の自動生成手法であるAssertFlipを紹介する。 AssertFlipはまず、バグ発生時のパステストを生成し、バグ発生時にそのテストがフェールする。以上の結果から,AssertFlipは,BRTのベンチマークであるSWT-Benchのリーダボードにおいて,すべての既知技術よりも優れていることがわかった。
論文参考訳（メタデータ） (2025-07-23T14:19:55Z)
Do AI models help produce verified bug fixes? [62.985237003585674]
大規模言語モデルは、ソフトウェアバグの修正に使用される。本稿では,プログラマが大規模言語モデルを用いて,自身のスキルを補完する方法について検討する。その結果は、プログラムバグに対する保証された修正を提供するAIとLLMの適切な役割への第一歩となる。
論文参考訳（メタデータ） (2025-07-21T17:30:16Z)
LazyReview A Dataset for Uncovering Lazy Thinking in NLP Peer Reviews [74.87393214734114]
この研究は、微粒な遅延思考カテゴリで注釈付けされたピアレビュー文のデータセットであるLazyReviewを紹介している。大規模言語モデル(LLM)は、ゼロショット設定でこれらのインスタンスを検出するのに苦労する。命令ベースのデータセットの微調整により、パフォーマンスが10～20ポイント向上する。
論文参考訳（メタデータ） (2025-04-15T10:07:33Z)
Understanding and Detecting Compatibility Issues in Android Auto Apps [0.5908471365011941]
我々は、Android Autoに関する147の報告を行い、その根本原因を特定した。 UIの不互換性,メディア再生エラーの24%,音声コマンド処理の失敗による約5%,などによって70%以上の問題が発生した。 Android Autoアプリの互換性問題を検出する静的解析フレームワークであるCarCompatを紹介する。
論文参考訳（メタデータ） (2025-03-06T01:37:02Z)
AutoRestTest: A Tool for Automated REST API Testing Using LLMs and MARL [46.65963514391019]
AutoRestTestは、Semantic Property Dependency Graph(SPDG)とMARL(Multi-Agent Reinforcement Learning)と大規模言語モデル(LLM)を統合して、効果的なREST APIテストを可能にする新しいツールである。
論文参考訳（メタデータ） (2025-01-15T05:54:33Z)
LlamaRestTest: Effective REST API Testing with Small Language Models [50.058600784556816]
LlamaRestTestは、2つのLLM(Large Language Models)を使って現実的なテストインプットを生成する新しいアプローチである。私たちは、GPTを使った仕様強化ツールであるRESTGPTなど、最先端のREST APIテストツールに対して、これを評価しています。私たちの研究は、REST APIテストにおいて、小さな言語モデルは、大きな言語モデルと同様に、あるいは、より良く機能することができることを示しています。
論文参考訳（メタデータ） (2025-01-15T05:51:20Z)
Seeing is Believing: Vision-driven Non-crash Functional Bug Detection for Mobile Apps [26.96558418166514]
本稿では,非クラッシュな機能的バグを検出するための,視覚駆動型多エージェント協調GUIテスト手法を提案する。 590の非クラッシュバグに対してTridentを評価し,12のベースラインと比較したところ,平均リコールと精度が14%-112%,108%-147%向上した。
論文参考訳（メタデータ） (2024-07-03T11:58:09Z)
Leveraging Stack Traces for Spectrum-based Fault Localization in the Absence of Failing Tests [44.13331329339185]
我々は,スタックトレースデータをテストカバレッジと統合し,障害局所化を強化する新しいアプローチであるSBESTを導入する。提案手法では,平均精度(MAP)が32.22%向上し,平均相互ランク(MRR)が17.43%向上した。
論文参考訳（メタデータ） (2024-05-01T15:15:52Z)
An Analysis of Bugs In Persistent Memory Application [0.0]
我々は,NVMレベルのハッシュPMアプリケーションをテストするために,オープンソースの自動バグ検出ツール(AGAMOTTO)を評価した。私たちの忠実な検証ツールは、PMDKライブラリで65の新しいNVMレベルのハッシュバグを発見しました。本稿では,PM-Aware 探索アルゴリズムを用いたディープQ学習探索アルゴリズムを提案する。
論文参考訳（メタデータ） (2023-07-19T23:12:01Z)
Prompting Is All You Need: Automated Android Bug Replay with Large Language Models [28.69675481931385]
本稿では,バグ報告から迅速なエンジニアリングを通じてバグを自動的に再現する,新しい軽量なアプローチであるAdbGPTを提案する。 AdbGPTは、LLMから人間の知識と論理的推論を引き出すために、少数ショットの学習と連鎖推論を活用する。この評価は,253.6秒で81.3%のバグレポートを再現するAdbGPTの有効性と有効性を示すものである。
論文参考訳（メタデータ） (2023-06-03T03:03:52Z)
Large Language Models are Few-shot Testers: Exploring LLM-based General Bug Reproduction [14.444294152595429]
問題によりオープンソースリポジトリに追加されたテストの数は、対応するプロジェクトテストスイートサイズの約28%であった。本稿では,Large Language Models (LLMs) を用いたLIBROを提案する。 LIBROの評価は、広く研究されているDefects4Jベンチマークにおいて、全ての研究ケースの33%で障害再現テストケースを生成することができることを示している。
論文参考訳（メタデータ） (2022-09-23T10:50:47Z)
BigIssue: A Realistic Bug Localization Benchmark [89.8240118116093]
BigIssueは、現実的なバグローカライゼーションのためのベンチマークである。実際のJavaバグと合成Javaバグの多様性を備えた一般的なベンチマークを提供する。われわれは,バグローカライゼーションの最先端技術として,APRの性能向上と,現代の開発サイクルへの適用性の向上を期待している。
論文参考訳（メタデータ） (2022-07-21T20:17:53Z)
SUPERNOVA: Automating Test Selection and Defect Prevention in AAA Video Games Using Risk Based Testing and Machine Learning [62.997667081978825]
従来の手法では、成長するソフトウェアシステムではスケールできないため、ビデオゲームのテストはますます難しいタスクになります。自動化ハブとして機能しながら,テスト選択と欠陥防止を行うシステム SUPERNOVA を提案する。この直接的な影響は、未公表のスポーツゲームタイトルの55%以上のテスト時間を減らすことが観察されている。
論文参考訳（メタデータ） (2022-03-10T00:47:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。