論文の概要: PopSweeper: Automatically Detecting and Resolving App-Blocking Pop-Ups to Assist Automated Mobile GUI Testing
- arxiv url: http://arxiv.org/abs/2412.02933v1
- Date: Wed, 04 Dec 2024 01:05:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-05 15:09:26.999419
- Title: PopSweeper: Automatically Detecting and Resolving App-Blocking Pop-Ups to Assist Automated Mobile GUI Testing
- Title(参考訳): PopSweeper: 自動モバイルGUIテストを支援するために,App-Blocking Pop-Upの自動検出と解決
- Authors: Linqiang Guo, Wei Liu, Yi Wen Heng, Tse-Hsun, Chen, Yang Wang,
- Abstract要約: PopSweeperは、GUIの自動テスト中にリアルタイムでアプリブロックのポップアップを検出し、解決するように設計されたツールである。
それは、ポップアップ検出とクローズボタンのローカライゼーションのためのディープラーニングベースのコンピュータビジョン技術を組み合わせている。
我々はPopSweeperを、アプリストアから収集された72K以上のアプリスクリーンショットと87の上位モバイルアプリで評価した。
- 参考スコア(独自算出の注目度): 46.18718721121415
- License:
- Abstract: Graphical User Interfaces (GUIs) are the primary means by which users interact with mobile applications, making them crucial to both app functionality and user experience. However, a major challenge in automated testing is the frequent appearance of app-blocking pop-ups, such as ads or system alerts, which obscure critical UI elements and disrupt test execution, often requiring manual intervention. These interruptions lead to inaccurate test results, increased testing time, and reduced reliability, particularly for stakeholders conducting large-scale app testing. To address this issue, we introduce PopSweeper, a novel tool designed to detect and resolve app-blocking pop-ups in real-time during automated GUI testing. PopSweeper combines deep learning-based computer vision techniques for pop-up detection and close button localization, allowing it to autonomously identify pop-ups and ensure uninterrupted testing. We evaluated PopSweeper on over 72K app screenshots from the RICO dataset and 87 top-ranked mobile apps collected from app stores, manually identifying 832 app-blocking pop-ups. PopSweeper achieved 91.7% precision and 93.5% recall in pop-up classification and 93.9% BoxAP with 89.2% recall in close button detection. Furthermore, end-to-end evaluations demonstrated that PopSweeper successfully resolved blockages in 87.1% of apps with minimal overhead, achieving classification and close button detection within 60 milliseconds per frame. These results highlight PopSweeper's capability to enhance the accuracy and efficiency of automated GUI testing by mitigating pop-up interruptions.
- Abstract(参考訳): グラフィカルユーザインタフェース(GUI)は、ユーザがモバイルアプリケーションと対話する主要な手段であり、アプリ機能とユーザエクスペリエンスの両方において重要である。
しかし、自動テストの大きな課題は、広告やシステムアラートのような、アプリのブロックするポップアップが頻繁に現れることだ。
これらの中断は不正確なテスト結果、テスト時間の増加、信頼性の低下につながります。
この問題を解決するためにPopSweeperを紹介した。PopSweeperは、GUIの自動テスト中にリアルタイムでアプリブロックのポップアップを検出し、解決する新しいツールである。
PopSweeperは、ポップアップ検出とクローズボタンのローカライゼーションのためのディープラーニングベースのコンピュータビジョン技術を組み合わせて、ポップアップを自律的に識別し、中断しないテストを保証する。
我々は、RICOデータセットから72K以上のアプリスクリーンショットと、アプリストアから収集された87の上位モバイルアプリでPopSweeperを評価し、832のアプリブロックポップアップを手動で識別した。
PopSweeperは91.7%の精度、93.5%のリコール、93.9%のBoxAP、89.2%のリコールを達成した。
さらに、エンド・ツー・エンドの評価では、PopSweeperは最小のオーバーヘッドで87.1%のアプリでブロックを解決し、1フレームあたり60ミリ秒以内の分類とクローズボタン検出を実現した。
これらの結果は、ポップアップ割り込みを軽減し、自動GUIテストの精度と効率を高めるPopSweeperの機能を強調している。
関連論文リスト
- Attacking Vision-Language Computer Agents via Pop-ups [61.744008541021124]
VLMエージェントは、慎重に設計された対向的なポップアップによって容易に攻撃できることを示す。
この混乱は、エージェントが通常のタスクを実行する代わりにポップアップをクリックさせる。
論文 参考訳(メタデータ) (2024-11-04T18:56:42Z) - Autonomous Large Language Model Agents Enabling Intent-Driven Mobile GUI
Testing [17.24045904273874]
そこで我々は,Android用の自動GUIテストエージェントであるDroidAgentを提案する。
これはLarge Language Modelと、長期記憶や短期記憶などのサポートメカニズムに基づいている。
DroidAgentは61%のアクティビティカバレッジを達成したが、現在の最先端のGUIテスト技術では51%だった。
論文 参考訳(メタデータ) (2023-11-15T01:59:40Z) - Make LLM a Testing Expert: Bringing Human-like Interaction to Mobile GUI
Testing via Functionality-aware Decisions [23.460051600514806]
GPTDroidは、モバイルアプリ向けのQ&AベースのGUIテスティングフレームワークである。
機能認識型メモリプロンプト機構を導入する。
アクティビティのカバレッジが32%向上し、より高速な速度で31%のバグを検出する。
論文 参考訳(メタデータ) (2023-10-24T12:30:26Z) - Testing Updated Apps by Adapting Learned Models [2.362412515574206]
学習したモデルの継続的適応(CALM)は、アプリの更新を効率的にテストする自動テストアプローチである。
機能的正確性は、主にAppスクリーンの視覚的検査によって検証できるため、CALMは、ソフトウェアテスタによって視覚化されるAppスクリーンの数を最小化する。
実験により,CALMは6つの最先端手法よりも,更新手法と命令の比率が有意に高いことが示された。
論文 参考訳(メタデータ) (2023-08-10T12:59:24Z) - Neural Embeddings for Web Testing [49.66745368789056]
既存のクローラは、状態等価性を評価するために、アプリ固有のしきい値ベースのアルゴリズムに依存している。
ニューラルネットワークの埋め込みとしきい値のない分類器に基づく新しい抽象関数WEBEMBEDを提案する。
WEBEMBEDは,9つのWebアプリケーションに対する評価の結果,近距離検出により最先端技術よりも精度が高いことがわかった。
論文 参考訳(メタデータ) (2023-06-12T19:59:36Z) - Chatting with GPT-3 for Zero-Shot Human-Like Mobile Automated GUI
Testing [23.460051600514806]
GPTDroid を提案し,GUI ページ情報を LLM に渡してテストスクリプトを抽出することにより,大規模言語モデルにモバイルアプリとのチャットを依頼する。
そこで我々はGUIページの静的コンテキストと反復テストプロセスの動的コンテキストを抽出する。
Google Playの86のアプリ上でGPTDroidを評価し、そのアクティビティカバレッジは71%で、最高のベースラインよりも32%高く、最高のベースラインよりも高速で36%多くのバグを検出することができます。
論文 参考訳(メタデータ) (2023-05-16T13:46:52Z) - Emerging App Issue Identification via Online Joint Sentiment-Topic
Tracing [66.57888248681303]
本稿では,MERITという新しい問題検出手法を提案する。
AOBSTモデルに基づいて、1つのアプリバージョンに対するユーザレビューに否定的に反映されたトピックを推測する。
Google PlayやAppleのApp Storeで人気のアプリに対する実験は、MERITの有効性を実証している。
論文 参考訳(メタデータ) (2020-08-23T06:34:05Z) - An Empirical Study of In-App Advertising Issues Based on Large Scale App
Review Analysis [67.58267006314415]
われわれは,App StoreとGoogle Playの広告関連ユーザフィードバックに関する大規模分析を行った。
広告関連レビュー36,309件の統計分析から,利用者は使用中のユニーク広告数や広告表示頻度を最も気にしていることがわかった。
いくつかの広告イシュータイプは、他の広告イシューよりも開発者によって迅速に対処される。
論文 参考訳(メタデータ) (2020-08-22T05:38:24Z) - Maat: Automatically Analyzing VirusTotal for Accurate Labeling and
Effective Malware Detection [71.84087757644708]
マルウェア分析と検出の研究コミュニティは、約60台のスキャナーのスキャン結果に基づいてAndroidアプリをラベル付けするために、オンラインプラットフォームVirusTotalに依存している。
VirusTotalから取得したスキャン結果を最もよく解釈する方法の基準はありません。
機械学習(ML)ベースのラベリングスキームを自動生成することで,標準化と持続可能性というこれらの問題に対処する手法であるMaatを実装した。
論文 参考訳(メタデータ) (2020-07-01T14:15:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。