Fugu-MT 論文翻訳(概要): TaskAudit: Detecting Functiona11ity Errors in Mobile Apps via Agentic Task Execution

論文の概要: TaskAudit: Detecting Functiona11ity Errors in Mobile Apps via Agentic Task Execution

arxiv url: http://arxiv.org/abs/2510.12972v1
Date: Tue, 14 Oct 2025 20:28:49 GMT
ステータス: 翻訳完了
システム内更新日: 2025-10-16 20:13:28.411162
Title: TaskAudit: Detecting Functiona11ity Errors in Mobile Apps via Agentic Task Execution
Title（参考訳）: TaskAudit: エージェントタスク実行によるモバイルアプリの関数a11ityエラーの検出
Authors: Mingyuan Zhong, Xia Chen, Davin Win Kyi, Chen Li, James Fogarty, Jacob O. Wobbrock,
Abstract要約: TaskAuditは、シミュレーションインタラクションによる関数a11ityエラーの検出に焦点を当てたアクセシビリティ評価システムである。実世界のアプリ評価では,54のアプリ画面から48のファンクタ11ityエラーを検出する方法が,既存のチェッカーでは4～20であるのに対し,我々の戦略は48のファンクタ11ityエラーを検出する。
参考スコア（独自算出の注目度）: 17.208420259998178
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Accessibility checkers are tools in support of accessible app development and their use is encouraged by accessibility best practices. However, most current checkers evaluate static or mechanically-generated contexts, failing to capture common accessibility errors impacting mobile app functionality. We present TaskAudit, an accessibility evaluation system that focuses on detecting functiona11ity errors through simulated interactions. TaskAudit comprises three components: a Task Generator that constructs interactive tasks from app screens, a Task Executor that uses agents with a screen reader proxy to perform these tasks, and an Accessibility Analyzer that detects and reports accessibility errors by examining interaction traces. Evaluation on real-world apps shows that our strategy detects 48 functiona11ity errors from 54 app screens, compared to between 4 and 20 with existing checkers. Our analysis demonstrates common error patterns that TaskAudit can detect in addition to prior work, including label-functionality mismatch, cluttered navigation, and inappropriate feedback.
Abstract（参考訳）: アクセシビリティチェッカーは、アクセス可能なアプリ開発をサポートするツールであり、アクセシビリティのベストプラクティスによってその使用が奨励されている。しかしながら、現在のチェッカーのほとんどは、静的または機械的に生成されたコンテキストを評価し、モバイルアプリ機能に影響を与える一般的なアクセシビリティエラーをキャプチャすることができない。本稿では、シミュレーションによる関数a11ityエラーの検出に焦点を当てたアクセシビリティ評価システムTaskAuditを提案する。 TaskAuditは、アプリ画面からインタラクティブなタスクを構築するタスクジェネレータ、スクリーンリーダープロキシとエージェントを使用してこれらのタスクを実行するタスクエグゼクタ、インタラクショントレースを調べてアクセシビリティエラーを検出して報告するアクセシビリティアナライザの3つのコンポーネントで構成される。実世界のアプリ評価では,54のアプリ画面から48のファンクタ11ityエラーを検出する方法が,既存のチェッカーでは4～20であるのに対し,我々の戦略は48のファンクタ11ityエラーを検出する。我々の分析は、ラベル機能ミスマッチ、散在したナビゲーション、不適切なフィードバックなど、TaskAuditが事前の作業に加えて検出できる一般的なエラーパターンを示している。

関連論文リスト

Breaking Single-Tester Limits: Multi-Agent LLMs for Multi-User Feature Testing [15.383375235673954]
アプリケーション機能テストのためのマルチユーザ対話タスクを自動化するために,LLM(Large Language Models)を利用した新しいマルチエージェントアプローチであるMAdroidを提案する。具体的には、MAdroidは、ユーザエージェント(オペレータ)とスーパーバイザーエージェント(コーディネータとオブザーバ)の2つの機能タイプを採用している。マルチユーザ対話型タスク41件を含む評価は,96.8%の動作類似性を有するタスクの82.9%を達成し,提案手法の有効性を示した。
論文参考訳（メタデータ） (2025-06-21T01:38:53Z)
Advancing Mobile UI Testing by Learning Screen Usage Semantics [0.42303492200814446]
本研究は,モバイルアプリの画面利用セマンティクスを学習することで,自動UIテスト技術の向上を目指す。また、UI設計の問題を特定し緩和することで、モバイルアプリのインターフェイスのユーザビリティも向上する。
論文参考訳（メタデータ） (2025-05-15T01:40:43Z)
Mobile-Agent-E: Self-Evolving Mobile Assistant for Complex Tasks [85.48034185086169]
Mobile-Agent-Eは、過去の経験を通じて自己進化できる階層的なマルチエージェントフレームワークである。 Mobile-Agent-Eは従来の最先端アプローチよりも22%の絶対的な改善を実現している。
論文参考訳（メタデータ） (2025-01-20T20:35:46Z)
Seeing is Believing: Vision-driven Non-crash Functional Bug Detection for Mobile Apps [26.96558418166514]
本稿では,非クラッシュな機能的バグを検出するための,視覚駆動型多エージェント協調GUIテスト手法を提案する。 590の非クラッシュバグに対してTridentを評価し,12のベースラインと比較したところ,平均リコールと精度が14%-112%,108%-147%向上した。
論文参考訳（メタデータ） (2024-07-03T11:58:09Z)
I2EDL: Interactive Instruction Error Detection and Localization [65.25839671641218]
連続環境(IVLN-CE)における対話型VLNの新たな課題を提案する。これにより、VLN-CEナビゲーション中にエージェントがユーザと対話し、命令エラーに関する疑念を検証できる。我々は、事前学習したモジュールを利用して命令エラーを検出し、テキスト入力と過去の観察を相互参照することで、命令中のそれらをピンポイントする。
論文参考訳（メタデータ） (2024-06-07T16:52:57Z)
Task-Agnostic Detector for Insertion-Based Backdoor Attacks [53.77294614671166]
本稿では,バックドア検出の先駆的手法であるTABDet(Task-Agnostic Backdoor Detector)を紹介する。 TABDetは、最終層ロジットと効率的なプーリング技術を組み合わせて、3つの著名なNLPタスクをまたいだ統一ロジット表現を可能にする。 TABDetは多様なタスク特化モデルから共同で学習し、従来のタスク特化手法よりも優れた検出効率を示す。
論文参考訳（メタデータ） (2024-03-25T20:12:02Z)
Towards Automated Accessibility Report Generation for Mobile Apps [14.908672785900832]
アプリケーションアクセシビリティーレポート全体を生成するシステムを提案する。様々なデータ収集方法(アプリクローリング、手動記録など)と既存のアクセシビリティスキャナを組み合わせる。
論文参考訳（メタデータ） (2023-09-29T19:05:11Z)
Continual Object Detection via Prototypical Task Correlation Guided Gating Mechanism [120.1998866178014]
pRotOtypeal taSk corrElaTion guided gaTingAnism (ROSETTA)による連続物体検出のためのフレキシブルなフレームワークを提案する。具体的には、統一されたフレームワークはすべてのタスクで共有され、タスク対応ゲートは特定のタスクのサブモデルを自動的に選択するために導入されます。 COCO-VOC、KITTI-Kitchen、VOCのクラスインクリメンタル検出、および4つのタスクの逐次学習の実験により、ROSETTAが最先端のパフォーマンスを得ることが示された。
論文参考訳（メタデータ） (2022-05-06T07:31:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。