論文の概要: Automated Functional Testing for Malleable Mobile Application Driven from User Intent
- arxiv url: http://arxiv.org/abs/2604.02079v2
- Date: Wed, 08 Apr 2026 15:27:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 14:06:04.977716
- Title: Automated Functional Testing for Malleable Mobile Application Driven from User Intent
- Title(参考訳): ユーザインテントから駆動されるMalleable Mobileアプリケーションの自動機能テスト
- Authors: Yuying Wang, Kaifeng Huang, Hao Deng, Zhiyuan Sun, Jinxuan Zhou, Shengjie Zhao,
- Abstract要約: ALADDINはユーザ要求駆動のGUIテスト生成フレームワークである。
私たちは6つの人気のあるモバイルアプリにまたがるベンチマークを構築します。
私たちの研究は、モバイルアプリ開発を製品マネージャ駆動のパラダイムからエンドユーザ駆動のパラダイムに移行する可能性を強調しています。
- 参考スコア(独自算出の注目度): 21.37027558749301
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Software malleability allows applications to be easily changed, configured, and adapted even after deployment. While prior work has explored configurable systems, adaptive recommender systems, and malleable GUIs, these approaches are often tailored to specific software and lack generalizability. In this work, we envision per-user malleable mobile applications, where end-users can specify requirements that are automatically implemented via LLM-based code generation. However, realizing this vision requires overcoming the key challenge of designing automated test generation that can reliably verify both the presence and correctness of user-specified functionalities. We propose ALADDIN, a user-requirement-driven GUI test generation framework that incrementally navigates the UI, triggers desired functionalities, and constructs LLM-guided oracles to validate correctness. We build a benchmark spanning six popular mobile applications with both correct and faulty user-requested functionalities, demonstrating that ALADDIN effectively validates per-user features and is practical for real-world deployment. Our work highlights the feasibility of shifting mobile app development from a product-manager-driven to an end-user-driven paradigm.
- Abstract(参考訳): ソフトウェアへの適合性により、アプリケーションはデプロイ後でも簡単に変更、設定、適応できる。
以前の研究では、設定可能なシステム、適応的なレコメンデータシステム、拡張可能なGUIを探索してきたが、これらのアプローチは特定のソフトウェアに適したもので、一般化性に欠けることが多い。
本研究では,LDMベースのコード生成によって自動的に実装される要件をエンドユーザが指定できる,ユーザ毎の可搬型モバイルアプリケーションを提案する。
しかし、このビジョンを実現するには、ユーザー特定機能の存在と正確性の両方を確実に検証できる自動テスト生成を設計する上で重要な課題を克服する必要がある。
ユーザ要求駆動のGUIテスト生成フレームワークであるALADDINを提案する。
ALADDINはユーザ毎の機能を効果的に検証し,実際のデプロイに有効であることを示す。
私たちの研究は、モバイルアプリ開発を製品マネージャ駆動のパラダイムからエンドユーザ駆動のパラダイムに移行する可能性を強調しています。
関連論文リスト
- PSPA-Bench: A Personalized Benchmark for Smartphone GUI Agent [32.14146282263351]
PSPA-Benchは、スマートフォンGUIエージェントのパーソナライゼーションを評価するためのベンチマークである。
PSPA-Benchは、現実世界のユーザの振る舞いに合わせて12,855以上のパーソナライズされた命令で構成されている。
その結果、現在の手法はパーソナライズされた設定下では不十分であることが判明した。
論文 参考訳(メタデータ) (2026-03-31T06:37:12Z) - AppForge: From Assistant to Independent Developer - Are GPTs Ready for Software Development? [28.63033734662797]
APPFORGEは、現実世界のAndroidアプリから引き出された101のソフトウェア開発問題からなるベンチマークである。
アプリケーション文書から主要な機能を自動で要約するマルチエージェントシステムを設計し、テストケースを合成するためにアプリをナビゲートする。
Android開発専門家による厳格な手作業による検証に続いて、APPFORGEでは、テストケースを自動評価フレームワークに組み込んでいる。
論文 参考訳(メタデータ) (2025-10-09T03:26:05Z) - GUISpector: An MLLM Agent Framework for Automated Verification of Natural Language Requirements in GUI Prototypes [58.197090145723735]
本稿では,GUIプロトタイプにおけるNL要求の自動検証にマルチモーダル(M)LLMエージェントを利用する新しいフレームワークを提案する。
GuiSpectorはエージェントの検証プロセスから詳細なNLフィードバックを抽出し、開発者に実行可能な洞察を提供する。
本稿では,これらの機能を統合化し,検証実行の監視,エージェントの合理性検査,エンドツーエンドの要件検証プロセスの管理を行うインターフェースを提供する。
論文 参考訳(メタデータ) (2025-10-06T13:15:24Z) - Creating General User Models from Computer Use [53.59999173952482]
本稿では,コンピュータとのインタラクションを観察することでユーザについて学習する汎用ユーザモデル(GUM)のアーキテクチャを提案する。
GUMは、ユーザ(例えばデバイスのスクリーンショット)の非構造化観察を入力として受け取り、ユーザの知識と好みをキャプチャする信頼度重み付け命題を構築する。
論文 参考訳(メタデータ) (2025-05-16T04:00:31Z) - Adaptive and Accessible User Interfaces for Seniors Through Model-Driven Engineering [4.220379425971002]
本稿では,モバイルアプリケーションインタフェースの高度な設計時適応を可能にする新しいモデル駆動工学(MDE)アプローチであるAdaptForgeを提案する。
第1のモデルはユーザのコンテキストオブユースパラメータを定義し、第2のモデルは条件付きアクセシビリティシナリオとそれに対応するUI適応ルールを定義します。
これらのルールはMDEワークフローによって解釈され、アプリのソースコードをパーソナライズされたインスタンスに変換する。
論文 参考訳(メタデータ) (2025-02-26T05:03:22Z) - AppAgent v2: Advanced Agent for Flexible Mobile Interactions [57.98933460388985]
本研究は,モバイル機器向けの新しいLLMベースのマルチモーダルエージェントフレームワークを提案する。
我々のエージェントは、様々なアプリケーションにまたがる適応性を高めるフレキシブルなアクション空間を構築する。
本研究は,実世界のシナリオにおいて,フレームワークの優れた性能を実証し,その有効性を確認した。
論文 参考訳(メタデータ) (2024-08-05T06:31:39Z) - Interlinking User Stories and GUI Prototyping: A Semi-Automatic LLM-based Approach [55.762798168494726]
グラフィカルユーザインタフェース(GUI)のプロトタイプにおいて,機能的NLベースの要求の実装を検証するための新しい言語モデル(LLM)ベースのアプローチを提案する。
提案手法は,GUIプロトタイプに実装されていない機能的ユーザストーリの検出と,要件を直接実装する適切なGUIコンポーネントのレコメンデーションを提供することを目的としている。
論文 参考訳(メタデータ) (2024-06-12T11:59:26Z) - LLM for Test Script Generation and Migration: Challenges, Capabilities,
and Opportunities [8.504639288314063]
テストスクリプト生成はソフトウェアテストの重要なコンポーネントであり、反復的なテストタスクの効率的かつ信頼性の高い自動化を可能にする。
既存の世代のアプローチは、さまざまなデバイス、プラットフォーム、アプリケーション間でテストスクリプトを正確にキャプチャし、再現することの難しさなど、しばしば制限に直面する。
本稿では,モバイルアプリケーションテストスクリプト生成分野における大規模言語モデル(LLM)の適用について検討する。
論文 参考訳(メタデータ) (2023-09-24T07:58:57Z) - Mobile-Env: Building Qualified Evaluation Benchmarks for LLM-GUI Interaction [28.53259866617677]
Android モバイル環境で GUI ベンチマークを作成するための総合ツールキットである Mobile-Env を紹介した。
我々は、さまざまな現実世界のアプリにまたがるオープンワールドのタスクと、固定されたワールドセットWikiHowを収集し、大量の動的オンラインコンテンツをキャプチャする。
我々の研究結果によると、高度なモデルでさえ、人間にとって比較的簡単なタスクに苦しむことがわかった。
論文 参考訳(メタデータ) (2023-05-14T12:31:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。