論文の概要: Context-Aware Functional Test Generation via Business Logic Extraction and Adaptation
- arxiv url: http://arxiv.org/abs/2602.24108v1
- Date: Fri, 27 Feb 2026 15:47:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-02 19:48:24.494533
- Title: Context-Aware Functional Test Generation via Business Logic Extraction and Adaptation
- Title(参考訳): ビジネス論理抽出と適応によるコンテキスト対応機能テスト生成
- Authors: Yakun Zhang, Zihan Wang, Xinzhi Peng, Zihao Xie, Xiaodong Wang, Xutao Li, Dan Hao, Lu Zhang, Yunming Ye,
- Abstract要約: ビジネスロジックを抽出し,ターゲットとするアプリケーションに適用することにより,機能テストケースを生成する2段階のアプローチであるLogiDroidを提案する。
実世界の28のアプリケーションと190の機能要件をカバーする2つの広く利用されているデータセットを用いてLogiDroidの有効性を評価する。
- 参考スコア(独自算出の注目度): 32.20036552577251
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Functional testing is essential for verifying that the business logic of mobile applications aligns with user requirements, serving as the primary methodology for quality assurance in software development. Despite its importance, functional testing remains heavily dependent on manual effort due to two core challenges. First, acquiring and reusing complex business logic from unstructured requirements remains difficult, which hinders the understanding of specific functionalities. Second, a significant semantic gap exists when adapting business logic to the diverse GUI environments, which hinders the generation of test cases for specific mobile applications. To address the preceding challenges, we propose LogiDroid, a two-stage approach that generates individual functional test cases by extracting business logic and adapting it to target applications. First, in the Knowledge Retrieval and Fusion stage, we construct a dataset to retrieve relevant cases and extract business logic for the target functionality. Second, in the Context-Aware Test Generation stage, LogiDroid jointly analyzes the extracted business logic and the real-time GUI environment to generate functional test cases. This design allows LogiDroid to accurately understand application semantics and use domain expertise to generate complete test cases with verification assertions. We assess the effectiveness of LogiDroid using two widely-used datasets that cover 28 real-world applications and 190 functional requirements. Experimental results show that LogiDroid successfully tested 40% of functional requirements on the FrUITeR dataset (an improvement of over 48% compared to the state-of-the-art approaches) and 65% on the Lin dataset (an improvement of over 55% compared to the state-of-the-art approaches). These results demonstrate the significant effectiveness of LogiDroid in functional test generation.
- Abstract(参考訳): 機能テストは、モバイルアプリケーションのビジネスロジックがユーザ要求と整合していることを検証するのに不可欠であり、ソフトウェア開発における品質保証の主要な方法論として役立ちます。
その重要性にもかかわらず、機能テストは2つのコア課題のために手作業に大きく依存している。
まず、構造化されていない要求から複雑なビジネスロジックを取得して再利用することは依然として困難であり、特定の機能を理解するのを妨げます。
第二に、ビジネスロジックを多様なGUI環境に適用する場合、特定のモバイルアプリケーションに対するテストケースの生成を妨げる重要なセマンティックギャップが存在します。
上記の課題に対処するため、ビジネスロジックを抽出してターゲットアプリケーションに適用することで、個々の機能テストケースを生成する2段階のアプローチであるLogiDroidを提案する。
まず、知識検索と融合の段階で、関連するケースを検索し、ターゲット機能のためのビジネスロジックを抽出するデータセットを構築します。
第二に、Context-Aware Test Generationの段階で、LogiDroidは抽出したビジネスロジックとリアルタイムGUI環境を共同で分析し、機能テストケースを生成する。
この設計により、LogiDroidはアプリケーションのセマンティクスを正確に理解し、ドメインの専門知識を使って検証アサーションで完全なテストケースを生成することができる。
実世界の28のアプリケーションと190の機能要件をカバーする2つの広く利用されているデータセットを用いてLogiDroidの有効性を評価する。
実験の結果、LogiDroidはFrUITeRデータセット上の機能要件の40%(最先端のアプローチと比較して48%以上改善)とLinデータセット上で65%(最先端のアプローチに比べて55%以上改善)をうまくテストした。
これらの結果は,機能テスト生成におけるLogiDroidの有効性を示す。
関連論文リスト
- BeyondSWE: Can Current Code Agent Survive Beyond Single-Repo Bug Fixing? [61.247730037229815]
BeyondSWEは2つの軸 – 解像度スコープと知識スコープ – に沿って既存の評価を拡張する包括的なベンチマークです。
外部知識の役割を解明するために,ディープ検索とコーディング能力を統合するフレームワークであるSearchSWEを開発した。
この作業は、現実的で挑戦的な評価ベンチマークと、より有能なコードエージェントに向けた研究を進めるための柔軟なフレームワークの両方を提供する。
論文 参考訳(メタデータ) (2026-03-03T17:52:01Z) - FuncDroid: Towards Inter-Functional Flows for Comprehensive Mobile App GUI Testing [6.346121677855558]
本稿では,正確なモデル構築と深いバグ検出という2つの目標を掲げた,関数型フロー指向GUIテスト手法を提案する。
2つの相補的なテスト生成ビューを組み合わせることで、機能境界を適応的に洗練し、機能間フローを体系的に探索することができる。
このアプローチをFuncDroidというツールに実装し、2つのベンチマークで評価します。(1)再現可能な50のクラッシュバグを備えた、広く使われているオープンソースベンチマーク、(2)52の人気のある商用アプリの多種多様なセットです。
論文 参考訳(メタデータ) (2026-02-13T11:40:02Z) - SAINT: Service-level Integration Test Generation with Program Analysis and LLM-based Agents [43.3273990835497]
SAINTは、エンタープライズJavaアプリケーションのサービスレベルのテストのための、新しいホワイトボックステストアプローチである。
SAINTは静的解析、大規模言語モデル(LLM)、LLMベースのエージェントを組み合わせて、エンドポイントとシナリオベースのテストを自動的に生成する。
論文 参考訳(メタデータ) (2025-11-17T12:29:42Z) - Agent4FaceForgery: Multi-Agent LLM Framework for Realistic Face Forgery Detection [108.5042835056188]
この作業では,2つの基本的な問題に対処するため,Agent4FaceForgeryを導入している。
人間の偽造の多様な意図と反復的なプロセスを捉える方法。
ソーシャルメディアの偽造に付随する複雑な、しばしば敵対的な、テキストと画像のインタラクションをモデル化する方法。
論文 参考訳(メタデータ) (2025-09-16T01:05:01Z) - Automatic High-Level Test Case Generation using Large Language Models [1.8136446064778242]
主な課題は、テストスクリプトを書くのではなく、テスト作業とビジネス要件の整合性です。
我々は、高レベルのテストケースを生成するためのトレーニング/ファインチューンモデルを構築するユースケースデータセットを構築した。
当社の積極的なアプローチは要件テストのアライメントを強化し,早期テストケース生成を容易にする。
論文 参考訳(メタデータ) (2025-03-23T09:14:41Z) - Pointwise Mutual Information as a Performance Gauge for Retrieval-Augmented Generation [78.28197013467157]
文脈と問合せの間のポイントワイドな相互情報は,言語モデルの性能向上に有効な指標であることを示す。
本稿では,文書と質問のポイントワイドな相互情報を利用する2つの手法を提案する。
論文 参考訳(メタデータ) (2024-11-12T13:14:09Z) - GUI Test Migration via Abstraction and Concretization [26.503512328876198]
GUIテストマイグレーションは、ターゲットアプリの特定の機能をテストするために、イベントとアサーションを備えたテストケースを生成することを目的としている。
本稿では,まず,対象機能に対するテストロジックを抽象化する新たなマイグレーションパラダイムを提案する。
このパラダイムに基づいてGUIテストケースを移行する最初のアプローチであるMACdroidを紹介します。
論文 参考訳(メタデータ) (2024-09-08T08:46:05Z) - DiscoveryBench: Towards Data-Driven Discovery with Large Language Models [50.36636396660163]
我々は、データ駆動探索の多段階プロセスを形式化する最初の包括的なベンチマークであるDiscoveryBenchを紹介する。
我々のベンチマークには、社会学や工学などの6つの分野にまたがる264のタスクが含まれている。
私たちのベンチマークでは、自律的なデータ駆動型発見の課題を説明し、コミュニティが前進するための貴重なリソースとして役立ちます。
論文 参考訳(メタデータ) (2024-07-01T18:58:22Z) - Generating Test Scenarios from NL Requirements using Retrieval-Augmented LLMs: An Industrial Study [5.179738379203527]
本稿では,Large Language Models (LLM) を用いたRAG(Retrieval-Augmented Generation) を用いたテストシナリオ生成のための自動アプローチ(RAGTAG)を提案する。
オーストリアポストの2つの産業プロジェクトにおけるRAGTAGの評価を行い,ドイツ語と英語のバイリンガル要件について検討した。
論文 参考訳(メタデータ) (2024-04-19T10:27:40Z) - AR-LSAT: Investigating Analytical Reasoning of Text [57.1542673852013]
テキストの分析的推論の課題を研究し、1991年から2016年までのロースクール入学試験からの質問からなる新しいデータセットを紹介します。
我々は,この課題をうまくこなすために必要な知識理解と推論能力を分析する。
論文 参考訳(メタデータ) (2021-04-14T02:53:32Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。