論文の概要: EpiDroid: Dependency-Guided Recomposition for Deep State Discovery in Mobile GUI Testing
- arxiv url: http://arxiv.org/abs/2604.01522v1
- Date: Thu, 02 Apr 2026 01:34:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.185606
- Title: EpiDroid: Dependency-Guided Recomposition for Deep State Discovery in Mobile GUI Testing
- Title(参考訳): EpiDroid: モバイルGUIテストにおけるDeep State Discoveryのための依存性ガイドによるリコレーション
- Authors: Jiahui Song, Jiaxin Zhi, Kangjia Zhao, Chen Zhi, Junxiao Han, Xinkui Zhao, Nan Wang, Shuiguang Deng, Jianwei Yin,
- Abstract要約: 既存のエクスプローラーをセマンティックステート依存の認識を通じて強化するプラグイン可能なフレームワークであるEpiDroidを紹介した。
EpiDroidは、生のトレースを安定したテストフラグメントに蒸留して、基礎となる依存関係を抽出する。
次に、LLMによるインパクト推論と、高値の可変状態要素に対する決定論的リプレイを行うために、Recomposition-Replayパラダイムを使用する。
- 参考スコア(独自算出の注目度): 33.11587320088287
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The increasing scale and complexity of mobile applications make automated GUI exploration essential for software quality assurance. However, existing methods often neglect state dependencies between test fragments, which leads to redundant exploration and prevents access to deep application states. We introduce EpiDroid, a black-box, pluggable framework that augments existing explorers through semantic state dependency awareness. EpiDroid distills raw traces into stable test fragments to extract underlying dependencies. It then employs a Recomposition-Replay paradigm to perform impact reasoning via LLM and deterministic replay on high-value mutable state elements. Through iterative feedback, EpiDroid refines the state-dependency graph to systematically reach deep application states. We integrated EpiDroid into both industrial and state-of-the-art research tools and evaluated it on 20 real-world apps. The results show that EpiDroid consistently improves the performance of all baselines, increasing average code coverage by 10--28\% and delivering 3--4$\times$ more coverage gain compared to continuing the baselines alone from the same starting point. This demonstrates that dependency-guided recomposition unlocks deep states that forward exploration cannot access, irrespective of additional budget.
- Abstract(参考訳): モバイルアプリケーションの規模と複雑さの増大により、ソフトウェアの品質保証のためにGUIの自動探索が不可欠になる。
しかし、既存のメソッドはテストフラグメント間の状態依存性を無視することが多いため、冗長な探索が発生し、深いアプリケーション状態にアクセスできない。
既存のエクスプローラーをセマンティックステート依存認識を通じて強化する,ブラックボックスでプラグイン可能なフレームワークであるEpiDroidを紹介した。
EpiDroidは、生のトレースを安定したテストフラグメントに蒸留して、基礎となる依存関係を抽出する。
次に、LLMによるインパクト推論と、高値の可変状態要素に対する決定論的リプレイを行うために、Recomposition-Replayパラダイムを使用する。
反復的なフィードバックを通じて、EpiDroidは状態依存グラフを洗練し、深いアプリケーション状態に体系的に到達する。
EpiDroidを産業用と最先端の研究ツールの両方に統合し、20の現実世界のアプリケーションで評価しました。
結果は、EpiDroidがすべてのベースラインのパフォーマンスを継続的に改善し、平均コードカバレッジを10--28\%増加させ、3~4$\times$以上のカバレッジを同じスタート地点からベースラインのみを継続するのと比べて提供したことを示している。
これは、依存関係を導いた再結合が、追加予算に関係なく、フォワード探索がアクセスできないディープステートを解放することを示している。
関連論文リスト
- Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - Curiosity Driven Knowledge Retrieval for Mobile Agents [15.258581046703947]
好奇心による知識検索フレームワークを導入し,実行中の不確実性をキュリオシティスコアとして定式化する。
このスコアがしきい値を超えると、システムはドキュメント、コードリポジトリ、履歴トラジェクトリから外部情報を取得する。
実行中、強化されたエージェントは、関連するAppCardを推論プロセスに選択的に統合し、知識の盲点を補償する。
論文 参考訳(メタデータ) (2026-01-27T07:46:05Z) - InfiAgent: An Infinite-Horizon Framework for General-Purpose Autonomous Agents [36.740230738304525]
InfiAgentは、タスクの持続時間に関係なく、エージェントの推論コンテキストを厳密に拘束する。
20Bのオープンソースモデルを持つInfiAgentは、より大きなプロプライエタリなシステムと競合する。
論文 参考訳(メタデータ) (2026-01-06T17:35:57Z) - A Multi-Agent Framework for Stateful Inference-Time Search [0.5163175134881653]
ステートフルなマルチエージェント進化探索は、永続的な推論時間状態、敵対突然変異、進化保存を組み合わせたものである。
エッジケースの生成による自動単体テスト生成の有効性を示す。
実験により、ステートフルなマルチエージェント推論フレームワークは、ステートレスなシングルステップベースラインよりもかなりの増加率を達成することが示された。
論文 参考訳(メタデータ) (2025-10-08T15:48:41Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - A Comprehensive Library for Benchmarking Multi-class Visual Anomaly Detection [89.92916473403108]
本稿では,新しい手法のモジュラーフレームワークであるADerの総合的な視覚異常検出ベンチマークを提案する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-06-05T13:40:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。