論文の概要: Understanding Automated Web GUI Testing: An Empirical Study Across Exploration Strategies and State Abstractions
- arxiv url: http://arxiv.org/abs/2606.16650v1
- Date: Mon, 15 Jun 2026 12:40:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:34.549616
- Title: Understanding Automated Web GUI Testing: An Empirical Study Across Exploration Strategies and State Abstractions
- Title(参考訳): 自動Web GUIテストを理解する - 探索戦略と状態抽象化に関する実証的研究
- Authors: Chenxu Liu, Wei Yang, Ying Zhang, Tao Xie,
- Abstract要約: 探索戦略と状態抽象化がテストの有効性にどのように影響するかを考察する。
カテゴリはコードカバレッジ、状態カバレッジ、障害発見において相補的な長所を示す。
- 参考スコア(独自算出の注目度): 12.068986139687908
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated web GUI testing (AWGT) relies on exploration strategies that exercise web applications through GUI actions to maximize code coverage, spanning traditional model-based, reinforcement learning (RL)-based, and emerging large language model (LLM)-based approaches. State abstraction, which detects pages with the same functionality to avoid repeated testing, has long been recognized as critical to guiding exploration. However, how exploration strategies and state abstractions jointly affect testing effectiveness remains underexplored. We present an empirical study analyzing both factors from the perspectives of code coverage and failure revelation. We compare representative model-based, RL-based, and LLM-based approaches; investigate how six state abstractions influence model-based and RL-based approaches; examine LLM-based approaches under different history representations, which act as a form of state abstraction; and compare the failures exposed by different approaches. Our results show that no single strategy excels across all dimensions; instead, categories exhibit complementary strengths in code coverage, state coverage, and failure discovery. State abstraction is a key factor: strict, fine-grained abstractions favor model-based strategies, while compact ones better support RL-based strategies. History representation substantially affects LLM-based strategies, where concise, functionality-level context performs best. We also find that code coverage is weakly correlated with failure-revealing ability, underscoring the need for multi-dimensional evaluation. These findings offer practical guidance for selecting exploration strategies and designing effective state abstractions for AWGT.
- Abstract(参考訳): 自動Web GUIテスト(AWGT)は、GUIアクションを通じてWebアプリケーションを動作させ、コードカバレッジを最大化し、従来のモデルベース、強化学習(RL)ベース、新しい大規模言語モデル(LLM)ベースのアプローチにまたがる探索戦略に依存している。
繰り返しテストを避けるために同じ機能を持つページを検出する状態抽象化は、長い間、探索を導く上で重要であると認識されてきた。
しかし、探索戦略と状態抽象化がテストの有効性にどのように影響するかは未定のままである。
本稿では、コードカバレッジと失敗の啓示の観点から、両方の要因を解析する実証的研究について述べる。
代表的なモデルベース, RLベース, LLMベースのアプローチを比較し, 6つの状態抽象化がモデルベース, RLベースのアプローチにどのように影響するかを検討する。
カテゴリはコードカバレッジ、状態カバレッジ、障害発見において相補的な強みを示します。
厳密できめ細かい抽象化はモデルベースの戦略を好んでおり、コンパクトな抽象化はRLベースの戦略をよりサポートしています。
履歴表現はLLMベースの戦略に大きく影響し、簡潔で機能レベルのコンテキストが最善である。
また,コードカバレッジは障害回避能力と弱い相関関係にあり,多次元評価の必要性が強調されている。
これらの知見は、AWGTの探索戦略の選択と効率的な状態抽象化の設計のための実践的なガイダンスを提供する。
関連論文リスト
- Answer-Set-Programming-based Abstractions for Reinforcement Learning [11.527421282223946]
強化学習(Reinforcement Learning, RL)は、自律的なエージェントによる学習を可能にする。
Martijn van Otterlo氏によるCARCASSフレームワークは、一階述語におけるマルコフ決定過程(MD)の論理近似がどのようにモデル化できるかを実証している。
我々は、CARCASSの抽象化を実現するために、完全に宣言的なモデリング言語であるPrologとは対照的に、リッチな世界であるASPを探究する。
論文 参考訳(メタデータ) (2026-05-29T15:40:10Z) - Abstraction for Offline Goal-Conditioned Reinforcement Learning [40.88972158563976]
本稿では、相対化オプションを学習し、絶対的な参照フレームから抽象化するアルゴリズムを2つ導入する。
実験の結果,このような帰納バイアスはオフラインのゴール・コンディション強化学習のパフォーマンスを著しく向上させることがわかった。
論文 参考訳(メタデータ) (2026-05-21T16:50:26Z) - AIPO: Learning to Reason from Active Interaction [54.10819421625103]
AIPOは、ポリシーモデルが、推論ボトルネックに遭遇するときに、3つの機能的協調エージェントを積極的に相談することを可能にする。
AIPOは推論性能を継続的に改善し、異なるポリシーモデルとRLVRアルゴリズムをまたいで堅牢に一般化し、ポリシーモデルの推論能力境界を効果的に拡張する。
論文 参考訳(メタデータ) (2026-05-08T19:06:55Z) - Strategy Executability in Mathematical Reasoning: Leveraging Human-Model Differences for Effective Guidance [86.46794021499511]
戦略利用と戦略実行可能性の間には、これまで未定のギャップがある。
SSR(Selective Strategy Retrieval)は,実行可能性を明確にモデル化するテストタイムフレームワークである。
SSRは、直接解決、文脈内学習、単一ソースガイダンスよりも信頼性が高く一貫した改善をもたらす。
論文 参考訳(メタデータ) (2026-02-26T03:34:23Z) - In-Context Learning for Pure Exploration [28.404325855738502]
本研究は, 純粋探索(Pure Exploring)としても知られる, 能動的逐次仮説検定の課題について考察する。
In-Context Pure Exploration (ICPE)を導入し、トランスフォーマーをメタトレーニングして、観測履歴をクエリアクションと予測仮説にマッピングする。
ICPEは、新しいタスクの証拠を積極的に収集し、パラメータの更新なしに真の仮説を推測する。
論文 参考訳(メタデータ) (2025-06-02T17:04:50Z) - Towards a Unified View of Preference Learning for Large Language Models: A Survey [88.66719962576005]
大きな言語モデル(LLM)は、非常に強力な能力を示す。
成功するための重要な要因の1つは、LLMの出力を人間の好みに合わせることである。
選好学習のすべての戦略を、モデル、データ、フィードバック、アルゴリズムの4つの構成要素に分解する。
論文 参考訳(メタデータ) (2024-09-04T15:11:55Z) - Exploiting Multiple Abstractions in Episodic RL via Reward Shaping [23.61187560936501]
対象領域の下位にあるマルコフ決定過程(MDP)の抽象層の線形階層について考察する。
本稿では,抽象レベルで得られる解を用いて,より具体的なMDPに報酬を与える方法を提案する。
論文 参考訳(メタデータ) (2023-02-28T13:22:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。