論文の概要: RippleGUItester: Change-Aware Exploratory Testing
- arxiv url: http://arxiv.org/abs/2603.03121v1
- Date: Tue, 03 Mar 2026 15:56:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-04 21:38:10.870661
- Title: RippleGUItester: Change-Aware Exploratory Testing
- Title(参考訳): RippleGUItester: 変革を意識した探索テスト
- Authors: Yanqi Su, Michael Pradel, Chunyang Chen,
- Abstract要約: 本稿では、コード変更をリップル効果の震源として扱う変更駆動テストシステムであるRippleGUItesterを紹介する。
私たちは、広く使われている4つのソフトウェアシステム(Firefox、Zettlr、JabRef、Godot)にまたがる、何百もの現実世界のコード変更に対するアプローチを評価しました。
評価システムの最新バージョンにまだ残っている26の既知のバグを総じて同定する。
- 参考スコア(独自算出の注目度): 22.40767870807728
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Software systems evolve continuously through frequent code changes, yet such changes often introduce unintended bugs despite extensive testing and code review. Existing testing approaches are largely constrained to predefined execution paths or rely on unguided exploration, leaving many change-induced issues undetected. To address this challenge, we present RippleGUItester, a change-driven testing system that treats a code change as the epicenter of a ripple effect and explores its broader, user-visible impacts via the GUI. Given a code change, RippleGUItester performs LLM-based change-impact analysis to generate and enrich realistic test scenarios, executes these scenarios on both pre-change and post-change versions of the system, and applies differential analysis to identify behavioral differences. Crucially, RippleGUItester employs multimodal bug detection, comparing visual GUI changes and interpreting them in the context of natural-language change intents to distinguish unintended bugs from intended behavioral updates. We evaluate our approach on hundreds of real-world code changes across four widely used software systems: Firefox, Zettlr, JabRef, and Godot. Our results show that the proposed approach uncovers bugs introduced by code changes that were missed by existing test suites, CI pipelines, and code review. In total, we identify 26 previously unknown bugs that still exist in the latest versions of the evaluated systems. After reporting, 16 bugs have been fixed, 2 have been confirmed, 6 are still under discussion, and 2 were marked as intended. We envision RippleGUItester being applied before or shortly after a code change is merged, enabling earlier detection of regressions.
- Abstract(参考訳): ソフトウェアシステムは、頻繁なコード変更を通じて継続的に進化するが、このような変更は、広範囲なテストとコードレビューにもかかわらず、意図しないバグをもたらすことが多い。
既存のテストアプローチは、事前に定義された実行パスに大きく制約されているか、誘導されていない探索に依存しているため、多くの変更によって引き起こされた問題が検出されていない。
この課題に対処するために,コード変更をリップル効果の震源として扱う変更駆動テストシステムであるRippleGUItesterを紹介する。
コードの変更が与えられた後、RippleGUItesterはLLMベースの変更影響分析を実行して現実的なテストシナリオを生成し、システムの事前変更バージョンと後変更バージョンの両方でこれらのシナリオを実行し、振る舞いの違いを識別するために差分解析を適用します。
重要なのは、RippleGUItesterはマルチモーダルなバグ検出を採用し、視覚的なGUIの変更を比較し、意図しないバグと意図しない振る舞いの更新を区別するために、自然言語の変更意図の文脈でそれらを解釈する。
私たちは、広く使われている4つのソフトウェアシステム(Firefox、Zettlr、JabRef、Godot)にまたがる、何百もの現実世界のコード変更に対するアプローチを評価しました。
提案手法では,既存のテストスイートやCIパイプライン,コードレビューで見逃されたコード変更によって発生するバグが明らかになった。
評価システムの最新バージョンにまだ残っている26の既知のバグを総じて同定する。
報告後、16のバグが修正され、2が確認され、6がまだ議論中であり、2が意図されたものとしてマークされている。
コード変更がマージされた直後に,RippleGUItesterが適用されることを想定しています。
関連論文リスト
- Enhancing Code Review through Fuzzing and Likely Invariants [13.727241655311664]
FuzzSightは、非クラッシングファジィ入力の潜在的な不変量を利用して、プログラムバージョン間での振る舞いの違いを強調するフレームワークである。
評価では、FuzzSightがレグレッションバグの75%、最大80%の脆弱性を24時間のファズリングによって発見しました。
論文 参考訳(メタデータ) (2025-10-17T10:30:22Z) - Probing Pre-trained Language Models on Code Changes: Insights from ReDef, a High-Confidence Just-in-Time Defect Prediction Dataset [0.0]
本稿では,22の大規模C/C++プロジェクトから得られた関数レベル修正の信頼性の高いベンチマークであるReDefを紹介する。
欠陥ケースはコミットの反転によって固定され、クリーンケースはポストホック履歴チェックによって検証される。
このパイプラインは3,164の欠陥と10,268のクリーンな修正をもたらし、既存のリソースよりも信頼性の高いラベルを提供する。
論文 参考訳(メタデータ) (2025-09-11T07:07:11Z) - Testora: Using Natural Language Intent to Detect Behavioral Regressions [16.852583199679117]
本稿では,コード変更の意図とコード変更による振る舞いの違いを比較することで,回帰を検出する最初の自動手法であるTestoraを提案する。
19のレグレッションバグと11のPRがあり、別の意図があるにも関わらず、同時にバグを修正します。
私たちは、コード変更がコードベースにマージされた後、あるいはすぐに使用されるアプローチを想像し、従来のアプローチに縛られていない回帰を早期に検出する方法を提供しています。
論文 参考訳(メタデータ) (2025-03-24T11:55:35Z) - Detect Changes like Humans: Incorporating Semantic Priors for Improved Change Detection [52.62459671461816]
本稿では,視覚基盤モデルからのセマンティックな先入観を取り入れ,変化を検出する能力の向上について検討する。
人間の視覚パラダイムにインスパイアされた新しいデュアルストリーム特徴デコーダは、意味認識特徴と差認識特徴を組み合わせることで変化を区別するために導出される。
論文 参考訳(メタデータ) (2024-12-22T08:27:15Z) - Show Me What and Where has Changed? Question Answering and Grounding for Remote Sensing Change Detection [82.65760006883248]
我々は,CDQAG (Change Detection Question Answering and Grounding) という新しいタスクを導入する。
CDQAGは、解釈可能なテキスト回答と直感的な視覚的証拠を提供することで、従来の変更検出タスクを拡張している。
QAG-360Kと呼ばれる最初のCDQAGベンチマークデータセットを構築し、360K以上の質問、テキスト回答、およびそれに対応する高品質な視覚マスクを含む。
論文 参考訳(メタデータ) (2024-10-31T11:20:13Z) - Seeing is Believing: Vision-driven Non-crash Functional Bug Detection for Mobile Apps [26.96558418166514]
本稿では,非クラッシュな機能的バグを検出するための,視覚駆動型多エージェント協調GUIテスト手法を提案する。
590の非クラッシュバグに対してTridentを評価し,12のベースラインと比較したところ,平均リコールと精度が14%-112%,108%-147%向上した。
論文 参考訳(メタデータ) (2024-07-03T11:58:09Z) - Leveraging Large Language Models for Efficient Failure Analysis in Game Development [47.618236610219554]
本稿では,テストの失敗の原因となるコードの変更を自動的に識別する手法を提案する。
このメソッドは、LLM(Large Language Models)を利用して、エラーメッセージと対応するコード変更を関連付ける。
当社のアプローチは新たに作成したデータセットで71%の精度に達しています。
論文 参考訳(メタデータ) (2024-06-11T09:21:50Z) - MS-Former: Memory-Supported Transformer for Weakly Supervised Change
Detection with Patch-Level Annotations [50.79913333804232]
弱い教師付き変化検出のためのメモリ支援トランス (MS-Former) を提案する。
MS-Former は双方向注意ブロック (BAB) とパッチレベルの監視スキーム (PSS) から構成される。
3つのベンチマークデータセットの実験結果から,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2023-11-16T09:57:29Z) - Identifying Defect-Inducing Changes in Visual Code [54.20154707138088]
SZZ-VC (SZZ Visual Code) は, ラインの違いではなくグラフィカル要素の違いに基づいて, 視覚的コードの変化を検知するアルゴリズムである。
業界製AAAビデオゲームのアルゴリズムを検証し、12のオープンソースプロジェクトで20の音楽ヴィジュアルプログラミングの欠陥を検証した。
論文 参考訳(メタデータ) (2023-09-07T00:12:28Z) - Learning Sinkhorn divergences for supervised change point detection [24.30834981766022]
そこで本研究では,実測値学習の監督として,真の変化点インスタンスを用いた新しい変化点検出フレームワークを提案する。
提案手法は,特徴選択と解釈の両方に有用であるスパース計量の学習に利用できる。
論文 参考訳(メタデータ) (2022-02-08T17:11:40Z) - D2A: A Dataset Built for AI-Based Vulnerability Detection Methods Using
Differential Analysis [55.15995704119158]
静的解析ツールによって報告されたラベル問題に対する差分解析に基づくアプローチであるD2Aを提案する。
D2Aを使用して大きなラベル付きデータセットを生成し、脆弱性識別のためのモデルをトレーニングします。
論文 参考訳(メタデータ) (2021-02-16T07:46:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。