論文の概要: Cast: Automated Resilience Testing for Production Cloud Service Systems
- arxiv url: http://arxiv.org/abs/2602.00972v1
- Date: Sun, 01 Feb 2026 02:29:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.497058
- Title: Cast: Automated Resilience Testing for Production Cloud Service Systems
- Title(参考訳): Cast: プロダクションクラウドサービスシステムのための自動レジリエンステスト
- Authors: Zhuangbin Chen, Zhiling Deng, Kaiming Zhang, Yang Liu, Cheng Cui, Jinfeng Zhong, Zibin Zheng,
- Abstract要約: Castはマイクロサービスのレジリエンスを本番環境でテストするための、エンドツーエンドの自動化フレームワークです。
アプリケーションレベルの障害の包括的なライブラリに対して、プロダクショントラフィックを再生することで、高いテスト忠実性を達成する。
Castは、レジリエンスの脆弱性に積極的に対処するために、多くのサービスチームによって採用されている。
- 参考スコア(独自算出の注目度): 38.54479293660192
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The distributed nature of microservice architecture introduces significant resilience challenges. Traditional testing methods, limited by extensive manual effort and oversimplified test environments, fail to capture production system complexity. To address these limitations, we present Cast, an automated, end-to-end framework for microservice resilience testing in production. It achieves high test fidelity by replaying production traffic against a comprehensive library of application-level faults to exercise internal error-handling logic. To manage the combinatorial test space, Cast employs a complexity-driven strategy to systematically prune redundant tests and prioritize high-value tests targeting the most critical service execution paths. Cast automates the testing lifecycle through a three-phase pipeline (i.e., startup, fault injection, and recovery) and uses a multi-faceted oracle to automatically verify system resilience against nuanced criteria. Deployed in Huawei Cloud for over eight months, Cast has been adopted by many service teams to proactively address resilience vulnerabilities. Our analysis on four large-scale applications with millions of traces reveals 137 potential vulnerabilities, with 89 confirmed by developers. To further quantify its performance, Cast is evaluated on a benchmark set of 48 reproduced bugs, achieving a high coverage of 90%. The results show that Cast is a practical and effective solution for systematically improving the reliability of industrial microservice systems.
- Abstract(参考訳): マイクロサービスアーキテクチャの分散した性質は、大きなレジリエンスの課題をもたらします。
大規模な手作業と過度に単純化されたテスト環境によって制限された従来のテスト方法は、運用システムの複雑さを捉えることができない。
これらの制限に対処するため、本番環境でのマイクロサービスレジリエンステストのための、エンドツーエンドの自動化フレームワークであるCastを紹介します。
内部エラー処理ロジックを実行するために、アプリケーションレベルの障害の包括的なライブラリに対して、プロダクショントラフィックをリプレイすることで、高いテスト忠実性を実現する。
組合せテストスペースを管理するために、Castは複雑性駆動の戦略を使用して、冗長なテストを体系的に実行し、最も重要なサービス実行パスをターゲットにした高価値テストの優先順位付けを行う。
Castは3フェーズパイプライン(起動、フォールトインジェクション、リカバリ)を通じてテストライフサイクルを自動化し、マルチフェイスのオラクルを使用して、ニュアンスド基準に対するシステムのレジリエンスを自動的に検証する。
Huawei Cloudに8ヶ月以上デプロイされたCastは、レジリエンスの脆弱性に積極的に対処するために、多くのサービスチームによって採用されている。
数百万のトレースを持つ大規模アプリケーション4つの分析によると,潜在的な脆弱性は137件,開発者による89件が確認されている。
パフォーマンスをさらに定量化するために、Castは48個の再生バグのベンチマークセットで評価され、90%のカバレッジを達成した。
その結果,Castは産業用マイクロサービスシステムの信頼性を体系的に向上するための実用的で効果的なソリューションであることがわかった。
関連論文リスト
- The Rise of Agentic Testing: Multi-Agent Systems for Robust Software Quality Assurance [0.0]
現在のAIベースのテストジェネレータは、実行意識のフィードバックがないため、無効、冗長、あるいは実行不可能なテストを生成する。
本稿では,テスト生成エージェント,実行・分析エージェント,レビュー・最適化エージェントが協調してテストの生成,実行,解析,精査を行う,クローズドループの自己修正システムを提案する。
論文 参考訳(メタデータ) (2026-01-05T18:20:14Z) - Reliable LLM-Based Edge-Cloud-Expert Cascades for Telecom Knowledge Systems [54.916243942641444]
大規模言語モデル(LLM)は、通信などの分野において、自動化の鍵となる存在として浮上している。
本研究では,問合せパイプラインによる意思決定を支援する,エッジクラウドに精通したLLMベースの知識システムについて検討する。
論文 参考訳(メタデータ) (2025-12-23T03:10:09Z) - PentestEval: Benchmarking LLM-based Penetration Testing with Modular and Stage-Level Design [30.68819474524929]
PentestEvalは、6つの浸透テストステージにわたる大規模言語モデル(LLM)を評価するための、最初の包括的なベンチマークである。
12の現実的な脆弱なシナリオで、すべてのステージをカバーする346のタスクを対象とした、専門家による注釈付き土台真実と、完全に自動化された評価パイプラインを統合する。
9つのLLMのステージレベル評価では, 一般的には性能が低く, 浸透試験ワークフローの段階にわたって異なる限界がみられた。
論文 参考訳(メタデータ) (2025-12-16T09:37:21Z) - BOSQTGEN: Breaking the Sound Barrier in Test Generation [3.052470294814771]
本稿では,新しいブラックボックスとAPIテスト生成ツールであるBOSQTGENを紹介する。
BOSQTGENは、API仕様をプリミティブに分解するための新しいアプローチ、LLMを使用してコヒーレントなインタラクションを提案し、これらの値を効率的にサンプリングするためにテストを採用する。
結果として得られたBOSQTGENシステムは、ベンチマークで平均82%のコードカバレッジを達成するが、しばしば以前の最先端システムよりも20%以上増加する。
論文 参考訳(メタデータ) (2025-10-22T17:11:30Z) - Bridging Research and Practice in Simulation-based Testing of Industrial Robot Navigation Systems [9.268151135904063]
Surrealistは、UAV向けのシミュレーションベースのテスト生成フレームワークである。
本手法は,探索に基づくアルゴリズムを用いて,障害回避シナリオを自動的に生成する。
論文 参考訳(メタデータ) (2025-10-10T13:50:32Z) - AutoPT: How Far Are We from the End2End Automated Web Penetration Testing? [54.65079443902714]
LLMによって駆動されるPSMの原理に基づく自動浸透試験エージェントであるAutoPTを紹介する。
以上の結果から, AutoPT は GPT-4o ミニモデル上でのベースラインフレームワーク ReAct よりも優れていた。
論文 参考訳(メタデータ) (2024-11-02T13:24:30Z) - Towards Automatic Generation of Amplified Regression Test Oracles [44.45138073080198]
回帰テストオラクルを増幅するためのテストオラクル導出手法を提案する。
このアプローチはテスト実行中にオブジェクトの状態を監視し、以前のバージョンと比較して、SUTの意図した振る舞いに関連する変更を検出する。
論文 参考訳(メタデータ) (2023-07-28T12:38:44Z) - SUPERNOVA: Automating Test Selection and Defect Prevention in AAA Video
Games Using Risk Based Testing and Machine Learning [62.997667081978825]
従来の手法では、成長するソフトウェアシステムではスケールできないため、ビデオゲームのテストはますます難しいタスクになります。
自動化ハブとして機能しながら,テスト選択と欠陥防止を行うシステム SUPERNOVA を提案する。
この直接的な影響は、未公表のスポーツゲームタイトルの55%以上のテスト時間を減らすことが観察されている。
論文 参考訳(メタデータ) (2022-03-10T00:47:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。