論文の概要: When Web Apps Heal Themselves: A MAPE-K Based Approach to Fault Tolerance and Adaptive Recovery
- arxiv url: http://arxiv.org/abs/2605.19261v1
- Date: Tue, 19 May 2026 02:17:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.072363
- Title: When Web Apps Heal Themselves: A MAPE-K Based Approach to Fault Tolerance and Adaptive Recovery
- Title(参考訳): MAPE-Kベースのフォールトトレランスとアダプティブリカバリのためのアプローチ
- Authors: Sales Aribe, Rov Japheth Oracion,
- Abstract要約: 本研究では,共有知識ベース上でのモニタ・アナライズ・プラン実行に基づくモジュール型自己修復フレームワークを提案する。
適応的な障害回復のためのAutoFixにインスパイアされたメカニズムと統合されている。
提案されたフレームワークは、F1スコアの平均90.7%、リカバリ成功率93.2%を達成した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Ensuring the reliability and resilience of modern web applications remains a critical challenge due to increasing system complexity and dynamic runtime environments. This study proposes a modular self-healing framework based on the monitor-analyze-plan-execute over a shared knowledge base (MAPE-K) model, integrated with an AutoFix-inspired mechanism for adaptive fault recovery. Using a design and development research (DDR) approach, the system was implemented and evaluated through controlled fault injection experiments across twenty runtime failure scenarios, including service crashes, memory leaks, and database disconnections. Experimental results demonstrate that the proposed framework achieved a mean fault detection F1-score of 90.7% and a recovery success rate of 93.2%. The AutoFix module reduced the average time-to-recovery (TTR) by 56.2%, achieving an average recovery time of 3.92 seconds. System throughput was maintained between 88% and 95% during fault conditions, with only a 3.1% increase in response time. Additionally, iterative feedback mechanisms improved recovery efficiency by 18.6% over multiple cycles. These findings indicate that the proposed framework provides a practical and extensible approach to enhancing fault tolerance in web applications through feedback-driven adaptation. While the current implementation relies on predefined recovery strategies, the integration of learning-oriented feedback establishes a foundation for future development of more autonomous self-healing systems.
- Abstract(参考訳): 現代のWebアプリケーションの信頼性とレジリエンスを確保することは、システムの複雑さと動的ランタイム環境の増加によって、依然として重要な課題である。
本研究では,共有知識ベース(MAPE-K)モデル上でのモニタ・アナライズ・プラン実行に基づくモジュール型自己修復フレームワークを提案する。
設計・開発研究(DDR)アプローチを用いて、サービスクラッシュ、メモリリーク、データベースの切断を含む20のランタイム障害シナリオに対して、制御された障害注入実験を通じてシステムを実装し、評価した。
実験の結果, 提案したフレームワークは, 平均故障検出F1スコア90.7%, 回復率93.2%を達成した。
AutoFixモジュールは平均回収時間(TTR)を56.2%削減し、平均回収時間は3.92秒に達した。
システムスループットは88%から95%の間で維持され、応答時間はわずか3.1%増加した。
さらに、反復的なフィードバック機構により、複数のサイクルでリカバリ効率が18.6%向上した。
これらの結果から,提案フレームワークは,フィードバック駆動適応によるWebアプリケーションの耐障害性向上のための実用的で拡張可能なアプローチを提供することが示された。
現在の実装は事前に定義された回復戦略に依存しているが、学習指向のフィードバックの統合は、より自律的な自己修復システムの開発のための基盤を確立する。
関連論文リスト
- When to Retrieve During Reasoning: Adaptive Retrieval for Large Reasoning Models [13.891522069967507]
本稿では、推論対応検索フレームワークReaLM-Retrieveを紹介する。
ステップレベルの不確実性検出は、トークンや文レベルではなく、推論ステップで知識ギャップを識別する。
検索介入政策は、外部証拠が進行中の推論に最大限の利益をもたらすことを学習する。
論文 参考訳(メタデータ) (2026-04-29T13:15:44Z) - DeFRiS: Silo-Cooperative IoT Applications Scheduling via Decentralized Federated Reinforcement Learning [62.347535250646196]
本稿では、ロバストでスケーラブルなシロコラボ型IoTアプリケーションスケジューリングのための分散フェデレーション強化学習フレームワークであるDeFRiSを提案する。
DeFRiSは、(i)異種サイロ間のシームレスな知識伝達を可能にするための候補資源スコアを利用したアクション空間非依存ポリシー、(ii)汎用アドバンテージ推定とクリッピングされたポリシー更新を組み合わせたサイロ最適化ローカル学習メカニズム、(iii)類似性認識の知識伝達と異常検出に勾配指紋を利用するDual-Track Non-IIDロバストな分散集約プロトコル、の3つのイノベーションを統合する。
論文 参考訳(メタデータ) (2026-03-16T02:02:38Z) - Automated Self-Testing as a Quality Gate: Evidence-Driven Release Management for LLM Applications [51.56484100374058]
我々は,エビデンスに基づくリリース決定を伴う品質ゲートを導入する自動自己テストフレームワークを提案する。
内部展開型多エージェント対話型AIシステムの縦型ケーススタディにより,本フレームワークの評価を行った。
論文 参考訳(メタデータ) (2026-03-13T20:44:15Z) - Hierarchical Spatio-Temporal Attention Network with Adaptive Risk-Aware Decision for Forward Collision Warning in Complex Scenarios [7.238050152381639]
本稿では,階層型時空間注意ネットワークと動的リスク閾値調整アルゴリズムを併用した前方衝突警報フレームワークを提案する。
マルチシナリオデータセットでテストされ、完全なシステムは高い有効性を示し、F1スコアは0.912、偽警報率は8.2%、警告リード時間は2.8秒である。
論文 参考訳(メタデータ) (2025-11-25T05:57:29Z) - MTTR-A: Measuring Cognitive Recovery Latency in Multi-Agent Systems [1.9544213396776273]
我々は、信頼性指標平均時間-回復(MTTR)、平均時間-失敗(MTBF)、および認知領域に関連する比率を適応する。
この研究はエージェント認知における実行可能性の基礎を確立し、認知的回復をアドホックなプロセスから標準化された解釈可能なパフォーマンスに変換する。
論文 参考訳(メタデータ) (2025-11-08T21:29:18Z) - Multi-Objective Adaptive Rate Limiting in Microservices Using Deep Reinforcement Learning [10.766410192517164]
APIレート制限は、システムの安定性とサービス品質を保証する重要なメカニズムとして現れています。
トークンバケットやスライディングウィンドウといった従来のレート制限アルゴリズムは、動的トラフィックパターンやさまざまなシステム負荷に適応するのに苦労する。
本稿では,システムスループットとサービスレイテンシを動的にバランスする深層強化学習に基づく適応率制限戦略を提案する。
論文 参考訳(メタデータ) (2025-11-05T08:22:42Z) - Enhancing reliability in AI inference services: An empirical study on real production incidents [6.549475714716768]
本稿では,大規模言語モデル(LLM)推論インシデントに関する最初のプロバイダ間,実践ベースの分析手法を提案する。
我々は1年間の運用経験に基づく分類と方法論を開発し、156件の高重度事象を検証した。
本研究は,推論操作の系統的,経験的基礎解析が,大規模で信頼性が高く,コスト効率のよいLLMサービスを実現する方法を示す。
論文 参考訳(メタデータ) (2025-10-17T23:16:29Z) - OneRec-V2 Technical Report [93.91714323473678]
OneRecは、自己回帰生成タスクとしてレコメンデーションを再構築し、高いモデルFLOPの利用を達成する。
Lazy Decoder-Only Architecture: エンコーダボトルネックを排除し、全体の計算を94%削減し、トレーニングリソースを90%削減する。
現実のユーザインタラクションによる優先度調整: ユーザの好みに合うように、継続意識のリワードシェイピングとアダプティブ比クリッピングを組み込む。
論文 参考訳(メタデータ) (2025-08-28T15:29:51Z) - Evolving LLMs' Self-Refinement Capability via Synergistic Training-Inference Optimization [53.93621974137829]
自己精製(Self-Refinement)とは、モデルが自身のレスポンスを改訂し、改善された出力を生成する能力を指す。
EVOLVEは、反復的なトレーニングを通じて自己精製の進化を導き、追跡するためのフレームワークである。
固有モデル能力のより広範な自己改善を実現するために自己改善を活用する可能性を実証する。
論文 参考訳(メタデータ) (2025-02-08T15:21:55Z) - System Resilience through Health Monitoring and Reconfiguration [56.448036299746285]
人為的なシステムのレジリエンスを、予期せぬ事象に対して向上させるためのエンドツーエンドのフレームワークを実証する。
このフレームワークは物理ベースのデジタルツインモデルと,リアルタイム故障診断,予後,再構成を行う3つのモジュールに基づいている。
論文 参考訳(メタデータ) (2022-08-30T20:16:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。