論文の概要: Learning Recovery Strategies for Dynamic Self-healing in Reactive
Systems
- arxiv url: http://arxiv.org/abs/2401.12405v1
- Date: Mon, 22 Jan 2024 23:34:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-24 17:33:47.869762
- Title: Learning Recovery Strategies for Dynamic Self-healing in Reactive
Systems
- Title(参考訳): 反応系における動的自己修復のための学習リカバリ戦略
- Authors: Mateo Sanabria, Ivana Dusparic, Nicolas Cardozo
- Abstract要約: 自己修復システムは、既知の障害状態から回復するための事前定義された命令のセットに従うことに依存する。
本提案では,システム特性の満足度条件を規定する述語としてモニタを定義する。
我々は、強化学習に基づく手法を用いて、ユーザの修正シーケンスに基づいた回復戦略を学習する。
- 参考スコア(独自算出の注目度): 1.7218973692320518
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Self-healing systems depend on following a set of predefined instructions to
recover from a known failure state. Failure states are generally detected based
on domain specific specialized metrics. Failure fixes are applied at predefined
application hooks that are not sufficiently expressive to manage different
failure types. Self-healing is usually applied in the context of distributed
systems, where the detection of failures is constrained to communication
problems, and resolution strategies often consist of replacing complete
components. Our proposal targets complex reactive systems, defining monitors as
predicates specifying satisfiability conditions of system properties. Such
monitors are functionally expressive and can be defined at run time to detect
failure states at any execution point. Once failure states are detected, we use
a Reinforcement Learning-based technique to learn a recovery strategy based on
users' corrective sequences. Finally, to execute the learned strategies, we
extract them as COP variations that activate dynamically whenever the failure
state is detected, overwriting the base system behavior with the recovery
strategy for that state. We validate the feasibility and effectiveness of our
framework through a prototypical reactive application for tracking mouse
movements, and the DeltaIoT exemplar for self-healing systems. Our results
demonstrate that with just the definition of monitors, the system is effective
in detecting and recovering from failures between 55%-92% of the cases in the
first application, and at par with the predefined strategies in the second
application.
- Abstract(参考訳): 自己修復システムは、既知の障害状態から回復するための事前定義された命令のセットに依存する。
障害状態は一般的にドメイン固有の特別なメトリクスに基づいて検出される。
障害フィックスは、さまざまな障害タイプを管理するのに十分な表現力を持たない、事前定義されたアプリケーションフックで適用される。
自己修復は通常、障害の検出が通信の問題に制限される分散システムのコンテキストで適用され、解決戦略は完全なコンポーネントを置き換えることで構成されることが多い。
本提案では,システム特性の満足度条件を規定する述語としてモニタを定義する。
このようなモニタは関数的に表現可能で、実行時に定義して、任意の実行ポイントの障害状態を検出することができる。
障害状態が検出されると、強化学習に基づく手法を使用して、ユーザの修正シーケンスに基づいてリカバリ戦略を学習します。
最後に、学習した戦略を実行するために、障害状態が検出されたときに動的に活性化するCOP変種を抽出し、その状態の回復戦略でベースシステムの振る舞いを上書きする。
マウスの動きを追跡するprototypical reactive applicationと,自己修復システムのためのdeltaiot exemplarを用いて,このフレームワークの有効性と有効性を検証する。
その結果,モニタの定義だけでは,第1のアプリケーションにおける障害の55%-92%と,第2のアプリケーションにおける事前定義された戦略と同等の障害の検出と復旧に有効であることがわかった。
関連論文リスト
- Unpacking Failure Modes of Generative Policies: Runtime Monitoring of Consistency and Progress [31.952925824381325]
本稿では,障害検出を補完する2つのカテゴリに分割するランタイム監視フレームワークを提案する。
視覚言語モデル(VLM)を用いて、ポリシーがタスクを解決しないアクションを確実かつ一貫して行うことを検知する。
時間的一貫性検出とVLMランタイム監視を統一することにより、Sentinelは2つの検出器のみを使用する場合よりも18%の障害を検出する。
論文 参考訳(メタデータ) (2024-10-06T22:13:30Z) - Learning Prompt-Enhanced Context Features for Weakly-Supervised Video
Anomaly Detection [37.99031842449251]
弱い監督下での映像異常検出は重大な課題を呈する。
本稿では,効率的なコンテキストモデリングとセマンティック識別性の向上に焦点をあてた,弱教師付き異常検出フレームワークを提案する。
提案手法は,特定の異常なサブクラスの検出精度を大幅に向上させ,その実用的価値と有効性を裏付けるものである。
論文 参考訳(メタデータ) (2023-06-26T06:45:16Z) - Interactive System-wise Anomaly Detection [66.3766756452743]
異常検出は様々なアプリケーションにおいて基本的な役割を果たす。
既存のメソッドでは、インスタンスがデータとして容易に観察できないシステムであるシナリオを扱うのが難しい。
システム埋め込みを学習するエンコーダデコーダモジュールを含むエンドツーエンドアプローチを開発する。
論文 参考訳(メタデータ) (2023-04-21T02:20:24Z) - PULL: Reactive Log Anomaly Detection Based On Iterative PU Learning [58.85063149619348]
本稿では,推定故障時間ウィンドウに基づくリアクティブ異常検出のための反復ログ解析手法PULLを提案する。
我々の評価では、PULLは3つの異なるデータセットで10のベンチマークベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-01-25T16:34:43Z) - System Resilience through Health Monitoring and Reconfiguration [56.448036299746285]
人為的なシステムのレジリエンスを、予期せぬ事象に対して向上させるためのエンドツーエンドのフレームワークを実証する。
このフレームワークは物理ベースのデジタルツインモデルと,リアルタイム故障診断,予後,再構成を行う3つのモジュールに基づいている。
論文 参考訳(メタデータ) (2022-08-30T20:16:17Z) - Active Learning-based Isolation Forest (ALIF): Enhancing Anomaly
Detection in Decision Support Systems [2.922007656878633]
ALIFは一般的な孤立林の軽量な修正であり、他の最先端のアルゴリズムと比較して優れた性能を示した。
提案手法は,現実のシナリオでますます普及しているDSS(Decision Support System)の存在に特に注目されている。
論文 参考訳(メタデータ) (2022-07-08T14:36:38Z) - Imitating, Fast and Slow: Robust learning from demonstrations via
decision-time planning [96.72185761508668]
テストタイムでの計画(IMPLANT)は、模倣学習のための新しいメタアルゴリズムである。
IMPLANTは,標準制御環境において,ベンチマーク模倣学習手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-04-07T17:16:52Z) - Indicators of Attack Failure: Debugging and Improving Optimization of
Adversarial Examples [29.385242714424624]
機械学習モデルの頑健さを敵の例に評価することは難しい問題である。
我々は、勾配に基づく攻撃の最適化において共通の障害を明らかにするための定量的指標のセットを定義する。
実験により,現在の対向ロバスト性評価を可視化し,デバッグし,改善するために,提案した障害指標が有効であることを示す。
論文 参考訳(メタデータ) (2021-06-18T06:57:58Z) - No Need to Know Physics: Resilience of Process-based Model-free Anomaly
Detection for Industrial Control Systems [95.54151664013011]
本稿では,システムの物理的特性に反する逆スプーフ信号を生成するための新しい枠組みを提案する。
トップセキュリティカンファレンスで公表された4つの異常検知器を分析した。
論文 参考訳(メタデータ) (2020-12-07T11:02:44Z) - A Background-Agnostic Framework with Adversarial Training for Abnormal
Event Detection in Video [120.18562044084678]
近年,ビデオにおける異常事象検出は複雑なコンピュータビジョンの問題として注目されている。
通常のイベントのみを含むトレーニングビデオから学習するバックグラウンドに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-27T18:39:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。