論文の概要: Monitoring and Anomaly Detection Actor-Critic Based Controlled Sensing
- arxiv url: http://arxiv.org/abs/2201.00879v1
- Date: Mon, 3 Jan 2022 20:59:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-05 14:16:07.974072
- Title: Monitoring and Anomaly Detection Actor-Critic Based Controlled Sensing
- Title(参考訳): アクタ-クリティックベース制御センシングの監視と異常検出
- Authors: Geethu Joseph, M. Cenk Gursoy, Pramod K. Varshney
- Abstract要約: 我々は、バイナリプロセスの集合を監視し、それらの中の異常数がしきい値を超えた場合に警告を生成する問題に対処する。
このため、意思決定者はプロセスのサブセットを選択して調査し、それらの状態のノイズの多い推定値を取得する。
後続確率を用いてマルコフ決定プロセスを構築し,それを解決する。
- 参考スコア(独自算出の注目度): 37.78306297797
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We address the problem of monitoring a set of binary stochastic processes and
generating an alert when the number of anomalies among them exceeds a
threshold. For this, the decision-maker selects and probes a subset of the
processes to obtain noisy estimates of their states (normal or anomalous).
Based on the received observations, the decisionmaker first determines whether
to declare that the number of anomalies has exceeded the threshold or to
continue taking observations. When the decision is to continue, it then decides
whether to collect observations at the next time instant or defer it to a later
time. If it chooses to collect observations, it further determines the subset
of processes to be probed. To devise this three-step sequential decision-making
process, we use a Bayesian formulation wherein we learn the posterior
probability on the states of the processes. Using the posterior probability, we
construct a Markov decision process and solve it using deep actor-critic
reinforcement learning. Via numerical experiments, we demonstrate the superior
performance of our algorithm compared to the traditional model-based
algorithms.
- Abstract(参考訳): 本稿では,連立確率過程群を監視し,それらの異常数がしきい値を超えると警告を発する問題に対処する。
このため、意思決定者はプロセスのサブセットを選択して調査し、その状態(通常または異常)のノイズの見積もりを得る。
受信した観測に基づいて、意思決定者はまず、異常数が閾値を超えたことを宣言するか、観察を続けるかを判断する。
決定が継続されると、次のタイミングで観測を収集するか、後で延期するかが決定される。
観測収集を選択した場合には、さらに調査対象のプロセスのサブセットを決定する。
この3段階の逐次決定過程を考案するために、ベイズ式を用いて、プロセスの状態に関する後続確率を学習する。
後方確率を用いてマルコフ決定過程を構築し,深層アクタ-クリティック強化学習を用いて解く。
数値実験により,従来のモデルに基づくアルゴリズムと比較して,アルゴリズムの優れた性能を示す。
関連論文リスト
- Anomaly Detection via Learning-Based Sequential Controlled Sensing [25.282033825977827]
本稿では,学習に基づく制御センシングによるバイナリプロセス間の異常検出の問題に対処する。
異常を識別するために、意思決定エージェントは、各時点でプロセスのサブセットを観察することができる。
我々の目標は、どの過程を観察するかを動的に決定するシーケンシャルな選択ポリシーを設計することである。
論文 参考訳(メタデータ) (2023-11-30T07:49:33Z) - Shortcomings of Top-Down Randomization-Based Sanity Checks for
Evaluations of Deep Neural Network Explanations [67.40641255908443]
モデルランダム化に基づく正当性チェックの限界を,説明書の評価のために同定する。
トップダウンモデルランダム化は、フォワードパスアクティベーションのスケールを高い確率で保存する。
論文 参考訳(メタデータ) (2022-11-22T18:52:38Z) - Scalable and Decentralized Algorithms for Anomaly Detection via
Learning-Based Controlled Sensing [40.14838268469627]
本研究では,ある時刻に観測対象のプロセスを選択する異常検出アルゴリズムを開発した。
検出アルゴリズムの目的は、所望値を超える精度で異常を識別することである。
論文 参考訳(メタデータ) (2021-12-08T11:20:36Z) - A2Log: Attentive Augmented Log Anomaly Detection [53.06341151551106]
異常検出は、ITサービスの信頼性とサービス性にとってますます重要になる。
既存の教師なし手法は、適切な決定境界を得るために異常な例を必要とする。
我々は,異常判定と異常判定の2段階からなる教師なし異常検出手法であるA2Logを開発した。
論文 参考訳(メタデータ) (2021-09-20T13:40:21Z) - Machine Learning for Online Algorithm Selection under Censored Feedback [71.6879432974126]
オンラインアルゴリズム選択(OAS)では、アルゴリズム問題クラスのインスタンスがエージェントに次々に提示され、エージェントは、固定された候補アルゴリズムセットから、おそらく最高のアルゴリズムを迅速に選択する必要がある。
SAT(Satisfiability)のような決定問題に対して、品質は一般的にアルゴリズムのランタイムを指す。
本研究では,OASのマルチアームバンディットアルゴリズムを再検討し,この問題に対処する能力について議論する。
ランタイム指向の損失に適応し、時間的地平線に依存しない空間的・時間的複雑さを維持しながら、部分的に検閲されたデータを可能にする。
論文 参考訳(メタデータ) (2021-09-13T18:10:52Z) - Navigating to the Best Policy in Markov Decision Processes [68.8204255655161]
マルコフ決定過程における純粋探索問題について検討する。
エージェントはアクションを逐次選択し、結果のシステム軌道から可能な限り早くベストを目標とする。
論文 参考訳(メタデータ) (2021-06-05T09:16:28Z) - Anomaly Detection via Controlled Sensing and Deep Active Inference [43.07302992747749]
本稿では,与えられたプロセス群の中で異常なプロセスを見つけることを目的とした異常検出問題に対処する。
我々は,各瞬間にどの過程を探索して異常を検出するかを決定するシーケンシャルな選択アルゴリズムを開発した。
本アルゴリズムは,自由エネルギーの概念を最大化するために逐次的決定を行う一般的なフレームワークであるアクティブ推論に基づいている。
論文 参考訳(メタデータ) (2021-05-12T17:54:02Z) - A Scalable Algorithm for Anomaly Detection via Learning-Based Controlled
Sensing [37.78306297797]
本研究では,ある時刻に観測対象のプロセスを選択する異常検出アルゴリズムを開発した。
検出アルゴリズムの目的は、所望の値を超える精度で決定に到達することである。
プロセス数に指数関数的複雑性を持つこのトピックの以前の作業とは異なり、このアルゴリズムはプロセス数の両方に計算とメモリを必要とする。
論文 参考訳(メタデータ) (2021-05-12T17:46:01Z) - Anomaly Detection Under Controlled Sensing Using Actor-Critic
Reinforcement Learning [31.841289319809807]
雑音性二元センサを用いたプロセス群における異常検出の問題点を考察する。
ノーマルプロセスに対応するノイズレスセンサ測定は0であり、その処理が異常であればその測定は1である。
本稿では,検出アルゴリズムの終了時期を動的に決定する逐次センサ選択ポリシーを提案する。
論文 参考訳(メタデータ) (2020-05-26T22:53:17Z) - Active Model Estimation in Markov Decision Processes [108.46146218973189]
マルコフ決定過程(MDP)をモデル化した環境の正確なモデル学習のための効率的な探索の課題について検討する。
マルコフに基づくアルゴリズムは,本アルゴリズムと極大エントロピーアルゴリズムの両方を小サンプル方式で上回っていることを示す。
論文 参考訳(メタデータ) (2020-03-06T16:17:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。