論文の概要: Anomaly Detection Under Controlled Sensing Using Actor-Critic
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2006.01044v1
- Date: Tue, 26 May 2020 22:53:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 00:49:54.270301
- Title: Anomaly Detection Under Controlled Sensing Using Actor-Critic
Reinforcement Learning
- Title(参考訳): Actor-Critic Reinforcement Learning を用いた制御センシングによる異常検出
- Authors: Geethu Joseph, M. Cenk Gursoy, Pramod K. Varshney
- Abstract要約: 雑音性二元センサを用いたプロセス群における異常検出の問題点を考察する。
ノーマルプロセスに対応するノイズレスセンサ測定は0であり、その処理が異常であればその測定は1である。
本稿では,検出アルゴリズムの終了時期を動的に決定する逐次センサ選択ポリシーを提案する。
- 参考スコア(独自算出の注目度): 31.841289319809807
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the problem of detecting anomalies among a given set of processes
using their noisy binary sensor measurements. The noiseless sensor measurement
corresponding to a normal process is 0, and the measurement is 1 if the process
is anomalous. The decision-making algorithm is assumed to have no knowledge of
the number of anomalous processes. The algorithm is allowed to choose a subset
of the sensors at each time instant until the confidence level on the decision
exceeds the desired value. Our objective is to design a sequential sensor
selection policy that dynamically determines which processes to observe at each
time and when to terminate the detection algorithm. The selection policy is
designed such that the anomalous processes are detected with the desired
confidence level while incurring minimum cost which comprises the delay in
detection and the cost of sensing. We cast this problem as a sequential
hypothesis testing problem within the framework of Markov decision processes,
and solve it using the actor-critic deep reinforcement learning algorithm. This
deep neural network-based algorithm offers a low complexity solution with good
detection accuracy. We also study the effect of statistical dependence between
the processes on the algorithm performance. Through numerical experiments, we
show that our algorithm is able to adapt to any unknown statistical dependence
pattern of the processes.
- Abstract(参考訳): 本研究では,各プロセス群における異常検出の問題について,ノイズのある2値センサを用いて検討する。
正常なプロセスに対応する無ノイズセンサの測定は0であり、そのプロセスが異常であれば1である。
決定アルゴリズムは異常なプロセスの数について知識を持たないと仮定される。
このアルゴリズムは、決定に対する信頼レベルが所望値を超えるまで、各タイミングでセンサーのサブセットを選択することができる。
本研究の目的は,検出アルゴリズムの終了時刻と終了時刻を動的に決定するシーケンシャルなセンサ選択ポリシを設計することである。
選択方針は、検出の遅れとセンシングのコストを含む最小コストを伴いながら、異常なプロセスが所望の信頼性レベルで検出されるように設計されている。
我々はこの問題をマルコフ決定プロセスの枠組みにおける逐次仮説テスト問題とみなし、アクター批判的深層強化学習アルゴリズムを用いて解決した。
このディープニューラルネットワークベースのアルゴリズムは、高い検出精度で低複雑性のソリューションを提供する。
また,プロセス間の統計的依存がアルゴリズムの性能に及ぼす影響についても検討する。
数値実験により,本アルゴリズムはプロセスの未知の統計的依存パターンに適応可能であることを示す。
関連論文リスト
- Bagged Regularized $k$-Distances for Anomaly Detection [9.899763598214122]
BRDAD (Bagged regularized $k$-distances for Anomaly Detection) と呼ばれる距離に基づく新しいアルゴリズムを提案する。
我々のBRDADアルゴリズムは、重み付けされた密度推定のための$k$-distances(BWDDE)の実証的リスクの有限標本境界を最小化して重みを選択する。
理論的には,我々のアルゴリズムに対するAUCの高速収束率を確立し,バッグング手法が計算複雑性を著しく減少させることを示す。
論文 参考訳(メタデータ) (2023-12-02T07:00:46Z) - Anomaly Detection via Learning-Based Sequential Controlled Sensing [25.282033825977827]
本稿では,学習に基づく制御センシングによるバイナリプロセス間の異常検出の問題に対処する。
異常を識別するために、意思決定エージェントは、各時点でプロセスのサブセットを観察することができる。
我々の目標は、どの過程を観察するかを動的に決定するシーケンシャルな選択ポリシーを設計することである。
論文 参考訳(メタデータ) (2023-11-30T07:49:33Z) - Scalable and Decentralized Algorithms for Anomaly Detection via
Learning-Based Controlled Sensing [40.14838268469627]
本研究では,ある時刻に観測対象のプロセスを選択する異常検出アルゴリズムを開発した。
検出アルゴリズムの目的は、所望値を超える精度で異常を識別することである。
論文 参考訳(メタデータ) (2021-12-08T11:20:36Z) - Machine Learning for Online Algorithm Selection under Censored Feedback [71.6879432974126]
オンラインアルゴリズム選択(OAS)では、アルゴリズム問題クラスのインスタンスがエージェントに次々に提示され、エージェントは、固定された候補アルゴリズムセットから、おそらく最高のアルゴリズムを迅速に選択する必要がある。
SAT(Satisfiability)のような決定問題に対して、品質は一般的にアルゴリズムのランタイムを指す。
本研究では,OASのマルチアームバンディットアルゴリズムを再検討し,この問題に対処する能力について議論する。
ランタイム指向の損失に適応し、時間的地平線に依存しない空間的・時間的複雑さを維持しながら、部分的に検閲されたデータを可能にする。
論文 参考訳(メタデータ) (2021-09-13T18:10:52Z) - Anomaly Detection via Controlled Sensing and Deep Active Inference [43.07302992747749]
本稿では,与えられたプロセス群の中で異常なプロセスを見つけることを目的とした異常検出問題に対処する。
我々は,各瞬間にどの過程を探索して異常を検出するかを決定するシーケンシャルな選択アルゴリズムを開発した。
本アルゴリズムは,自由エネルギーの概念を最大化するために逐次的決定を行う一般的なフレームワークであるアクティブ推論に基づいている。
論文 参考訳(メタデータ) (2021-05-12T17:54:02Z) - A Scalable Algorithm for Anomaly Detection via Learning-Based Controlled
Sensing [37.78306297797]
本研究では,ある時刻に観測対象のプロセスを選択する異常検出アルゴリズムを開発した。
検出アルゴリズムの目的は、所望の値を超える精度で決定に到達することである。
プロセス数に指数関数的複雑性を持つこのトピックの以前の作業とは異なり、このアルゴリズムはプロセス数の両方に計算とメモリを必要とする。
論文 参考訳(メタデータ) (2021-05-12T17:46:01Z) - Optimal Sequential Detection of Signals with Unknown Appearance and
Disappearance Points in Time [64.26593350748401]
本論文は、変化の期間が有限で未知であると仮定して、逐次的な変化点検出問題に対処する。
我々は、所定の時間(または空間)ウィンドウにおける最小検出確率を最大化する信頼性の高い最大変更検出基準に焦点を当てる。
FMAアルゴリズムは、光学画像中の衛星のかすかなストリークを検出するために応用される。
論文 参考訳(メタデータ) (2021-02-02T04:58:57Z) - Learned Block Iterative Shrinkage Thresholding Algorithm for
Photothermal Super Resolution Imaging [52.42007686600479]
深層ニューラルネットワークに展開する反復アルゴリズムを用いて,学習したブロックスパース最適化手法を提案する。
本稿では、正規化パラメータの選択を学ぶことができる学習ブロック反復収縮しきい値アルゴリズムを使用することの利点を示す。
論文 参考訳(メタデータ) (2020-12-07T09:27:16Z) - Run2Survive: A Decision-theoretic Approach to Algorithm Selection based
on Survival Analysis [75.64261155172856]
生存分析(SA)は、自然に検閲されたデータをサポートし、アルゴリズムランタイムの分散モデルを学習するためにそのようなデータを使用する適切な方法を提供する。
我々は、アルゴリズム選択に対する洗練された決定論的アプローチの基礎として、そのようなモデルを活用し、Run2Surviveを疑う。
標準ベンチマークASlibによる広範な実験では、我々のアプローチは競争力が高く、多くの場合、最先端のASアプローチよりも優れていることが示されている。
論文 参考訳(メタデータ) (2020-07-06T15:20:17Z) - Active Model Estimation in Markov Decision Processes [108.46146218973189]
マルコフ決定過程(MDP)をモデル化した環境の正確なモデル学習のための効率的な探索の課題について検討する。
マルコフに基づくアルゴリズムは,本アルゴリズムと極大エントロピーアルゴリズムの両方を小サンプル方式で上回っていることを示す。
論文 参考訳(メタデータ) (2020-03-06T16:17:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。