論文の概要: Anomaly Detection via Learning-Based Sequential Controlled Sensing
- arxiv url: http://arxiv.org/abs/2312.00088v1
- Date: Thu, 30 Nov 2023 07:49:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-04 16:58:55.917907
- Title: Anomaly Detection via Learning-Based Sequential Controlled Sensing
- Title(参考訳): 学習型シーケンス制御センシングによる異常検出
- Authors: Geethu Joseph, Chen Zhong, M. Cenk Gursoy, Senem Velipasalar, and
Pramod K. Varshney
- Abstract要約: 本稿では,学習に基づく制御センシングによるバイナリプロセス間の異常検出の問題に対処する。
異常を識別するために、意思決定エージェントは、各時点でプロセスのサブセットを観察することができる。
我々の目標は、どの過程を観察するかを動的に決定するシーケンシャルな選択ポリシーを設計することである。
- 参考スコア(独自算出の注目度): 25.282033825977827
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we address the problem of detecting anomalies among a given
set of binary processes via learning-based controlled sensing. Each process is
parameterized by a binary random variable indicating whether the process is
anomalous. To identify the anomalies, the decision-making agent is allowed to
observe a subset of the processes at each time instant. Also, probing each
process has an associated cost. Our objective is to design a sequential
selection policy that dynamically determines which processes to observe at each
time with the goal to minimize the delay in making the decision and the total
sensing cost. We cast this problem as a sequential hypothesis testing problem
within the framework of Markov decision processes. This formulation utilizes
both a Bayesian log-likelihood ratio-based reward and an entropy-based reward.
The problem is then solved using two approaches: 1) a deep reinforcement
learning-based approach where we design both deep Q-learning and policy
gradient actor-critic algorithms; and 2) a deep active inference-based
approach. Using numerical experiments, we demonstrate the efficacy of our
algorithms and show that our algorithms adapt to any unknown statistical
dependence pattern of the processes.
- Abstract(参考訳): 本稿では,学習に基づく制御センシングにより,与えられたバイナリプロセスの異常を検出する問題に対処する。
各プロセスは、そのプロセスが異常かどうかを示すバイナリランダム変数によってパラメータ化される。
異常を識別するために、意思決定エージェントは、各時点でプロセスのサブセットを観察することができる。
また、各プロセスの検査には関連するコストが伴う。
本研究の目的は,決定の遅れと総センサコストを最小化するために,各タイミングで観測すべきプロセスを動的に決定するシーケンシャルな選択ポリシーを設計することである。
我々はこの問題をマルコフ決定プロセスの枠組みにおける逐次仮説テスト問題とみなした。
この定式化は、ベイジアン対数類似度に基づく報酬とエントロピーに基づく報酬の両方を利用する。
問題は2つのアプローチで解決される。
1)ディープQ学習とポリシー勾配アクター批判アルゴリズムの両方を設計するディープ強化学習に基づくアプローチ
2) 深い活動的推論に基づくアプローチ。
数値実験を用いてアルゴリズムの有効性を実証し,アルゴリズムが未知の統計的依存性パターンに適応することを示す。
関連論文リスト
- Provably Efficient UCB-type Algorithms For Learning Predictive State
Representations [55.00359893021461]
逐次決定問題は、予測状態表現(PSR)によってモデル化された低ランク構造が認められる場合、統計的に学習可能である
本稿では,推定モデルと実モデル間の全変動距離を上限とする新しいボーナス項を特徴とする,PSRに対する最初のUCB型アプローチを提案する。
PSRに対する既存のアプローチとは対照的に、UCB型アルゴリズムは計算的トラクタビリティ、最優先の準最適ポリシー、モデルの精度が保証される。
論文 参考訳(メタデータ) (2023-07-01T18:35:21Z) - Interactive System-wise Anomaly Detection [66.3766756452743]
異常検出は様々なアプリケーションにおいて基本的な役割を果たす。
既存のメソッドでは、インスタンスがデータとして容易に観察できないシステムであるシナリオを扱うのが難しい。
システム埋め込みを学習するエンコーダデコーダモジュールを含むエンドツーエンドアプローチを開発する。
論文 参考訳(メタデータ) (2023-04-21T02:20:24Z) - Temporal Detection of Anomalies via Actor-Critic Based Controlled
Sensing [31.841289319809807]
我々は、バイナリプロセスの集合を監視し、それらの中の異常数がしきい値を超えた場合に警告を生成する問題に対処する。
このため、意思決定者はプロセスのサブセットを選択して調査し、それらの状態のノイズの多い推定値を取得する。
後続確率を用いてマルコフ決定プロセスを構築し,それを解決する。
論文 参考訳(メタデータ) (2022-01-03T20:59:40Z) - Scalable and Decentralized Algorithms for Anomaly Detection via
Learning-Based Controlled Sensing [40.14838268469627]
本研究では,ある時刻に観測対象のプロセスを選択する異常検出アルゴリズムを開発した。
検出アルゴリズムの目的は、所望値を超える精度で異常を識別することである。
論文 参考訳(メタデータ) (2021-12-08T11:20:36Z) - Anomaly Detection via Controlled Sensing and Deep Active Inference [43.07302992747749]
本稿では,与えられたプロセス群の中で異常なプロセスを見つけることを目的とした異常検出問題に対処する。
我々は,各瞬間にどの過程を探索して異常を検出するかを決定するシーケンシャルな選択アルゴリズムを開発した。
本アルゴリズムは,自由エネルギーの概念を最大化するために逐次的決定を行う一般的なフレームワークであるアクティブ推論に基づいている。
論文 参考訳(メタデータ) (2021-05-12T17:54:02Z) - A Scalable Algorithm for Anomaly Detection via Learning-Based Controlled
Sensing [37.78306297797]
本研究では,ある時刻に観測対象のプロセスを選択する異常検出アルゴリズムを開発した。
検出アルゴリズムの目的は、所望の値を超える精度で決定に到達することである。
プロセス数に指数関数的複雑性を持つこのトピックの以前の作業とは異なり、このアルゴリズムはプロセス数の両方に計算とメモリを必要とする。
論文 参考訳(メタデータ) (2021-05-12T17:46:01Z) - Adaptive Sampling for Best Policy Identification in Markov Decision
Processes [79.4957965474334]
本稿では,学習者が生成モデルにアクセスできる場合の,割引マルコフ決定(MDP)における最良の政治的識別の問題について検討する。
最先端アルゴリズムの利点を論じ、解説する。
論文 参考訳(メタデータ) (2020-09-28T15:22:24Z) - Run2Survive: A Decision-theoretic Approach to Algorithm Selection based
on Survival Analysis [75.64261155172856]
生存分析(SA)は、自然に検閲されたデータをサポートし、アルゴリズムランタイムの分散モデルを学習するためにそのようなデータを使用する適切な方法を提供する。
我々は、アルゴリズム選択に対する洗練された決定論的アプローチの基礎として、そのようなモデルを活用し、Run2Surviveを疑う。
標準ベンチマークASlibによる広範な実験では、我々のアプローチは競争力が高く、多くの場合、最先端のASアプローチよりも優れていることが示されている。
論文 参考訳(メタデータ) (2020-07-06T15:20:17Z) - Anomaly Detection Under Controlled Sensing Using Actor-Critic
Reinforcement Learning [31.841289319809807]
雑音性二元センサを用いたプロセス群における異常検出の問題点を考察する。
ノーマルプロセスに対応するノイズレスセンサ測定は0であり、その処理が異常であればその測定は1である。
本稿では,検出アルゴリズムの終了時期を動的に決定する逐次センサ選択ポリシーを提案する。
論文 参考訳(メタデータ) (2020-05-26T22:53:17Z) - Active Model Estimation in Markov Decision Processes [108.46146218973189]
マルコフ決定過程(MDP)をモデル化した環境の正確なモデル学習のための効率的な探索の課題について検討する。
マルコフに基づくアルゴリズムは,本アルゴリズムと極大エントロピーアルゴリズムの両方を小サンプル方式で上回っていることを示す。
論文 参考訳(メタデータ) (2020-03-06T16:17:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。