論文の概要: Dynamic Reward Scaling for Multivariate Time Series Anomaly Detection: A VAE-Enhanced Reinforcement Learning Approach
- arxiv url: http://arxiv.org/abs/2511.12351v1
- Date: Sat, 15 Nov 2025 20:36:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:23.985255
- Title: Dynamic Reward Scaling for Multivariate Time Series Anomaly Detection: A VAE-Enhanced Reinforcement Learning Approach
- Title(参考訳): 多変量時系列異常検出のための動的リワードスケーリング:VAE強化強化強化学習アプローチ
- Authors: Bahareh Golchin, Banafsheh Rekabdar,
- Abstract要約: 本稿では、変分オートエンコーダ(VAE)、LSTMベースのディープQネットワーク(DQN)、動的報酬形成、これらの問題に一元化学習フレームワークで対処するためのアクティブ学習モジュールを組み合わせた深部強化学習フレームワークを提案する。
- 参考スコア(独自算出の注目度): 1.332091725929965
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Detecting anomalies in multivariate time series is essential for monitoring complex industrial systems, where high dimensionality, limited labeled data, and subtle dependencies between sensors cause significant challenges. This paper presents a deep reinforcement learning framework that combines a Variational Autoencoder (VAE), an LSTM-based Deep Q-Network (DQN), dynamic reward shaping, and an active learning module to address these issues in a unified learning framework. The main contribution is the implementation of Dynamic Reward Scaling for Multivariate Time Series Anomaly Detection (DRSMT), which demonstrates how each component enhances the detection process. The VAE captures compact latent representations and reduces noise. The DQN enables adaptive, sequential anomaly classification, and the dynamic reward shaping balances exploration and exploitation during training by adjusting the importance of reconstruction and classification signals. In addition, active learning identifies the most uncertain samples for labeling, reducing the need for extensive manual supervision. Experiments on two multivariate benchmarks, namely Server Machine Dataset (SMD) and Water Distribution Testbed (WADI), show that the proposed method outperforms existing baselines in F1-score and AU-PR. These results highlight the effectiveness of combining generative modeling, reinforcement learning, and selective supervision for accurate and scalable anomaly detection in real-world multivariate systems.
- Abstract(参考訳): 多変量時系列における異常の検出は、高次元性、ラベル付きデータ制限、センサ間の微妙な依存関係が大きな課題を引き起こす複雑な産業システムを監視するために不可欠である。
本稿では、変分オートエンコーダ(VAE)、LSTMベースのディープQネットワーク(DQN)、動的報酬形成、これらの問題に一元化学習フレームワークで対処するためのアクティブ学習モジュールを組み合わせた深部強化学習フレームワークを提案する。
主な貢献はマルチ変数時系列異常検出(DRSMT)のための動的リワードスケーリング(Dynamic Reward Scaling)の実装である。
VAEはコンパクトな潜在表現をキャプチャし、ノイズを低減する。
DQNは適応的、シーケンシャルな異常分類を可能にし、動的報酬形成は、再構成と分類信号の重要性を調整することで、トレーニング中の探索と活用のバランスをとる。
さらに、アクティブラーニングは、ラベル付けの最も不確実なサンプルを特定し、広範囲な手作業による監督の必要性を減らす。
Server Machine Dataset (SMD) と Water Distribution Testbed (WADI) という2つの多変量ベンチマーク実験により、提案手法はF1スコアとAU-PRの既存のベースラインよりも優れていることが示された。
これらの結果は,実世界の多変量系における高精度かつスケーラブルな異常検出のための生成モデル,強化学習,選択的監視の組み合わせの有効性を強調した。
関連論文リスト
- Improving Deepfake Detection with Reinforcement Learning-Based Adaptive Data Augmentation [60.04281435591454]
CRDA(Curriculum Reinforcement-Learning Data Augmentation)は、マルチドメインの偽造機能を段階的にマスターするための検出器を導く新しいフレームワークである。
私たちのアプローチの中心は、強化学習と因果推論を統合することです。
提案手法は検出器の一般化性を大幅に向上し,複数のクロスドメインデータセット間でSOTA法より優れている。
論文 参考訳(メタデータ) (2025-11-10T12:45:52Z) - Source-Free Object Detection with Detection Transformer [59.33653163035064]
Source-Free Object Detection (SFOD) は、ソースデータにアクセスすることなく、ソースドメインから教師なしのターゲットドメインへの知識転送を可能にする。
ほとんどの既存のSFODアプローチは、より高速なR-CNNのような従来のオブジェクト検出(OD)モデルに限られるか、新しいODアーキテクチャ、特に検出変換器(DETR)に適合しない一般的なソリューションとして設計されている。
本稿では,DTRのクエリ中心の機能強化を特化して設計された新しいSFODフレームワークであるFeature Reweighting ANd Contrastive Learning NetworK(FRANCK)を紹介する。
論文 参考訳(メタデータ) (2025-10-13T07:35:04Z) - Multi-Task Equation Discovery [0.0]
複数のデータセットにまたがる同時パラメータ識別にはマルチタスク学習フレームワークを用いる。
MTL-RVMはタスク間での情報を組み合わせて、弱い、中程度の興奮したデータセットのパラメータリカバリを改善した。
これらの結果は,マルチタスクベイズ推論が過剰適合を緩和し,方程式発見の一般化を促進することを示唆している。
論文 参考訳(メタデータ) (2025-09-29T18:56:40Z) - On Multi-entity, Multivariate Quickest Change Point Detection [2.0369245689839817]
変更点検出(CPD)は、従来のセンシング手法が実現不可能なクラウドモニタリングのアプリケーションによって動機付けられている。
本稿では,正常度からの個人偏差(IDfN)の概念を紹介し,正常度を訓練した再構成エラーベースのオートエンコーダを用いて計算する。
平均値、分散値、カーネル密度推定値(KDE)を用いてこれらの個々の偏差を集約し、システムワイド異常スコア(SWAS)を生成する。
我々の教師なしアプローチはラベル付きデータや特徴抽出の必要性を排除し、ストリーミング入力のリアルタイム操作を可能にします。
論文 参考訳(メタデータ) (2025-09-22T18:35:24Z) - DRTA: Dynamic Reward Scaling for Reinforcement Learning in Time Series Anomaly Detection [7.185726339205792]
時系列データの異常検出は、ファイナンス、ヘルスケア、センサーネットワーク、産業監視におけるアプリケーションにとって重要である。
本稿では,動的報酬形成,変分オートエンコーダ(VAE),DRTAと呼ばれるアクティブラーニングを統合した強化学習ベースのフレームワークを提案する。
提案手法は,VAEに基づく再構成誤りと分類報酬の効果を動的にスケーリングすることにより,探索と利用のバランスをとる適応報酬機構を用いる。
論文 参考訳(メタデータ) (2025-08-25T20:39:49Z) - Quantization Meets dLLMs: A Systematic Study of Post-training Quantization for Diffusion LLMs [78.09559830840595]
本稿では拡散に基づく言語モデルの定量化に関する最初の体系的研究について述べる。
異常に大きなアクティベーション値によって特徴付けられるアクティベーションアウトリーチの存在を同定する。
我々は最先端のPTQ手法を実装し、包括的な評価を行う。
論文 参考訳(メタデータ) (2025-08-20T17:59:51Z) - MMA-DFER: MultiModal Adaptation of unimodal models for Dynamic Facial Expression Recognition in-the-wild [81.32127423981426]
実世界のアプリケーションでは,音声およびビデオデータに基づくマルチモーダル感情認識が重要である。
近年の手法は、強力なマルチモーダルエンコーダの事前学習に自己教師付き学習(SSL)の進歩を活用することに重点を置いている。
SSL-pre-trained disimodal encoders を用いて,この問題に対する異なる視点とマルチモーダル DFER の性能向上について検討する。
論文 参考訳(メタデータ) (2024-04-13T13:39:26Z) - Coupled Attention Networks for Multivariate Time Series Anomaly
Detection [10.620044922371177]
多変量時系列データにおける異常検出のためのアテンションベースニューラルネットワークフレームワーク(CAN)を提案する。
センサ間の関係と時間的依存関係をキャプチャするために、グローバルローカルグラフに基づく畳み込みニューラルネットワークを時間的自己認識モジュールに統合する。
論文 参考訳(メタデータ) (2023-06-12T13:42:56Z) - A Generic Shared Attention Mechanism for Various Backbone Neural Networks [53.36677373145012]
自己注意モジュール(SAM)は、異なる層にまたがる強い相関した注意マップを生成する。
Dense-and-Implicit Attention (DIA)はSAMをレイヤ間で共有し、長期間のメモリモジュールを使用する。
我々のシンプルで効果的なDIAは、様々なネットワークバックボーンを一貫して拡張できます。
論文 参考訳(メタデータ) (2022-10-27T13:24:08Z) - Adaptive Discrete Communication Bottlenecks with Dynamic Vector
Quantization [76.68866368409216]
入力に条件付けされた離散化の厳密度を動的に選択する学習を提案する。
コミュニケーションボトルネックの動的に変化する厳密さは、視覚的推論や強化学習タスクにおけるモデル性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2022-02-02T23:54:26Z) - An Attention-based ConvLSTM Autoencoder with Dynamic Thresholding for
Unsupervised Anomaly Detection in Multivariate Time Series [2.9685635948299995]
本稿では,異常検出と診断を行うための動的閾値保持(ACLAE-DT)フレームワークを用いた非教師付き注意型畳み込み長短期記憶(ConvLSTM)オートエンコーダを提案する。
フレームワークは、システムステータスを特徴付ける機能イメージを構築する前に、データの事前処理と強化から始まります。
構築した特徴画像は注意に基づくConvLSTMオートエンコーダに入力される。
その後、再構成エラーを計算し、統計に基づく動的しきい値決定機構により異常を検出し診断する。
論文 参考訳(メタデータ) (2022-01-23T04:01:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。