論文の概要: DRTA: Dynamic Reward Scaling for Reinforcement Learning in Time Series Anomaly Detection
- arxiv url: http://arxiv.org/abs/2508.18474v1
- Date: Mon, 25 Aug 2025 20:39:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-27 17:42:38.588727
- Title: DRTA: Dynamic Reward Scaling for Reinforcement Learning in Time Series Anomaly Detection
- Title(参考訳): DRTA:時系列異常検出における強化学習のための動的リワードスケーリング
- Authors: Bahareh Golchin, Banafsheh Rekabdar, Kunpeng Liu,
- Abstract要約: 時系列データの異常検出は、ファイナンス、ヘルスケア、センサーネットワーク、産業監視におけるアプリケーションにとって重要である。
本稿では,動的報酬形成,変分オートエンコーダ(VAE),DRTAと呼ばれるアクティブラーニングを統合した強化学習ベースのフレームワークを提案する。
提案手法は,VAEに基づく再構成誤りと分類報酬の効果を動的にスケーリングすることにより,探索と利用のバランスをとる適応報酬機構を用いる。
- 参考スコア(独自算出の注目度): 7.185726339205792
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anomaly detection in time series data is important for applications in finance, healthcare, sensor networks, and industrial monitoring. Traditional methods usually struggle with limited labeled data, high false-positive rates, and difficulty generalizing to novel anomaly types. To overcome these challenges, we propose a reinforcement learning-based framework that integrates dynamic reward shaping, Variational Autoencoder (VAE), and active learning, called DRTA. Our method uses an adaptive reward mechanism that balances exploration and exploitation by dynamically scaling the effect of VAE-based reconstruction error and classification rewards. This approach enables the agent to detect anomalies effectively in low-label systems while maintaining high precision and recall. Our experimental results on the Yahoo A1 and Yahoo A2 benchmark datasets demonstrate that the proposed method consistently outperforms state-of-the-art unsupervised and semi-supervised approaches. These findings show that our framework is a scalable and efficient solution for real-world anomaly detection tasks.
- Abstract(参考訳): 時系列データの異常検出は、ファイナンス、ヘルスケア、センサーネットワーク、産業監視におけるアプリケーションにとって重要である。
従来の手法は、制限付きラベル付きデータ、高い偽陽性率、新しい異常タイプへの一般化の難しさに苦しむ。
これらの課題を克服するために、動的報酬形成、変分自動符号化(VAE)、DRTAと呼ばれるアクティブラーニングを統合した強化学習ベースのフレームワークを提案する。
提案手法は,VAEに基づく再構成誤りと分類報酬の効果を動的にスケーリングすることにより,探索と利用のバランスをとる適応報酬機構を用いる。
このアプローチにより、エージェントは高い精度とリコールを維持しながら、低ラベルシステムにおける異常を効果的に検出できる。
Yahoo A1 と Yahoo A2 ベンチマークのベンチマーク実験の結果,提案手法は最先端の教師なしおよび半教師なしの手法より一貫して優れていることが示された。
これらの結果から,我々のフレームワークは実世界の異常検出タスクに対して,スケーラブルで効率的なソリューションであることがわかった。
関連論文リスト
- Refining Decision Boundaries In Anomaly Detection Using Similarity Search Within the Feature Space [3.3202103799131795]
SDA2E(Sparse Dual Adversarial Attention-based AutoEncoder)を導入する。
本稿では,意思決定境界を効率的に洗練するための3つの新しい戦略を統合した類似性誘導型アクティブラーニングフレームワークを提案する。
SDA2Eは、複数のDARPAトランスペアレントコンピューティングシナリオを含む52の不均衡データセットにわたって広範囲に評価し、15の最先端の異常検出手法と比較した。
論文 参考訳(メタデータ) (2026-02-02T23:55:08Z) - LLM-Enhanced Reinforcement Learning for Time Series Anomaly Detection [1.1852406625172216]
時系列異常検出は、しばしばスパースラベル、複雑な時間パターン、高価な専門家アノテーションに悩まされる。
本稿では,LL(Reinforcement Learning),VAE(Variational Autoencoder)の強化された動的報酬スケーリング,ラベル伝搬によるアクティブラーニングを併用した,LLM(Large Language Model)に基づく報酬形成機能の統合フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-05T19:33:30Z) - Dynamic Reward Scaling for Multivariate Time Series Anomaly Detection: A VAE-Enhanced Reinforcement Learning Approach [1.332091725929965]
本稿では、変分オートエンコーダ(VAE)、LSTMベースのディープQネットワーク(DQN)、動的報酬形成、これらの問題に一元化学習フレームワークで対処するためのアクティブ学習モジュールを組み合わせた深部強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-15T20:36:20Z) - Transformer-Based Indirect Structural Health Monitoring of Rail Infrastructure with Attention-Driven Detection and Localization of Transient Defects [1.1782896991259]
我々は,段階的に複雑な課題に対してモデルロバスト性を評価するために,漸進的な合成データベンチマークを導入する。
提案するアテンション・フォーカス変換器とともに,複数の教師なしモデルを評価する。
提案モデルでは,提案手法の精度は最先端の解に匹敵するが,推論速度は向上する。
論文 参考訳(メタデータ) (2025-10-08T23:01:53Z) - FreeGAD: A Training-Free yet Effective Approach for Graph Anomaly Detection [54.576802512108685]
Graph Anomaly Detection (GAD)は、グラフ内の多数から逸脱するノードを特定することを目的としている。
既存のアプローチは、複雑でリソース集約的なトレーニングプロセスのために、高デプロイメントコストとスケーラビリティの不足に悩まされることが多い。
新たなGAD法であるFreeGADを提案する。
論文 参考訳(メタデータ) (2025-08-14T12:37:20Z) - RoHOI: Robustness Benchmark for Human-Object Interaction Detection [84.78366452133514]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。
HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。
我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文 参考訳(メタデータ) (2025-07-12T01:58:04Z) - Reliably detecting model failures in deployment without labels [10.006585036887929]
本稿では,デプロイ後劣化(PDD)モニタリングの問題点を定式化し,対処する。
本稿では,予測モデルの相違に基づく,実用的で効率的なモニタリングアルゴリズムD3Mを提案する。
標準ベンチマークと実世界の大規模内科データセットによる実証的な結果から,フレームワークの有効性が示された。
論文 参考訳(メタデータ) (2025-06-05T13:56:18Z) - ADT: Agent-based Dynamic Thresholding for Anomaly Detection [4.356615197661274]
本稿では,エージェントベースの動的しきい値処理(ADT)フレームワークを提案する。
本研究では,自動エンコーダを用いて特徴表現を取得し,複雑な入力データに対する異常スコアを生成する。
ADTはオートエンコーダの異常スコアを利用して閾値を適応的に調整することができる。
論文 参考訳(メタデータ) (2023-12-03T19:07:30Z) - PREM: A Simple Yet Effective Approach for Node-Level Graph Anomaly
Detection [65.24854366973794]
ノードレベルのグラフ異常検出(GAD)は、医学、ソーシャルネットワーク、eコマースなどの分野におけるグラフ構造化データから異常ノードを特定する上で重要な役割を果たす。
本稿では,GADの効率を向上させるために,PREM (preprocessing and Matching) という簡単な手法を提案する。
我々のアプローチは、強力な異常検出機能を維持しながら、GADを合理化し、時間とメモリ消費を削減します。
論文 参考訳(メタデータ) (2023-10-18T02:59:57Z) - PULL: Reactive Log Anomaly Detection Based On Iterative PU Learning [58.85063149619348]
本稿では,推定故障時間ウィンドウに基づくリアクティブ異常検出のための反復ログ解析手法PULLを提案する。
我々の評価では、PULLは3つの異なるデータセットで10のベンチマークベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-01-25T16:34:43Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Anomaly Detection Based on Selection and Weighting in Latent Space [73.01328671569759]
SWADと呼ばれる新しい選択および重み付けに基づく異常検出フレームワークを提案する。
ベンチマークと実世界のデータセットによる実験は、SWADの有効性と優位性を示している。
論文 参考訳(メタデータ) (2021-03-08T10:56:38Z) - SUOD: Accelerating Large-Scale Unsupervised Heterogeneous Outlier
Detection [63.253850875265115]
外乱検出(OD)は、一般的なサンプルから異常物体を識別するための機械学習(ML)タスクである。
そこで我々は,SUODと呼ばれるモジュール型加速度システムを提案する。
論文 参考訳(メタデータ) (2020-03-11T00:22:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。