論文の概要: TaskFusion: Continual Anomaly Detection for Heterogeneous Tabular Data
- arxiv url: http://arxiv.org/abs/2606.11844v1
- Date: Wed, 10 Jun 2026 09:21:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-11 16:42:38.38735
- Title: TaskFusion: Continual Anomaly Detection for Heterogeneous Tabular Data
- Title(参考訳): TaskFusion:不均一な単語データの連続的異常検出
- Authors: Dayananda Herurkar, Federico Raue, Joachim Folz, Jörn Hees, Andreas Dengel,
- Abstract要約: 本研究では,異なるタスクから連続的に学習するための連続学習法を提案する。
提案手法は, AGFモデル, Taskfusion Augmentation およびoutlier exposure の3つの主要部分から構成される。
複数の領域にまたがる21の異種データセットに対するアプローチを評価する。
- 参考スコア(独自算出の注目度): 11.770179526235511
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Continual anomaly detection in tabular data is challenging and remains largely underexplored, particularly in settings with heterogeneous feature schemas, distribution shifts, and severe class imbalance. In many real-world applications, data arrive sequentially from diverse domains, rendering conventional continual learning methods ineffective due to their reliance on a fixed input space. We propose a continual learning (CL) method, which can overcome these challenges and continually learn from different tasks. Our method consists of three main parts: our AGF model, Taskfusion augmentation, and outlier exposure. The AGF-model maps task-specific features into a shared space, then aligns distributions to reduce representation drift, and learns anomaly decision boundaries in the aligned space. To improve stability, we introduce Taskfusion augmentation, combining boundary-aware interpolation within tasks to refine the model anomaly boundaries and cross-task mixing to transfer anomaly structure across datasets. To handle class imbalance and memory constraints, we employ tabular dataset distillation to store compact synthetic replay samples, which are jointly used with augmented data in an outlier exposure objective for robust anomaly detection. We evaluate the approach on 21 heterogeneous datasets across multiple domains. Results show that our approach substantially improves continual anomaly detection performance over sequential fine-tuning and other CL baselines while reducing catastrophic forgetting and maintaining stable detection across heterogeneous datasets.
- Abstract(参考訳): 表形式のデータの連続的な異常検出は困難であり、特に不均一な特徴スキーマ、分散シフト、厳密なクラス不均衡の設定では、ほとんど探索されていない。
多くの実世界のアプリケーションでは、データは様々な領域から順次到着し、固定された入力空間に依存しているため、従来の連続的な学習方法が効果を発揮できない。
本稿では、これらの課題を克服し、異なるタスクから継続的に学習できる連続学習(CL)手法を提案する。
提案手法は, AGFモデル, Taskfusion Augmentation およびoutlier exposure の3つの主要部分から構成される。
AGFモデルはタスク固有の特徴を共有空間にマッピングし、分布を整列して表現のドリフトを減少させ、整列空間における異常な決定境界を学習する。
安定性を向上させるために,タスク内における境界認識補間とモデル異常境界の洗練と,データセット間の異常構造の伝達にクロスタスクミキシングを併用したタスクフュージョン拡張を導入する。
クラス不均衡とメモリの制約に対処するため,我々は,コンパクトな合成再生サンプルを格納するために表形式でのデータセット蒸留を用いて,ロバストな異常検出のための外部露光目標として,拡張データと共同で使用する。
複数の領域にまたがる21の異種データセットに対するアプローチを評価する。
その結果,本手法は連続微調整および他のCLベースラインに対する連続異常検出性能を大幅に向上するとともに,異種データセット間の破滅的な忘れ込みを低減し,安定した検出を維持できることが示唆された。
関連論文リスト
- Dual-Stage Invariant Continual Learning under Extreme Visual Sparsity [8.16821029459195]
背景駆動の勾配は、連続的なドメインシフトの間、機能のバックボーンを不安定にすることを示す。
連成蒸留による二段階不変連続学習フレームワークを提案する。
高分解能空間ベース RSO 検出データセットの実験は、確立された連続物体検出法よりも一貫した改善を示す。
論文 参考訳(メタデータ) (2026-03-27T09:03:49Z) - Towards One-for-All Anomaly Detection for Tabular Data [87.63505963517512]
タブラル異常検出(TAD)は多くの実世界の応用において重要である。
複数のソースデータセットに対して1回のトレーニングのみを必要とするフレームワークであるOFA-TADを提案する。
14ドメインの34のデータセットに対する実験により、OFA-TADはより優れた異常検出性能が得られることが示された。
論文 参考訳(メタデータ) (2026-03-15T14:42:05Z) - RFOD: Random Forest-based Outlier Detection for Tabular Data [12.469208664014472]
外乱検出は、サイバーセキュリティ、金融詐欺検出、医療といった高度な領域におけるデータの整合性を保護するために不可欠である。
textsfRFODは特徴的条件付き再構成問題として異常検出をリフレームする。
textsfRFODは、検出精度において最先端のベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2025-10-09T19:02:12Z) - CLIP Meets Diffusion: A Synergistic Approach to Anomaly Detection [49.11819337853632]
異常検出は、異常の定義の曖昧さ、異常型の多様性、トレーニングデータの不足による複雑な問題である。
識別的基盤モデルと生成的基礎モデルの両方を活用するCLIPfusionを提案する。
本手法は, 異常検出の多面的課題に対処する上で, マルチモーダル・マルチモデル融合の有効性を裏付けるものである。
論文 参考訳(メタデータ) (2025-06-13T13:30:15Z) - UniFault: A Fault Diagnosis Foundation Model from Bearing Data [23.797786758616223]
既存の機械故障診断モデルは、多種多様なデータセットにまたがる限定的な一般化を伴う操作特化である。
障害診断のための基盤モデルUniFaultを導入し,これらの問題に体系的に対処する。
UniFaultは、さまざまなFDデータセットにまたがる690万以上のサンプルに事前トレーニングされている。
論文 参考訳(メタデータ) (2025-04-02T05:34:27Z) - ARC: A Generalist Graph Anomaly Detector with In-Context Learning [62.202323209244]
ARCは汎用的なGADアプローチであり、一対一のGADモデルで様々なグラフデータセットの異常を検出することができる。
ARCはコンテキスト内学習を備えており、ターゲットデータセットからデータセット固有のパターンを直接抽出することができる。
各種領域からの複数のベンチマークデータセットに対する大規模な実験は、ARCの優れた異常検出性能、効率、一般化性を示す。
論文 参考訳(メタデータ) (2024-05-27T02:42:33Z) - Unraveling the "Anomaly" in Time Series Anomaly Detection: A
Self-supervised Tri-domain Solution [89.16750999704969]
異常ラベルは時系列異常検出において従来の教師付きモデルを妨げる。
自己教師型学習のような様々なSOTA深層学習技術がこの問題に対処するために導入されている。
自己教師型3領域異常検出器(TriAD)を提案する。
論文 参考訳(メタデータ) (2023-11-19T05:37:18Z) - RoSAS: Deep Semi-Supervised Anomaly Detection with
Contamination-Resilient Continuous Supervision [21.393509817509464]
本稿では, テクスト汚染耐性連続監視信号を考案した, 半教師付き異常検出手法を提案する。
当社のアプローチは、AUC-PRにおいて最先端の競合他社を20%-30%上回っている。
論文 参考訳(メタデータ) (2023-07-25T04:04:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。