Fugu-MT 論文翻訳(概要): ONER: Online Experience Replay for Incremental Anomaly Detection

論文の概要: ONER: Online Experience Replay for Incremental Anomaly Detection

arxiv url: http://arxiv.org/abs/2412.03907v2
Date: Tue, 14 Jan 2025 09:40:53 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-15 15:02:01.034344
Title: ONER: Online Experience Replay for Incremental Anomaly Detection
Title（参考訳）: ONER: インクリメンタル異常検出のためのオンラインエクスペリエンスリプレイ
Authors: Yizhou Jin, Jiahui Zhu, Guodong Wang, Shiwei Li, Jinjin Zhang, Qingjie Liu, Xinyue Liu, Yunhong Wang,
Abstract要約: エンド・ツー・エンドのオンライン体験再生手法であるONERを提案する。 ONERは、最小のコストで新しいタスクに適応しながら、破滅的な忘れを効果的に軽減する。
参考スコア（独自算出の注目度）: 38.26711343774729
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Incremental anomaly detection sequentially recognizes abnormal regions in novel categories for dynamic industrial scenarios. This remains highly challenging due to knowledge overwriting and feature conflicts, leading to catastrophic forgetting. In this work, we propose ONER, an end-to-end ONline Experience Replay method, which efficiently mitigates catastrophic forgetting while adapting to new tasks with minimal cost. Specifically, our framework utilizes two types of experiences from past tasks: decomposed prompts and semantic prototypes, addressing both model parameter updates and feature optimization. The decomposed prompts consist of learnable components that assemble to produce attention-conditioned prompts. These prompts reuse previously learned knowledge, enabling model to learn novel tasks effectively. The semantic prototypes operate at both pixel and image levels, performing regularization in the latent feature space to prevent forgetting across various tasks. Extensive experiments demonstrate that our method achieves state-of-the-art performance in incremental anomaly detection with significantly reduced forgetting, as well as efficiently adapting to new categories with minimal costs. These results confirm the efficiency and stability of ONER, making it a powerful solution for real-world applications.
Abstract（参考訳）: 逐次異常検出は、動的産業シナリオのための新しいカテゴリーにおける異常領域を逐次認識する。知識のオーバーライトと機能の衝突のため、これは依然として非常に困難であり、破滅的な忘れを招きます。本研究では,新しいタスクに最小限のコストで適応しながら,破滅的な忘れを効果的に軽減する,エンド・ツー・エンドのオンラインエクスペリエンス・リプレイ手法であるONERを提案する。具体的には,提案手法を分解したプロンプトとセマンティックプロトタイプ,モデルパラメータ更新と機能最適化の両面に対処する。分解されたプロンプトは、注意条件付きプロンプトを生成するために組み立てられる学習可能なコンポーネントで構成されている。これらは、学習した知識を再利用し、モデルが新しいタスクを効果的に学習できるようにする。セマンティックプロトタイプはピクセルレベルとイメージレベルの両方で動作し、様々なタスク間の忘れを防止するために、潜在機能空間で正規化を行う。大規模実験により, 再帰的異常検出において, 精度を著しく低下させるとともに, 最小限のコストで, 新たなカテゴリに適応できることが実証された。これらの結果はONERの効率性と安定性を確認し、現実世界のアプリケーションにとって強力なソリューションとなる。

関連論文リスト

Refining Decision Boundaries In Anomaly Detection Using Similarity Search Within the Feature Space [3.3202103799131795]
SDA2E(Sparse Dual Adversarial Attention-based AutoEncoder)を導入する。本稿では,意思決定境界を効率的に洗練するための3つの新しい戦略を統合した類似性誘導型アクティブラーニングフレームワークを提案する。 SDA2Eは、複数のDARPAトランスペアレントコンピューティングシナリオを含む52の不均衡データセットにわたって広範囲に評価し、15の最先端の異常検出手法と比較した。
論文参考訳（メタデータ） (2026-02-02T23:55:08Z)
Task-Model Alignment: A Simple Path to Generalizable AI-Generated Image Detection [57.17054616831796]
視覚言語モデル(VLM)はAI生成画像(AIGI)検出にますます採用されている。 VLMのアンダーパフォーマンスはタスクモデルのミスアライメントに起因する。本稿では,AIGI検出を2つの補完的タスクとして形式化する。
論文参考訳（メタデータ） (2025-12-07T09:19:00Z)
SRSR: Enhancing Semantic Accuracy in Real-World Image Super-Resolution with Spatially Re-Focused Text-Conditioning [59.013863248600046]
本稿では,空間的に再焦点を絞ったテキストコンディショニングを推論時に洗練する超解像フレームワークを提案する。第二に,非接地画素に対するテキストの影響を選択的に回避し,幻覚を防ぐ空間的自由誘導機構を導入する。
論文参考訳（メタデータ） (2025-10-26T05:03:55Z)
Agent4FaceForgery: Multi-Agent LLM Framework for Realistic Face Forgery Detection [108.5042835056188]
この作業では,2つの基本的な問題に対処するため,Agent4FaceForgeryを導入している。人間の偽造の多様な意図と反復的なプロセスを捉える方法。ソーシャルメディアの偽造に付随する複雑な、しばしば敵対的な、テキストと画像のインタラクションをモデル化する方法。
論文参考訳（メタデータ） (2025-09-16T01:05:01Z)
Joint Learning using Mixture-of-Expert-Based Representation for Enhanced Speech Generation and Robust Emotion Recognition [54.44798086835314]
音声感情認識(SER)は感情認識音声システム構築において重要な役割を担っているが,その性能は雑音下で著しく低下する。本稿では, フレームワイド・エキスパート・ルーティングを自己教師付き音声表現に応用した, フレキシブルMTLフレームワークSparse Mixture-of-Experts Representation Integration Technique (Sparse MERIT)を提案する。 MSP-Podcastコーパスの実験では、Sparse MERITはSERとSEの両方のタスクのベースラインモデルより一貫して優れていた。
論文参考訳（メタデータ） (2025-09-10T10:18:56Z)
Zero-Shot Anomaly Detection with Dual-Branch Prompt Learning [17.263625932911534]
Zero-shot Anomaly Detection (ZSAD) は、見えないカテゴリの欠陥を識別し、ローカライズする。既存のZSADメソッドは、固定または学習プロンプトを使用しても、トレーニングデータが限られたトレーニングドメインから導出されるため、ドメインシフトの下で苦労する。 PILOTは2つの重要なイノベーションを通じてこれらの課題を克服するために設計されたフレームワークです。
論文参考訳（メタデータ） (2025-08-01T17:00:12Z)
Contrastive-KAN: A Semi-Supervised Intrusion Detection Framework for Cybersecurity with scarce Labeled Data [0.0]
Kolmogorov-Arnold Network (KAN) を用いた半教師付きコントラスト学習フレームワークに基づくリアルタイム侵入検知システムを提案する。本手法は, ラベルのないデータを利用して, 正常な動作と攻撃動作を効果的に識別する。 UNSW-NB15, BoT-IoT, Gas Pipelineの3つのベンチマークデータセットに対して,それぞれ2.20%,1.28%,8%のラベル付きサンプルを使用してアプローチを検証する。
論文参考訳（メタデータ） (2025-07-14T21:02:34Z)
Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detections [50.343419243749054]
異常検出(AD)は、通常のデータ分布から逸脱を識別する。本稿では,視覚エンコーダから抽出した画像コンテキストに基づいて,テキストエンコーダのプロンプトを条件付ける手法を提案する。提案手法は,14のデータセットにおいて,各メトリクスに対して2%から29%の性能向上を実現している。
論文参考訳（メタデータ） (2025-04-15T10:42:25Z)
FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [63.87313550399871]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。 PSTは、画像基礎モデルと潜在空間アライメントによるクロスモーダルな知識伝達を確立する。 FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
論文参考訳（メタデータ） (2025-03-25T15:04:53Z)
EIAD: Explainable Industrial Anomaly Detection Via Multi-Modal Large Language Models [23.898938659720503]
工業異常検出(IAD)は製造中の製品品質を確保するために重要である。本稿では,コア特徴抽出からダイアログ機能を分離する専用マルチモーダル欠陥ローカライゼーションモジュールを提案する。私たちはまた、Defect Detection Question Answering (DDQA) という、最初のマルチモーダル産業異常検出トレーニングデータセットにも貢献する。
論文参考訳（メタデータ） (2025-03-18T11:33:29Z)
Exploring Large Vision-Language Models for Robust and Efficient Industrial Anomaly Detection [4.691083532629246]
CLAD(Contrastive Cross-Modal Training)を用いた視覚言語異常検出法を提案する。 CLADは、視覚的特徴とテキスト的特徴をコントラスト学習を用いて共有埋め込み空間に整列する。 CLADは画像レベルの異常検出と画素レベルの異常局所化の両方において最先端の手法より優れていることを示す。
論文参考訳（メタデータ） (2024-12-01T17:00:43Z)
Feature Fusion Transferability Aware Transformer for Unsupervised Domain Adaptation [1.9035011984138845]
Unsupervised domain adapt (UDA) は、ラベル付きソースドメインから学んだ知識を活用し、ラベルなしターゲットドメインのパフォーマンスを改善することを目的としている。近年の研究では、視覚変換器(ViT)の応用が期待されている。本稿では,UDAタスクにおけるVT性能を向上させるために,FFTAT(Feature Fusion Transferability Aware Transformer)を提案する。
論文参考訳（メタデータ） (2024-11-10T22:23:12Z)
Improving Neural Surface Reconstruction with Feature Priors from Multi-View Image [87.00660347447494]
ニューラルサーフェス・コンストラクション(NSR)の最近の進歩は、ボリュームレンダリングと組み合わせることで、マルチビュー・コンストラクションを著しく改善している。本稿では,多種多様な視覚的タスクから価値ある特徴を活用すべく,特徴レベルの一貫した損失について検討する。 DTU と EPFL を用いて解析した結果,画像マッチングと多視点ステレオデータセットによる特徴が,他のプリテキストタスクよりも優れていたことが判明した。
論文参考訳（メタデータ） (2024-08-04T16:09:46Z)
Exploring Test-Time Adaptation for Object Detection in Continually Changing Environments [13.163784646113214]
最近CTTA(Continuous Test-Time Adaptation)が、ターゲットドメインを継続的に変更するソーストレーニングモデルに徐々に適応する、有望なテクニックとして登場した。まず、オブジェクトレベルのコントラスト学習モジュールは、対象領域における特徴表現を洗練させるために、コントラスト学習のためのオブジェクトレベルの特徴を抽出する。第2に、適応監視モジュールは、不要な適応を動的にスキップし、予測された信頼度スコアに基づいてカテゴリ固有のしきい値を更新して、効率を向上し、擬似ラベルの品質を向上させる。
論文参考訳（メタデータ） (2024-06-24T08:30:03Z)
Assessing Quality Metrics for Neural Reality Gap Input Mitigation in Autonomous Driving Testing [2.194575078433007]
自動走行システム(ADS)のシミュレーションベースのテストは業界標準であり、現実世界のテストに対する制御され、安全で費用対効果の高い代替手段である。これらの利点にもかかわらず、仮想シミュレーションは画像の忠実さ、テクスチャ表現、環境の正確さといった現実世界の状態を正確に再現することができないことが多い。これは、シミュレートされたドメインと実世界のドメイン間のADSの挙動に大きな違いをもたらす可能性がある。研究者は、画像から画像へのニューラルトランスレーション(I2I)を使用して、シミュレートされた環境のリアリズムを高め、合成データをより本物にすることで、シミュレートされた環境のリアリズムを高めた。
論文参考訳（メタデータ） (2024-04-29T10:37:38Z)
Develop End-to-End Anomaly Detection System [3.130722489512822]
異常検出は、ネットワークの堅牢性を保証する上で重要な役割を果たす。本稿では,エンドツーエンドの異常検出モデル開発パイプラインを提案する。本稿では,新しい予測モデルの導入とベンチマークによるフレームワークの有効性を示す。
論文参考訳（メタデータ） (2024-02-01T09:02:44Z)
PSDiff: Diffusion Model for Person Search with Iterative and Collaborative Refinement [59.6260680005195]
本稿では,拡散モデルであるPSDiffに基づく新しいPerson Searchフレームワークを提案する。 PSDiffは、ノイズの多いボックスとReID埋め込みから地上の真実へのデュアルデノケーションプロセスとして検索する人を定式化する。新しいパラダイムに従って、我々は、反復的かつ協調的な方法で検出とReIDサブタスクを最適化する新しいコラボレーティブ・デノナイジング・レイヤ(CDL)を設計する。
論文参考訳（メタデータ） (2023-09-20T08:16:39Z)
One-stage Low-resolution Text Recognition with High-resolution Knowledge Transfer [53.02254290682613]
現在の低解像度テキスト認識のソリューションは、通常2段階のパイプラインに依存している。本稿では,多段階の知識伝達を実現するための効率的かつ効果的な知識蒸留フレームワークを提案する。実験の結果、提案されたワンステージパイプラインは、超高解像度ベースの2ステージフレームワークよりも大幅に優れていた。
論文参考訳（メタデータ） (2023-08-05T02:33:45Z)
DyEdgeGAT: Dynamic Edge via Graph Attention for Early Fault Detection in IIoT Systems [12.641578474466646]
DyEdgeGATは、IIoTシステムにおける早期故障検出の新しいアプローチである。動作条件コンテキストをノードダイナミックスモデリングに組み込んで、その正確性と堅牢性を高める。我々は,DyEdgeGATを人工データセットと実世界の産業規模フロー施設ベンチマークの両方を用いて厳格に評価した。
論文参考訳（メタデータ） (2023-07-07T12:22:16Z)
HCL-TAT: A Hybrid Contrastive Learning Method for Few-shot Event Detection with Task-Adaptive Threshold [18.165302114575212]
タスク適応型閾値(HCLTAT)を用いた新しいハイブリッドコントラスト学習法を提案する。本稿では,タスク適応型閾値(HCLTAT)を用いたハイブリッドコントラスト学習手法を提案する。ベンチマークデータセットFewEventの実験は、最先端技術と比較して、より良い結果を得るために、我々の手法の優位性を実証している。
論文参考訳（メタデータ） (2022-10-17T07:37:38Z)
E2-AEN: End-to-End Incremental Learning with Adaptively Expandable Network [57.87240860624937]
本稿では,E2-AENという,エンドツーエンドのトレーニング可能な適応拡張可能なネットワークを提案する。以前のタスクの精度を落とさずに、新しいタスクのための軽量な構造を動的に生成する。 E2-AENはコストを削減し、あらゆるフィードフォワードアーキテクチャをエンドツーエンドで構築できる。
論文参考訳（メタデータ） (2022-07-14T09:04:51Z)
Entropy-based Active Learning for Object Detection with Progressive Diversity Constraint [31.094612936162754]
アクティブラーニングは、コンピュータビジョンタスクにおける高アノテーションコストの問題を軽減するための有望な代替手段である。本稿では,この問題に対処する新たなハイブリッドアプローチを提案し,ボトムアップ方式でインスタンスレベルの不確実性と多様性を共同で検討する。
論文参考訳（メタデータ） (2022-04-17T09:51:12Z)
Learning to Adapt to Unseen Abnormal Activities under Weak Supervision [43.40900198498228]
ビデオ中の弱教師付き異常検出のためのメタラーニングフレームワークを提案する。このフレームワークは,バイナリラベルの動画レベルのアノテーションが利用可能である場合にのみ,目に見えないような異常なアクティビティに効果的に対応できることを学習する。
論文参考訳（メタデータ） (2022-03-25T12:15:44Z)
Activation to Saliency: Forming High-Quality Labels for Unsupervised Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文参考訳（メタデータ） (2021-12-07T11:54:06Z)
Style Normalization and Restitution for DomainGeneralization and Adaptation [88.86865069583149]
効果的なドメイン一般化モデルは、一般化および判別可能な特徴表現を学習することが期待される。本稿では,ネットワークの高一般化と識別能力を確保するために,新しいスタイル正規化・再構成モジュール(SNR)を設計する。
論文参考訳（メタデータ） (2021-01-03T09:01:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。