Fugu-MT 論文翻訳(概要): ONER: Online Experience Replay for Incremental Anomaly Detection

論文の概要: ONER: Online Experience Replay for Incremental Anomaly Detection

arxiv url: http://arxiv.org/abs/2412.03907v3
Date: Wed, 26 Mar 2025 09:06:21 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-27 14:57:01.071678
Title: ONER: Online Experience Replay for Incremental Anomaly Detection
Title（参考訳）: ONER: インクリメンタル異常検出のためのオンラインエクスペリエンスリプレイ
Authors: Yizhou Jin, Jiahui Zhu, Guodong Wang, Shiwei Li, Jinjin Zhang, Xinyue Liu, Qingjie Liu, Yunhong Wang,
Abstract要約: 増分異常検出は、工業製品ラインの欠陥を逐次識別することを目的としているが、破滅的な忘れ込みに悩まされている。我々はこれらの問題に対処するエンドツーエンドフレームワークであるONER(Online Experience Replay)を提案する。実験はONERの優位性を実証し、+4.4%のPixel AUROCと+28.3%のPixel AUPRで最先端の性能を達成した。
参考スコア（独自算出の注目度）: 38.26711343774729
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Incremental anomaly detection aims to sequentially identify defects in industrial product lines but suffers from catastrophic forgetting, primarily due to knowledge overwriting during parameter updates and feature conflicts between tasks. In this work, We propose ONER (ONline Experience Replay), an end-to-end framework that addresses these issues by synergistically integrating two types of experience: (1) decomposed prompts, which dynamically generate image-conditioned prompts from reusable modules to retain prior knowledge thus prevent knowledge overwriting, and (2) semantic prototypes, which enforce separability in latent feature spaces at pixel and image levels to mitigate cross-task feature conflicts. Extensive experiments demonstrate the superiority of ONER, achieving state-of-the-art performance with +4.4% Pixel AUROC and +28.3% Pixel AUPR improvements on the MVTec AD dataset over prior methods. Remarkably, ONER achieves this with only 0.019M parameters and 5 training epochs per task, confirming its efficiency and stability for real-world industrial deployment.
Abstract（参考訳）: インクリメンタル異常検出は、産業製品ラインの欠陥を逐次識別することを目的としているが、主にパラメータ更新時の知識過多とタスク間の機能衝突による破滅的な忘れ込みに悩まされている。本研究は,(1)再利用可能なモジュールから画像条件付きプロンプトを動的に生成し,事前知識を保ちながら知識のオーバーライトを防止し,(2)画素内の潜在特徴空間と画像レベルの分離性を強制するセマンティックプロトタイプ,の2つのタイプの経験を相乗的に統合することで,これらの問題に対処するエンド・ツー・エンド・エンドのフレームワークであるONER(ONline Experience Replay)を提案する。大規模な実験では、MVTec ADデータセットに対する+4.4%のPixel AUROCと+28.3%のPixel AUPRの改善で最先端のパフォーマンスを達成することができる。注目すべきことに、ONERは0.019Mパラメータとタスク毎の5つのトレーニングエポックでこれを達成し、実世界の産業展開の効率性と安定性を確認している。

関連論文リスト

Refining Decision Boundaries In Anomaly Detection Using Similarity Search Within the Feature Space [3.3202103799131795]
SDA2E(Sparse Dual Adversarial Attention-based AutoEncoder)を導入する。本稿では,意思決定境界を効率的に洗練するための3つの新しい戦略を統合した類似性誘導型アクティブラーニングフレームワークを提案する。 SDA2Eは、複数のDARPAトランスペアレントコンピューティングシナリオを含む52の不均衡データセットにわたって広範囲に評価し、15の最先端の異常検出手法と比較した。
論文参考訳（メタデータ） (2026-02-02T23:55:08Z)
Task-Model Alignment: A Simple Path to Generalizable AI-Generated Image Detection [57.17054616831796]
視覚言語モデル(VLM)はAI生成画像(AIGI)検出にますます採用されている。 VLMのアンダーパフォーマンスはタスクモデルのミスアライメントに起因する。本稿では,AIGI検出を2つの補完的タスクとして形式化する。
論文参考訳（メタデータ） (2025-12-07T09:19:00Z)
SRSR: Enhancing Semantic Accuracy in Real-World Image Super-Resolution with Spatially Re-Focused Text-Conditioning [59.013863248600046]
本稿では,空間的に再焦点を絞ったテキストコンディショニングを推論時に洗練する超解像フレームワークを提案する。第二に,非接地画素に対するテキストの影響を選択的に回避し,幻覚を防ぐ空間的自由誘導機構を導入する。
論文参考訳（メタデータ） (2025-10-26T05:03:55Z)
Agent4FaceForgery: Multi-Agent LLM Framework for Realistic Face Forgery Detection [108.5042835056188]
この作業では,2つの基本的な問題に対処するため,Agent4FaceForgeryを導入している。人間の偽造の多様な意図と反復的なプロセスを捉える方法。ソーシャルメディアの偽造に付随する複雑な、しばしば敵対的な、テキストと画像のインタラクションをモデル化する方法。
論文参考訳（メタデータ） (2025-09-16T01:05:01Z)
Joint Learning using Mixture-of-Expert-Based Representation for Enhanced Speech Generation and Robust Emotion Recognition [54.44798086835314]
音声感情認識(SER)は感情認識音声システム構築において重要な役割を担っているが,その性能は雑音下で著しく低下する。本稿では, フレームワイド・エキスパート・ルーティングを自己教師付き音声表現に応用した, フレキシブルMTLフレームワークSparse Mixture-of-Experts Representation Integration Technique (Sparse MERIT)を提案する。 MSP-Podcastコーパスの実験では、Sparse MERITはSERとSEの両方のタスクのベースラインモデルより一貫して優れていた。
論文参考訳（メタデータ） (2025-09-10T10:18:56Z)
Zero-Shot Anomaly Detection with Dual-Branch Prompt Learning [17.263625932911534]
Zero-shot Anomaly Detection (ZSAD) は、見えないカテゴリの欠陥を識別し、ローカライズする。既存のZSADメソッドは、固定または学習プロンプトを使用しても、トレーニングデータが限られたトレーニングドメインから導出されるため、ドメインシフトの下で苦労する。 PILOTは2つの重要なイノベーションを通じてこれらの課題を克服するために設計されたフレームワークです。
論文参考訳（メタデータ） (2025-08-01T17:00:12Z)
Contrastive-KAN: A Semi-Supervised Intrusion Detection Framework for Cybersecurity with scarce Labeled Data [0.0]
Kolmogorov-Arnold Network (KAN) を用いた半教師付きコントラスト学習フレームワークに基づくリアルタイム侵入検知システムを提案する。本手法は, ラベルのないデータを利用して, 正常な動作と攻撃動作を効果的に識別する。 UNSW-NB15, BoT-IoT, Gas Pipelineの3つのベンチマークデータセットに対して,それぞれ2.20%,1.28%,8%のラベル付きサンプルを使用してアプローチを検証する。
論文参考訳（メタデータ） (2025-07-14T21:02:34Z)
Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detections [50.343419243749054]
異常検出(AD)は、通常のデータ分布から逸脱を識別する。本稿では,視覚エンコーダから抽出した画像コンテキストに基づいて,テキストエンコーダのプロンプトを条件付ける手法を提案する。提案手法は,14のデータセットにおいて,各メトリクスに対して2%から29%の性能向上を実現している。
論文参考訳（メタデータ） (2025-04-15T10:42:25Z)
FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [63.87313550399871]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。 PSTは、画像基礎モデルと潜在空間アライメントによるクロスモーダルな知識伝達を確立する。 FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
論文参考訳（メタデータ） (2025-03-25T15:04:53Z)
EIAD: Explainable Industrial Anomaly Detection Via Multi-Modal Large Language Models [23.898938659720503]
工業異常検出(IAD)は製造中の製品品質を確保するために重要である。本稿では,コア特徴抽出からダイアログ機能を分離する専用マルチモーダル欠陥ローカライゼーションモジュールを提案する。私たちはまた、Defect Detection Question Answering (DDQA) という、最初のマルチモーダル産業異常検出トレーニングデータセットにも貢献する。
論文参考訳（メタデータ） (2025-03-18T11:33:29Z)
Exploring Large Vision-Language Models for Robust and Efficient Industrial Anomaly Detection [4.691083532629246]
CLAD(Contrastive Cross-Modal Training)を用いた視覚言語異常検出法を提案する。 CLADは、視覚的特徴とテキスト的特徴をコントラスト学習を用いて共有埋め込み空間に整列する。 CLADは画像レベルの異常検出と画素レベルの異常局所化の両方において最先端の手法より優れていることを示す。
論文参考訳（メタデータ） (2024-12-01T17:00:43Z)
Feature Fusion Transferability Aware Transformer for Unsupervised Domain Adaptation [1.9035011984138845]
Unsupervised domain adapt (UDA) は、ラベル付きソースドメインから学んだ知識を活用し、ラベルなしターゲットドメインのパフォーマンスを改善することを目的としている。近年の研究では、視覚変換器(ViT)の応用が期待されている。本稿では,UDAタスクにおけるVT性能を向上させるために,FFTAT(Feature Fusion Transferability Aware Transformer)を提案する。
論文参考訳（メタデータ） (2024-11-10T22:23:12Z)
Improving Neural Surface Reconstruction with Feature Priors from Multi-View Image [87.00660347447494]
ニューラルサーフェス・コンストラクション(NSR)の最近の進歩は、ボリュームレンダリングと組み合わせることで、マルチビュー・コンストラクションを著しく改善している。本稿では,多種多様な視覚的タスクから価値ある特徴を活用すべく,特徴レベルの一貫した損失について検討する。 DTU と EPFL を用いて解析した結果,画像マッチングと多視点ステレオデータセットによる特徴が,他のプリテキストタスクよりも優れていたことが判明した。
論文参考訳（メタデータ） (2024-08-04T16:09:46Z)
Exploring Test-Time Adaptation for Object Detection in Continually Changing Environments [13.163784646113214]
最近CTTA(Continuous Test-Time Adaptation)が、ターゲットドメインを継続的に変更するソーストレーニングモデルに徐々に適応する、有望なテクニックとして登場した。まず、オブジェクトレベルのコントラスト学習モジュールは、対象領域における特徴表現を洗練させるために、コントラスト学習のためのオブジェクトレベルの特徴を抽出する。第2に、適応監視モジュールは、不要な適応を動的にスキップし、予測された信頼度スコアに基づいてカテゴリ固有のしきい値を更新して、効率を向上し、擬似ラベルの品質を向上させる。
論文参考訳（メタデータ） (2024-06-24T08:30:03Z)
Assessing Quality Metrics for Neural Reality Gap Input Mitigation in Autonomous Driving Testing [2.194575078433007]
自動走行システム(ADS)のシミュレーションベースのテストは業界標準であり、現実世界のテストに対する制御され、安全で費用対効果の高い代替手段である。これらの利点にもかかわらず、仮想シミュレーションは画像の忠実さ、テクスチャ表現、環境の正確さといった現実世界の状態を正確に再現することができないことが多い。これは、シミュレートされたドメインと実世界のドメイン間のADSの挙動に大きな違いをもたらす可能性がある。研究者は、画像から画像へのニューラルトランスレーション(I2I)を使用して、シミュレートされた環境のリアリズムを高め、合成データをより本物にすることで、シミュレートされた環境のリアリズムを高めた。
論文参考訳（メタデータ） (2024-04-29T10:37:38Z)
Develop End-to-End Anomaly Detection System [3.130722489512822]
異常検出は、ネットワークの堅牢性を保証する上で重要な役割を果たす。本稿では,エンドツーエンドの異常検出モデル開発パイプラインを提案する。本稿では,新しい予測モデルの導入とベンチマークによるフレームワークの有効性を示す。
論文参考訳（メタデータ） (2024-02-01T09:02:44Z)
PSDiff: Diffusion Model for Person Search with Iterative and Collaborative Refinement [59.6260680005195]
本稿では,拡散モデルであるPSDiffに基づく新しいPerson Searchフレームワークを提案する。 PSDiffは、ノイズの多いボックスとReID埋め込みから地上の真実へのデュアルデノケーションプロセスとして検索する人を定式化する。新しいパラダイムに従って、我々は、反復的かつ協調的な方法で検出とReIDサブタスクを最適化する新しいコラボレーティブ・デノナイジング・レイヤ(CDL)を設計する。
論文参考訳（メタデータ） (2023-09-20T08:16:39Z)
One-stage Low-resolution Text Recognition with High-resolution Knowledge Transfer [53.02254290682613]
現在の低解像度テキスト認識のソリューションは、通常2段階のパイプラインに依存している。本稿では,多段階の知識伝達を実現するための効率的かつ効果的な知識蒸留フレームワークを提案する。実験の結果、提案されたワンステージパイプラインは、超高解像度ベースの2ステージフレームワークよりも大幅に優れていた。
論文参考訳（メタデータ） (2023-08-05T02:33:45Z)
DyEdgeGAT: Dynamic Edge via Graph Attention for Early Fault Detection in IIoT Systems [12.641578474466646]
DyEdgeGATは、IIoTシステムにおける早期故障検出の新しいアプローチである。動作条件コンテキストをノードダイナミックスモデリングに組み込んで、その正確性と堅牢性を高める。我々は,DyEdgeGATを人工データセットと実世界の産業規模フロー施設ベンチマークの両方を用いて厳格に評価した。
論文参考訳（メタデータ） (2023-07-07T12:22:16Z)
HCL-TAT: A Hybrid Contrastive Learning Method for Few-shot Event Detection with Task-Adaptive Threshold [18.165302114575212]
タスク適応型閾値(HCLTAT)を用いた新しいハイブリッドコントラスト学習法を提案する。本稿では,タスク適応型閾値(HCLTAT)を用いたハイブリッドコントラスト学習手法を提案する。ベンチマークデータセットFewEventの実験は、最先端技術と比較して、より良い結果を得るために、我々の手法の優位性を実証している。
論文参考訳（メタデータ） (2022-10-17T07:37:38Z)
E2-AEN: End-to-End Incremental Learning with Adaptively Expandable Network [57.87240860624937]
本稿では,E2-AENという,エンドツーエンドのトレーニング可能な適応拡張可能なネットワークを提案する。以前のタスクの精度を落とさずに、新しいタスクのための軽量な構造を動的に生成する。 E2-AENはコストを削減し、あらゆるフィードフォワードアーキテクチャをエンドツーエンドで構築できる。
論文参考訳（メタデータ） (2022-07-14T09:04:51Z)
Entropy-based Active Learning for Object Detection with Progressive Diversity Constraint [31.094612936162754]
アクティブラーニングは、コンピュータビジョンタスクにおける高アノテーションコストの問題を軽減するための有望な代替手段である。本稿では,この問題に対処する新たなハイブリッドアプローチを提案し,ボトムアップ方式でインスタンスレベルの不確実性と多様性を共同で検討する。
論文参考訳（メタデータ） (2022-04-17T09:51:12Z)
Learning to Adapt to Unseen Abnormal Activities under Weak Supervision [43.40900198498228]
ビデオ中の弱教師付き異常検出のためのメタラーニングフレームワークを提案する。このフレームワークは,バイナリラベルの動画レベルのアノテーションが利用可能である場合にのみ,目に見えないような異常なアクティビティに効果的に対応できることを学習する。
論文参考訳（メタデータ） (2022-03-25T12:15:44Z)
Activation to Saliency: Forming High-Quality Labels for Unsupervised Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文参考訳（メタデータ） (2021-12-07T11:54:06Z)
Style Normalization and Restitution for DomainGeneralization and Adaptation [88.86865069583149]
効果的なドメイン一般化モデルは、一般化および判別可能な特徴表現を学習することが期待される。本稿では,ネットワークの高一般化と識別能力を確保するために,新しいスタイル正規化・再構成モジュール(SNR)を設計する。
論文参考訳（メタデータ） (2021-01-03T09:01:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。