論文の概要: InCTRLv2: Generalist Residual Models for Few-Shot Anomaly Detection and Segmentation
- arxiv url: http://arxiv.org/abs/2604.04632v1
- Date: Mon, 06 Apr 2026 12:30:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:19.187189
- Title: InCTRLv2: Generalist Residual Models for Few-Shot Anomaly Detection and Segmentation
- Title(参考訳): InCTRLv2:Few-Shot異常検出とセグメンテーションのための一般残留モデル
- Authors: Jiawen Zhu, Mengjia Niu, Guansong Pang,
- Abstract要約: InCTRLv2は、二重ブランチフレームワークの下で、異常知覚の2つの新しい視点を導入している。
識別異常スコア学習(DASL)と1クラス異常スコア学習(OASL)の2つの新しいモジュールによって実現される。
10個のADデータセットの実験により、InCTRLv2は、さまざまな設定にわたる異常検出とセグメンテーションタスクの両方において、SotAのパフォーマンスを達成することが示された。
- 参考スコア(独自算出の注目度): 40.431502791639936
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While recent anomaly detection (AD) methods have made substantial progress in recognizing abnormal patterns within specific domains, most of them are specialist models that are trained on large training samples from a specific target dataset, struggling to generalize to unseen datasets. To address this limitation, the paradigm of Generalist Anomaly Detection (GAD) has emerged in recent years, aiming to learn a single generalist model to detect anomalies across diverse domains without retraining. To this end, this work introduces InCTRLv2, a novel few-shot Generalist Anomaly Detection and Segmentation (GADS) framework that significantly extends our previously proposed GAD model, InCTRL. Building on the idea of learning in-context residuals with few-shot normal examples to detect anomalies as in InCTRL, InCTRLv2 introduces two new, complementary perspectives of anomaly perception under a dual-branch framework. This is accomplished by two novel modules upon InCTRL: i) Discriminative Anomaly Score Learning (DASL) with both normal and abnormal data in the main branch, which learns a semantic-guided abnormality and normality space that supports the classification of query samples from both the abnormality and normality perspectives; and ii) One-class Anomaly Score Learning (OASL) using only the normal data, which learns generalized normality patterns in a semantic space via an auxiliary branch, focusing on detecting anomalies through the lens of normality solely. Both branches are guided by rich visual-text semantic priors encoded by large-scale vision-language models. Together, they offer a dual semantic perspective for AD: one emphasizes normal-abnormal discriminations, while the other emphasizes normality-deviated semantics. Extensive experiments on ten AD datasets demonstrate that InCTRLv2 achieves SotA performance in both anomaly detection and segmentation tasks across various settings.
- Abstract(参考訳): 最近の異常検出(AD)法は、特定のドメイン内の異常パターンを認識するためにかなりの進歩を遂げているが、そのほとんどは、特定のターゲットデータセットからの大規模なトレーニングサンプルに基づいて訓練され、目に見えないデータセットへの一般化に苦慮しているスペシャリストモデルである。
この制限に対処するために、GAD(Generalist Anomaly Detection)のパラダイムが近年出現し、複数のドメインにまたがる異常をリトレーニングすることなく検出する1つのジェネラリストモデルを学ぶことを目指している。
そこで本研究では,GADS(Generalist Anomaly Detection and Segmentation)フレームワークであるInCTRL2を紹介する。
InCTRLのように、異常を検出するために、ごく普通の例で文脈内残差を学習するというアイデアに基づいて、InCTRLv2は、二重ブランチフレームワークの下での異常知覚を補完する2つの新しい視点を導入する。
これはInCTRL上の2つの新しいモジュールによって達成される。
一 メインブランチにおける正常データと異常データの両方を有する識別的異常スコア学習(DASL)であって、異常データと正常データの両方の観点からクエリサンプルの分類を支援する意味誘導異常と正常性空間を学習すること。
二 正規データのみを用いて一級異常スコア学習(OASL)を行い、補助枝を介して意味空間における一般化正規性パターンを学習し、正規性のレンズを通して異常を検出することのみに焦点を当てた。
両方のブランチは、大規模な視覚言語モデルでエンコードされたリッチなビジュアルテキストセマンティクスによってガイドされる。
両者はADの2つの意味論的な視点を提供し、一方は正常な非正規な差別を強調し、もう一方は正常さを逸脱した意味論を強調している。
10個のADデータセットに対する大規模な実験により、InCTRLv2は様々な設定で異常検出とセグメンテーションタスクの両方でSotA性能を達成することが示された。
関連論文リスト
- Normal-Abnormal Guided Generalist Anomaly Detection [24.763955488489852]
Generalist Anomaly Detection (GAD)は、新しいターゲットドメインの異常を検出するために、元のドメイン上で統一モデルをトレーニングすることを目的としている。
従来のGAD法は主に通常のサンプルのみを参照として使用しており、現実のシナリオでしばしば利用できる異常なサンプルに含まれる貴重な情報を見下ろしている。
本報告では, 正常および異常サンプルを基準として, 種々の領域にわたる異常検出を誘導する正規誘導型一般異常検出法を提案する。
論文 参考訳(メタデータ) (2025-10-01T04:27:10Z) - Two Is Better Than One: Aligned Representation Pairs for Anomaly Detection [56.57122939745213]
異常検出は、標準から逸脱するサンプルを特定することに焦点を当てる。
近年の自己教師型手法は, 異常に関する事前知識を用いて, トレーニング中に合成外れ値を生成することによって, それらの表現をうまく学習している。
この制限は、通常のサンプルにおける対称性に関する事前の知識を活用して、異なるコンテキストでデータを観測する、新しいアプローチであるCon$で対処する。
論文 参考訳(メタデータ) (2024-05-29T07:59:06Z) - Toward Generalist Anomaly Detection via In-context Residual Learning with Few-shot Sample Prompts [25.629973843455495]
Generalist Anomaly Detection (GAD)は、ターゲットデータにさらなるトレーニングを加えることなく、さまざまなアプリケーションドメインからさまざまなデータセットの異常を検出するために一般化可能な、単一の検出モデルをトレーニングすることを目的としている。
InCTRLと呼ばれるGADのための文脈内残差学習モデルを学習する新しい手法を提案する。
InCTRLは最高のパフォーマーであり、最先端の競合手法を著しく上回っている。
論文 参考訳(メタデータ) (2024-03-11T08:07:46Z) - Open-Vocabulary Video Anomaly Detection [57.552523669351636]
監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。
近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。
本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文 参考訳(メタデータ) (2023-11-13T02:54:17Z) - Open-Set Multivariate Time-Series Anomaly Detection [7.127829790714167]
時系列異常検出法は、トレーニング期間中に通常のサンプルのみが利用可能であると仮定する。
監視された手法は、通常の異常や観察された異常を分類するために利用することができるが、訓練中に見られる異常に過度に適応する傾向がある。
MOSAD(Multivarate Open-Set Time-Series Anomaly Detector)と呼ばれるオープンセットTSAD問題に対処するアルゴリズムを提案する。
MOSADは、共有表現空間と、生成ヘッド、識別ヘッド、異常認識コントラストヘッドを含む特殊ヘッドを備えた、新しいマルチヘッドTSADフレームワークである。
論文 参考訳(メタデータ) (2023-10-18T19:55:11Z) - Explainable Deep Few-shot Anomaly Detection with Deviation Networks [123.46611927225963]
本稿では,弱い教師付き異常検出フレームワークを導入し,検出モデルを訓練する。
提案手法は,ラベル付き異常と事前確率を活用することにより,識別正規性を学習する。
我々のモデルはサンプル効率が高く頑健であり、クローズドセットとオープンセットの両方の設定において最先端の競合手法よりもはるかに優れている。
論文 参考訳(メタデータ) (2021-08-01T14:33:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。