論文の概要: Dual Prototype-Conditioned Diffusion Model for Scalable Multi-Class Unsupervised Anomaly Detection in Large Category Spaces
- arxiv url: http://arxiv.org/abs/2605.24402v1
- Date: Sat, 23 May 2026 05:10:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.035888
- Title: Dual Prototype-Conditioned Diffusion Model for Scalable Multi-Class Unsupervised Anomaly Detection in Large Category Spaces
- Title(参考訳): 大規模カテゴリー空間における拡張性を有するマルチクラス非教師付き異常検出のためのデュアルプロトタイプ・コンディション拡散モデル
- Authors: Yaoxuan Feng, Yuxin Li, Weijiang Lv, Zixuan Zhao, Yubiao Wang, Wenchao Chen, Bo Chen, Hongwei Liu,
- Abstract要約: 大規模マルチクラス異常検出のためのデュアルプロトタイプ条件拡散モデル DPDiff-AD を提案する。
DPDiff-ADは、相補的な局所的および大域的プロトタイプを通して不均一な正規分布をモデル化する。
厳密な正規性モデリングを実現し、カテゴリーの濃度が大きくなるにつれて構造的分離性を保ち、スケーラブルな異常判別を可能にする。
- 参考スコア(独自算出の注目度): 21.943236094911892
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-class anomaly detection aims to build unified models across diverse product categories. However, as the number of categories grows, its performance often degrades due to increasingly complex and heterogeneous normal distributions. To address this challenge, we propose DPDiff-AD, a Dual Prototype-conditioned Diffusion model for large-scale multi-class Anomaly Detection. DPDiff-AD models heterogeneous normal distributions through complementary local and global prototypes. Local prototypes capture representative fine-grained structural patterns via nearest-prototype aggregation, while global prototypes regulate holistic feature geometry through optimal transport regularization. Together, these dual-scale representations define a structured normality space. This space is refined through diffusion-based reconstruction conditioned on both local and global prototypes via prototype-aware attention. By jointly leveraging dual prototypes during generation, DPDiff-AD achieves precise normality modeling, preserves structured separability as category cardinality grows, and enables scalable anomaly discrimination. Extensive experiments across five benchmarks demonstrate the effectiveness and scalability of DPDiff-AD. On the 160-category large-scale dataset, it improves image- and pixel-level AUROC by 5.3 and 2.9 points over the previous state-of-the-art method Dinomaly+, while maintaining stable performance as category cardinality increases.
- Abstract(参考訳): マルチクラス異常検出は、さまざまな製品カテゴリにまたがる統一モデルを構築することを目的としている。
しかし、カテゴリの数が増加するにつれて、その性能はますます複雑で不均一な正規分布のために劣化することが多い。
この課題に対処するため、大規模マルチクラス異常検出のためのデュアルプロトタイプ条件拡散モデルであるDPDiff-ADを提案する。
DPDiff-ADは、相補的な局所的および大域的プロトタイプを通して不均一な正規分布をモデル化する。
局所的なプロトタイプは最も近いプロトタイプアグリゲーションによって代表的な微細な構造パターンを捉え、一方、グローバルなプロトタイプは最適な輸送正則化によって全体的特徴幾何学を規定する。
これらの双対スケール表現は共に、構造化された正規性空間を定義する。
この空間は, プロトタイプを意識して, ローカルプロトタイプとグローバルプロトタイプの両方で再現された拡散型再構成によって洗練されている。
DPDiff-ADは、生成中に2つのプロトタイプを共同で活用することにより、正確な正規性モデリングを実現し、カテゴリの濃度が増加するにつれて構造的分離性を保ち、スケーラブルな異常判別を可能にする。
5つのベンチマークにわたる大規模な実験は、PDiff-ADの有効性とスケーラビリティを示している。
160カテゴリの大規模データセットでは、画像と画素レベルのAUROCを従来の最先端のDinomaly+よりも5.3および2.9ポイント改善し、カテゴリの濃度が増加するにつれて安定した性能を維持している。
関連論文リスト
- One CT Unified Model Training Framework to Rule All Scanning Protocols [32.68329101435685]
NICT(Non-ideal Measurement Computed Tomography)はCTの臨床的使用を拡大している。
ほとんどの方法はペアデータを必要とするが、これは避けられない臓器の動きによる非現実的な要求である。
サブマニフォールド間のギャップを埋めるために,不確実誘導マニフォールド平滑化(UMS)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-16T09:26:32Z) - Scaling Up AI-Generated Image Detection via Generator-Aware Prototypes [15.99138549265524]
GAPL(Generator-Aware Prototype Learning)は、構造化学習パラダイムで表現を制約するフレームワークである。
GAPLは最先端の性能を達成し、多様なGANおよび拡散型ジェネレータにおいて優れた検出精度を示す。
論文 参考訳(メタデータ) (2025-12-15T04:58:08Z) - Divide, Conquer and Unite: Hierarchical Style-Recalibrated Prototype Alignment for Federated Medical Image Segmentation [66.82598255715696]
フェデレートラーニング(Federated Learning)は、複数の医療機関がデータを共有することなく、グローバルなモデルをトレーニングすることを可能にする。
現在のアプローチは主に、重要なマルチレベルキューを見下ろす最終層機能に重点を置いている。
我々は,ドメイン不変のコンテキスト型プロトタイプアライメントを介して特徴表現ギャップをブリッジするFedBCSを提案する。
論文 参考訳(メタデータ) (2025-11-14T04:15:34Z) - DPL: Spatial-Conditioned Diffusion Prototype Enhancement for One-Shot Medical Segmentation [0.0]
1ショットの医用画像セグメンテーションは、注釈付きデータに制限があり、患者間で解剖学的変動があるため、プロトタイプ表現の基本的な課題に直面している。
従来のプロトタイプベースの手法は、サポート機能の決定論的平均化に依存しており、堅牢な一般化に不可欠なクラス内の多様性を捉えるのに失敗する脆い表現を生成する。
拡散に基づく特徴空間探索によってプロトタイプ構築を再構築する新しいフレームワークであるDiffusion Prototype Learningを紹介する。
論文 参考訳(メタデータ) (2025-10-14T05:28:58Z) - Generalized Category Discovery in Hyperspectral Images via Prototype Subspace Modeling [42.598744707088535]
一般化されたカテゴリ発見(GCD)は、ラベルなしデータにおいて、既知のカテゴリと新しいカテゴリの両方を共同で識別しようとする。
これまでの研究は主にRGB画像に焦点を当ててきたが、その仮定とモデリング戦略は、本質的に高次元で複雑なスペクトル構造を示すハイパースペクトル画像(HSI)によく当てはまらない。
本稿では,HSIに適した最初のGCDフレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-28T18:16:59Z) - Few to Big: Prototype Expansion Network via Diffusion Learner for Point Cloud Few-shot Semantic Segmentation [12.971351926107289]
Prototype Expansion Network (PENet) は、2つのアノテートされた特徴源から大容量のプロトタイプを構築するフレームワークである。
PENetは、様々ないくつかのショット設定で最先端のメソッドを著しく上回っている。
論文 参考訳(メタデータ) (2025-09-16T09:29:46Z) - CLIP Meets Diffusion: A Synergistic Approach to Anomaly Detection [49.11819337853632]
異常検出は、異常の定義の曖昧さ、異常型の多様性、トレーニングデータの不足による複雑な問題である。
識別的基盤モデルと生成的基礎モデルの両方を活用するCLIPfusionを提案する。
本手法は, 異常検出の多面的課題に対処する上で, マルチモーダル・マルチモデル融合の有効性を裏付けるものである。
論文 参考訳(メタデータ) (2025-06-13T13:30:15Z) - Toward Multi-class Anomaly Detection: Exploring Class-aware Unified Model against Inter-class Interference [67.36605226797887]
統一型異常検出(MINT-AD)のためのマルチクラスインプリシトニューラル表現変換器を提案する。
マルチクラス分布を学習することにより、モデルが変換器デコーダのクラス対応クエリ埋め込みを生成する。
MINT-ADは、カテゴリと位置情報を特徴埋め込み空間に投影することができ、さらに分類と事前確率損失関数によって監督される。
論文 参考訳(メタデータ) (2024-03-21T08:08:31Z) - BMD: A General Class-balanced Multicentric Dynamic Prototype Strategy
for Source-free Domain Adaptation [74.93176783541332]
Source-free Domain Adaptation (SFDA)は、トレーニング済みのソースモデルを、十分にラベル付けされたソースデータにアクセスすることなく、未ラベルのターゲットドメインに適応することを目的としている。
ソースデータの欠如を補うため、既存のほとんどのメソッドは、機能プロトタイプベースの擬似ラベル戦略を導入した。
SFDAタスクのための汎用クラスベース多中心動的プロトタイプ戦略を提案する。
論文 参考訳(メタデータ) (2022-04-06T13:23:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。