論文の概要: A Single Image Is All You Need: Zero-Shot Anomaly Localization Without Training Data
- arxiv url: http://arxiv.org/abs/2509.18354v1
- Date: Mon, 22 Sep 2025 19:29:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-24 20:41:27.545724
- Title: A Single Image Is All You Need: Zero-Shot Anomaly Localization Without Training Data
- Title(参考訳): トレーニングデータなしで、ゼロショットの異常な位置を撮影できる画像(動画あり)
- Authors: Mehrdad Moradi, Shengzhe Chen, Hao Yan, Kamran Paynabar,
- Abstract要約: 画像内の異常検出は、通常、トレーニングデータのコレクションから学習するか、参照サンプルに依存することで対処される。
本稿では,畳み込みニューラルネットワークの帰納バイアスを利用した単一像の異常な局所化手法を提案する。
我々の手法はSingle Shot Decomposition Network (SSDnet) と呼ばれる。
- 参考スコア(独自算出の注目度): 4.861045498353029
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anomaly detection in images is typically addressed by learning from collections of training data or relying on reference samples. In many real-world scenarios, however, such training data may be unavailable, and only the test image itself is provided. We address this zero-shot setting by proposing a single-image anomaly localization method that leverages the inductive bias of convolutional neural networks, inspired by Deep Image Prior (DIP). Our method is named Single Shot Decomposition Network (SSDnet). Our key assumption is that natural images often exhibit unified textures and patterns, and that anomalies manifest as localized deviations from these repetitive or stochastic patterns. To learn the deep image prior, we design a patch-based training framework where the input image is fed directly into the network for self-reconstruction, rather than mapping random noise to the image as done in DIP. To avoid the model simply learning an identity mapping, we apply masking, patch shuffling, and small Gaussian noise. In addition, we use a perceptual loss based on inner-product similarity to capture structure beyond pixel fidelity. Our approach needs no external training data, labels, or references, and remains robust in the presence of noise or missing pixels. SSDnet achieves 0.99 AUROC and 0.60 AUPRC on MVTec-AD and 0.98 AUROC and 0.67 AUPRC on the fabric dataset, outperforming state-of-the-art methods. The implementation code will be released at https://github.com/mehrdadmoradi124/SSDnet
- Abstract(参考訳): 画像内の異常検出は、通常、トレーニングデータのコレクションから学習するか、参照サンプルに依存することで対処される。
しかし、現実の多くのシナリオでは、そのようなトレーニングデータは利用できなくなり、テスト画像のみが提供される。
このゼロショット設定には、Deep Image Prior(DIP)にインスパイアされた畳み込みニューラルネットワークの帰納バイアスを利用する、単一イメージの異常なローカライズ手法を提案する。
本手法はSingle Shot Decomposition Network (SSDnet) と呼ばれる。
我々の重要な前提は、自然画像はしばしば統合されたテクスチャとパターンを示し、異常はこれらの反復的または確率的パターンからの局所的なずれとして表されるということである。
深層画像を事前に学習するために,DIPで行ったランダムノイズを画像にマッピングするのではなく,入力画像を直接ネットワークに入力して自己再構成するパッチベースのトレーニングフレームワークを設計する。
恒等写像を単純に学習するモデルを避けるために、マスキング、パッチシャッフル、ガウス雑音を応用する。
さらに, 内積類似度に基づく知覚的損失を用いて, 画素の忠実度を超えた構造を捉える。
当社のアプローチでは、外部トレーニングデータやラベル、参照は必要とせず、ノイズや欠落したピクセルの存在下では堅牢なままです。
SSDnetはMVTec-AD上の0.99 AUROCと0.60 AUPRC、ファブリックデータセット上の0.98 AUROCと0.67 AUPRCを達成し、最先端の手法より優れている。
実装コードはhttps://github.com/mehrdadmoradi124/SSDnetでリリースされる。
関連論文リスト
- Learning Deblurring Texture Prior from Unpaired Data with Diffusion Model [92.61216319417208]
画像の劣化に対する新しい拡散モデル(DM)に基づくフレームワークを提案する。
我々の研究は、ぼやけた画像のテクスチャを回復するのに役立つ事前知識を生成するために、DMを実行する。
生成したテクスチャをフル活用するために,テクスチャ転送変換層(TTformer)を提案する。
論文 参考訳(メタデータ) (2025-07-18T01:50:31Z) - Deepfake Detection of Face Images based on a Convolutional Neural Network [0.0]
フェイクニュース、特にディープフェイク(非リアルな画像やビデオコンテンツ)は、ここ数年で深刻な話題になっている。
我々は、人間の肖像画を映し出した、このような生成および偽画像を検出するために、畳み込みニューラルネットワークに基づくモデルを構築したい。
論文 参考訳(メタデータ) (2025-03-14T13:33:22Z) - ZeroStereo: Zero-shot Stereo Matching from Single Images [17.560148513475387]
ゼロショットステレオマッチングのための新しいステレオ画像生成パイプラインであるZeroStereoを提案する。
提案手法は, 単眼深度推定モデルにより生成された擬似格差を利用して, 高品質な右画像の合成を行う。
我々のパイプラインは、Scene Flowに匹敵するデータセットボリュームで複数のデータセットにまたがる最先端のゼロショット一般化を実現する。
論文 参考訳(メタデータ) (2025-01-15T08:43:48Z) - Data Attribution for Text-to-Image Models by Unlearning Synthesized Images [71.23012718682634]
テキスト・ツー・イメージ・モデルにおけるデータ帰属の目標は、新しい画像の生成に最も影響を与えるトレーニング画像を特定することである。
合成画像の非学習をシミュレートして効率的なデータ帰属法を提案する。
次に,学習過程の終了後に有意な損失偏差を伴う訓練画像を特定し,これらを影響力のあるものとしてラベル付けする。
論文 参考訳(メタデータ) (2024-06-13T17:59:44Z) - Semantic-aware Dense Representation Learning for Remote Sensing Image
Change Detection [20.761672725633936]
ディープラーニングに基づく変化検出モデルのトレーニングはラベル付きデータに大きく依存する。
最近のトレンドは、リモートセンシング(RS)データを使用して、教師付きまたは自己教師型学習(SSL)を通じてドメイン内表現を取得することである。
複数のクラスバランス点をサンプリングし,RS画像CDに対する意味認識事前学習を提案する。
論文 参考訳(メタデータ) (2022-05-27T06:08:33Z) - Adaptive Convolutional Dictionary Network for CT Metal Artifact
Reduction [62.691996239590125]
本稿では,金属人工物削減のための適応畳み込み辞書ネットワーク(ACDNet)を提案する。
我々のACDNetは、トレーニングデータを介して、アーティファクトフリーCT画像の事前を自動で学習し、入力されたCT画像ごとに表現カーネルを適応的に調整することができる。
本手法は,モデルに基づく手法の明確な解釈可能性を継承し,学習に基づく手法の強力な表現能力を維持する。
論文 参考訳(メタデータ) (2022-05-16T06:49:36Z) - NeuralReshaper: Single-image Human-body Retouching with Deep Neural
Networks [50.40798258968408]
本稿では,深部生成ネットワークを用いた単一画像における人体の意味的再構成手法であるNeuralReshaperを提案する。
われわれのアプローチは、まずパラメトリックな3次元人間モデルと元の人間の画像とを適合させるフィッティング・セイン・リフォーム・パイプラインに従う。
ペアデータが存在しないデータ不足に対処するために,ネットワークをトレーニングするための新たな自己教師型戦略を導入する。
論文 参考訳(メタデータ) (2022-03-20T09:02:13Z) - CutPaste: Self-Supervised Learning for Anomaly Detection and
Localization [59.719925639875036]
通常のトレーニングデータのみを用いて異常検知器を構築するためのフレームワークを提案する。
まず、自己教師付き深層表現を学習し、学習した表現の上に生成的1クラス分類器を構築する。
MVTec異常検出データセットに関する実証研究は,提案アルゴリズムが実世界の様々な欠陥を検出可能であることを実証している。
論文 参考訳(メタデータ) (2021-04-08T19:04:55Z) - Shape-Texture Debiased Neural Network Training [50.6178024087048]
畳み込みニューラルネットワークは、トレーニングデータセットによって、テクスチャまたは形状にバイアスされることが多い。
形状・テクスチャ・デバイアスド学習のためのアルゴリズムを開発した。
実験により,本手法は複数の画像認識ベンチマークにおけるモデル性能の向上に成功していることが示された。
論文 参考訳(メタデータ) (2020-10-12T19:16:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。