論文の概要: Fast Distance-based Anomaly Detection in Images Using an Inception-like
Autoencoder
- arxiv url: http://arxiv.org/abs/2003.08731v1
- Date: Thu, 12 Mar 2020 16:10:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-24 15:17:03.348099
- Title: Fast Distance-based Anomaly Detection in Images Using an Inception-like
Autoencoder
- Title(参考訳): インセプション型オートエンコーダを用いた画像の高速距離に基づく異常検出
- Authors: Natasa Sarafijanovic-Djukic and Jesse Davis
- Abstract要約: 畳み込みオートエンコーダ(CAE)を訓練し、画像の低次元表現を抽出する。
画像の学習表現の低次元空間に距離ベースの異常検出器を用いる。
その結果,予測性能が向上した。
- 参考スコア(独自算出の注目度): 16.157879279661362
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The goal of anomaly detection is to identify examples that deviate from
normal or expected behavior. We tackle this problem for images. We consider a
two-phase approach. First, using normal examples, a convolutional autoencoder
(CAE) is trained to extract a low-dimensional representation of the images.
Here, we propose a novel architectural choice when designing the CAE, an
Inception-like CAE. It combines convolutional filters of different kernel sizes
and it uses a Global Average Pooling (GAP) operation to extract the
representations from the CAE's bottleneck layer. Second, we employ a
distanced-based anomaly detector in the low-dimensional space of the learned
representation for the images. However, instead of computing the exact
distance, we compute an approximate distance using product quantization. This
alleviates the high memory and prediction time costs of distance-based anomaly
detectors. We compare our proposed approach to a number of baselines and
state-of-the-art methods on four image datasets, and we find that our approach
resulted in improved predictive performance.
- Abstract(参考訳): 異常検出の目標は、正常または期待された行動から逸脱する例を特定することである。
我々はこの問題に画像で取り組んだ。
我々は二段階のアプローチを考える。
まず、通常例を用いて、畳み込みオートエンコーダ(CAE)を訓練し、画像の低次元表現を抽出する。
本稿では、インセプションのようなCAEを設計する際の新しいアーキテクチャ選択を提案する。
異なるカーネルサイズの畳み込みフィルタを組み合わせて、CAEのボトルネック層から表現を抽出するために、Global Average Pooling(GAP)操作を使用する。
第2に,画像の学習表現の低次元空間に距離に基づく異常検出器を用いる。
しかし、正確な距離を計算する代わりに、積量子化を用いて近似距離を計算する。
これにより、距離ベースの異常検出器の高メモリと予測時間コストが軽減される。
提案手法を4つの画像データセットのベースラインおよび最先端手法と比較し,提案手法が予測性能の向上に寄与したことを確認した。
関連論文リスト
- Multiscale Representation for Real-Time Anti-Aliasing Neural Rendering [84.37776381343662]
Mip-NeRFは、スケール情報をエンコードする円錐フラストラムとしてマルチスケール表現を提案する。
我々は,リアルタイムなアンチエイリアスレンダリングのためのマルチスケールな明示的表現であるmip voxel grids (Mip-VoG)を提案する。
私たちのアプローチは、マルチスケールのトレーニングとリアルタイムのアンチエイリアスレンダリングを同時に提供する最初の方法です。
論文 参考訳(メタデータ) (2023-04-20T04:05:22Z) - U-Flow: A U-shaped Normalizing Flow for Anomaly Detection with
Unsupervised Threshold [0.2578242050187029]
画像中の異常検出とセグメンテーションのための非競合手法を提案する。
現代の機械学習アプローチと、より古典的な統計的検出理論の恩恵を受けている。
どちらの指標に対しても、提案手法は最先端の結果を生成する。
論文 参考訳(メタデータ) (2022-11-22T15:43:19Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [55.52743265122446]
ディープオートエンコーダは視覚領域における異常検出のタスクに使われてきた。
我々は、訓練中に識別情報を使用することが可能な自己指導型学習体制を適用することで、この問題に対処する。
MVTec ADデータセットを用いた実験では,高い検出性能と局所化性能を示した。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - MLF-SC: Incorporating multi-layer features to sparse coding for anomaly
detection [2.2276675054266395]
画像の異常は、カーペットの上の小さな穴から大きな汚れまで、様々なスケールで発生する。
広く使われている異常検出方法の1つであるスパースコーディング(sparse coding)は、画像のスパース表現に使用されるパッチサイズから外れた異常を扱う際に問題となる。
本稿では,マルチスケール機能をスパース符号化に取り入れ,異常検出の性能を向上させることを提案する。
論文 参考訳(メタデータ) (2021-04-09T10:20:34Z) - CutPaste: Self-Supervised Learning for Anomaly Detection and
Localization [59.719925639875036]
通常のトレーニングデータのみを用いて異常検知器を構築するためのフレームワークを提案する。
まず、自己教師付き深層表現を学習し、学習した表現の上に生成的1クラス分類器を構築する。
MVTec異常検出データセットに関する実証研究は,提案アルゴリズムが実世界の様々な欠陥を検出可能であることを実証している。
論文 参考訳(メタデータ) (2021-04-08T19:04:55Z) - DeepI2P: Image-to-Point Cloud Registration via Deep Classification [71.3121124994105]
DeepI2Pは、イメージとポイントクラウドの間のクロスモダリティ登録のための新しいアプローチです。
本手法は,カメラとライダーの座標フレーム間の相対的剛性変換を推定する。
登録問題を分類および逆カメラ投影最適化問題に変換することで難易度を回避する。
論文 参考訳(メタデータ) (2021-04-08T04:27:32Z) - Image Restoration by Deep Projected GSURE [115.57142046076164]
Ill-posed inverse problem は、デブロアリングや超解像など、多くの画像処理アプリケーションに現れる。
本稿では,一般化されたSteinUnbiased Risk Estimator(GSURE)の「投影変換」とCNNによる潜在画像のパラメータ化を含む損失関数の最小化に基づく,新たな画像復元フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-04T08:52:46Z) - Anomaly detection through latent space restoration using
vector-quantized variational autoencoders [0.8122270502556374]
本稿では,密度と復元に基づく手法を用いた分散検出手法を提案する。
VQ-VAEモデルは、分類的潜在空間で画像をエンコードすることを学ぶ。
潜在コードの事前分布は、オートリグレッシブ(ar)モデルを使用してモデル化される。
論文 参考訳(メタデータ) (2020-12-12T09:19:59Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - Optimized Feature Space Learning for Generating Efficient Binary Codes
for Image Retrieval [9.470008343329892]
本稿では,最小クラス内分散と最大クラス間分散を用いた低次元最適化特徴空間の学習手法を提案する。
生成した特徴ベクトルを、人気の反復量子化(ITQ)アプローチでバイナライズし、画像検索のために所望のビット長のバイナリコードを生成するアンサンブルネットワークを提案する。
論文 参考訳(メタデータ) (2020-01-30T15:30:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。