論文の概要: Fast Distance-based Anomaly Detection in Images Using an Inception-like
Autoencoder
- arxiv url: http://arxiv.org/abs/2003.08731v1
- Date: Thu, 12 Mar 2020 16:10:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-24 15:17:03.348099
- Title: Fast Distance-based Anomaly Detection in Images Using an Inception-like
Autoencoder
- Title(参考訳): インセプション型オートエンコーダを用いた画像の高速距離に基づく異常検出
- Authors: Natasa Sarafijanovic-Djukic and Jesse Davis
- Abstract要約: 畳み込みオートエンコーダ(CAE)を訓練し、画像の低次元表現を抽出する。
画像の学習表現の低次元空間に距離ベースの異常検出器を用いる。
その結果,予測性能が向上した。
- 参考スコア(独自算出の注目度): 16.157879279661362
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The goal of anomaly detection is to identify examples that deviate from
normal or expected behavior. We tackle this problem for images. We consider a
two-phase approach. First, using normal examples, a convolutional autoencoder
(CAE) is trained to extract a low-dimensional representation of the images.
Here, we propose a novel architectural choice when designing the CAE, an
Inception-like CAE. It combines convolutional filters of different kernel sizes
and it uses a Global Average Pooling (GAP) operation to extract the
representations from the CAE's bottleneck layer. Second, we employ a
distanced-based anomaly detector in the low-dimensional space of the learned
representation for the images. However, instead of computing the exact
distance, we compute an approximate distance using product quantization. This
alleviates the high memory and prediction time costs of distance-based anomaly
detectors. We compare our proposed approach to a number of baselines and
state-of-the-art methods on four image datasets, and we find that our approach
resulted in improved predictive performance.
- Abstract(参考訳): 異常検出の目標は、正常または期待された行動から逸脱する例を特定することである。
我々はこの問題に画像で取り組んだ。
我々は二段階のアプローチを考える。
まず、通常例を用いて、畳み込みオートエンコーダ(CAE)を訓練し、画像の低次元表現を抽出する。
本稿では、インセプションのようなCAEを設計する際の新しいアーキテクチャ選択を提案する。
異なるカーネルサイズの畳み込みフィルタを組み合わせて、CAEのボトルネック層から表現を抽出するために、Global Average Pooling(GAP)操作を使用する。
第2に,画像の学習表現の低次元空間に距離に基づく異常検出器を用いる。
しかし、正確な距離を計算する代わりに、積量子化を用いて近似距離を計算する。
これにより、距離ベースの異常検出器の高メモリと予測時間コストが軽減される。
提案手法を4つの画像データセットのベースラインおよび最先端手法と比較し,提案手法が予測性能の向上に寄与したことを確認した。
関連論文リスト
- Multiscale Representation for Real-Time Anti-Aliasing Neural Rendering [84.37776381343662]
Mip-NeRFは、スケール情報をエンコードする円錐フラストラムとしてマルチスケール表現を提案する。
我々は,リアルタイムなアンチエイリアスレンダリングのためのマルチスケールな明示的表現であるmip voxel grids (Mip-VoG)を提案する。
私たちのアプローチは、マルチスケールのトレーニングとリアルタイムのアンチエイリアスレンダリングを同時に提供する最初の方法です。
論文 参考訳(メタデータ) (2023-04-20T04:05:22Z) - FRE: A Fast Method For Anomaly Detection And Segmentation [5.0468312081378475]
本稿では,視覚異常検出とセグメンテーション問題を解決するための原理的アプローチを提案する。
本稿では,事前学習したDNNが生み出す中間特性に対する線形統計量次元削減手法の適用について述べる。
高次元空間における原特徴と低次元縮小埋め込みの前像との差の$ell$-normのEmphfeature reconstruction error (FRE) が異常検出に極めて有効であることを示す。
論文 参考訳(メタデータ) (2022-11-23T01:03:20Z) - MLF-SC: Incorporating multi-layer features to sparse coding for anomaly
detection [2.2276675054266395]
画像の異常は、カーペットの上の小さな穴から大きな汚れまで、様々なスケールで発生する。
広く使われている異常検出方法の1つであるスパースコーディング(sparse coding)は、画像のスパース表現に使用されるパッチサイズから外れた異常を扱う際に問題となる。
本稿では,マルチスケール機能をスパース符号化に取り入れ,異常検出の性能を向上させることを提案する。
論文 参考訳(メタデータ) (2021-04-09T10:20:34Z) - CutPaste: Self-Supervised Learning for Anomaly Detection and
Localization [59.719925639875036]
通常のトレーニングデータのみを用いて異常検知器を構築するためのフレームワークを提案する。
まず、自己教師付き深層表現を学習し、学習した表現の上に生成的1クラス分類器を構築する。
MVTec異常検出データセットに関する実証研究は,提案アルゴリズムが実世界の様々な欠陥を検出可能であることを実証している。
論文 参考訳(メタデータ) (2021-04-08T19:04:55Z) - DeepI2P: Image-to-Point Cloud Registration via Deep Classification [71.3121124994105]
DeepI2Pは、イメージとポイントクラウドの間のクロスモダリティ登録のための新しいアプローチです。
本手法は,カメラとライダーの座標フレーム間の相対的剛性変換を推定する。
登録問題を分類および逆カメラ投影最適化問題に変換することで難易度を回避する。
論文 参考訳(メタデータ) (2021-04-08T04:27:32Z) - Image Restoration by Deep Projected GSURE [115.57142046076164]
Ill-posed inverse problem は、デブロアリングや超解像など、多くの画像処理アプリケーションに現れる。
本稿では,一般化されたSteinUnbiased Risk Estimator(GSURE)の「投影変換」とCNNによる潜在画像のパラメータ化を含む損失関数の最小化に基づく,新たな画像復元フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-04T08:52:46Z) - Anomaly detection through latent space restoration using
vector-quantized variational autoencoders [0.8122270502556374]
本稿では,密度と復元に基づく手法を用いた分散検出手法を提案する。
VQ-VAEモデルは、分類的潜在空間で画像をエンコードすることを学ぶ。
潜在コードの事前分布は、オートリグレッシブ(ar)モデルを使用してモデル化される。
論文 参考訳(メタデータ) (2020-12-12T09:19:59Z) - Displacement-Invariant Cost Computation for Efficient Stereo Matching [122.94051630000934]
ディープラーニング手法は、前例のない不一致の精度を得ることによって、ステレオマッチングのリーダーボードを支配してきた。
しかし、その推測時間は一般的に540p画像の秒数で遅い。
本研究では,4次元特徴量を必要としないEmphdisplacement-invariant cost moduleを提案する。
論文 参考訳(メタデータ) (2020-12-01T23:58:16Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - Towards Dense People Detection with Deep Learning and Depth images [9.376814409561726]
本稿では,1つの深度画像から複数の人物を検出するDNNシステムを提案する。
我々のニューラルネットワークは深度画像を処理し、画像座標の確率マップを出力する。
我々は、この戦略が効果的であることを示し、トレーニング中に使用するものと異なるシーンで動作するように一般化したネットワークを創出する。
論文 参考訳(メタデータ) (2020-07-14T16:43:02Z) - Optimized Feature Space Learning for Generating Efficient Binary Codes
for Image Retrieval [9.470008343329892]
本稿では,最小クラス内分散と最大クラス間分散を用いた低次元最適化特徴空間の学習手法を提案する。
生成した特徴ベクトルを、人気の反復量子化(ITQ)アプローチでバイナライズし、画像検索のために所望のビット長のバイナリコードを生成するアンサンブルネットワークを提案する。
論文 参考訳(メタデータ) (2020-01-30T15:30:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。