論文の概要: CRD: Collaborative Representation Distance for Practical Anomaly
Detection
- arxiv url: http://arxiv.org/abs/2401.09443v1
- Date: Wed, 20 Dec 2023 13:47:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-22 09:26:38.510658
- Title: CRD: Collaborative Representation Distance for Practical Anomaly
Detection
- Title(参考訳): CRD:実用的異常検出のための協調表現距離
- Authors: Chao Han and Yudong Yan
- Abstract要約: パッチベースの手法では、画像は位置に応じた画像パッチの集合と見なす。
クェリイメージとストアされたパッチを最も近い場所で検索すると、時間と空間の要求からすると、O(n)$の複雑さを占有する。
本稿では,協調表現モデルを用いた画像パッチの距離計算手法を提案する。
- 参考スコア(独自算出の注目度): 2.3931689873603603
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual defect detection plays an important role in intelligent industry.
Patch based methods consider visual images as a collection of image patches
according to positions, which have stronger discriminative ability for small
defects in products, e.g. scratches on pills. However, the nearest neighbor
search for the query image and the stored patches will occupy $O(n)$ complexity
in terms of time and space requirements, posing strict challenges for
deployment in edge environments. In this paper, we propose an alternative
approach to the distance calculation of image patches via collaborative
representation models. Starting from the nearest neighbor distance with $L_0$
constraint, we relax the constraint to $L_2$ constraint and solve the distance
quickly in close-formed without actually accessing the original stored
collection of image patches. Furthermore, we point out that the main
computational burden of this close-formed solution can be pre-computed by
high-performance server before deployment. Consequently, the distance
calculation on edge devices only requires a simple matrix multiplication, which
is extremely lightweight and GPU-friendly. Performance on real industrial
scenarios demonstrates that compared to the existing state-of-the-art methods,
this distance achieves several hundred times improvement in computational
efficiency with slight performance drop, while greatly reducing memory
overhead.
- Abstract(参考訳): 視覚欠陥検出は知的産業において重要な役割を果たす。
パッチベースの手法では、画像は位置に応じた画像パッチの集合であり、例えば錠剤の傷など、製品の小さな欠陥に対してより強力な識別能力を持つ。
しかし、最も近いクエリイメージとストアドパッチの検索は、時間と空間の要求の観点からO(n)$の複雑さを占有し、エッジ環境へのデプロイには厳しい課題が生じる。
本稿では,協調表現モデルを用いた画像パッチの距離計算のための代替手法を提案する。
L_0$制約で近接する距離から始めると、制約を$L_2$制約に緩和し、元の保存されたイメージパッチのコレクションに実際にアクセスすることなく、閉じた状態での距離を素早く解決する。
さらに、この密接なソリューションの主な計算負荷は、デプロイ前に高性能サーバによって事前に計算できることを指摘した。
したがって、エッジデバイス上の距離計算は、非常に軽量でGPUフレンドリーな単純な行列乗算のみを必要とする。
実産業シナリオのパフォーマンスは、既存の最先端手法と比較して、この距離は、わずかな性能低下を伴う計算効率の数百倍の改善を実現し、メモリオーバーヘッドを大幅に低減することを示した。
関連論文リスト
- Breaking the Frame: Image Retrieval by Visual Overlap Prediction [53.17564423756082]
本稿では,隠蔽や複雑なシーンを効果的に扱う新しい視覚的位置認識手法,VOPを提案する。
提案手法は,高コストな特徴検出とマッチングを必要とせず,可視画像区間の識別を可能にする。
論文 参考訳(メタデータ) (2024-06-23T20:00:20Z) - Filling Missing Values Matters for Range Image-Based Point Cloud Segmentation [12.62718910894575]
ポイントクラウドセグメンテーション(PCS)は、ロボットの知覚とナビゲーションタスクにおいて重要な役割を果たす。
大規模屋外点雲を効率的に理解するために、その範囲画像表現が一般的である。
しかし、範囲画像の望ましくない欠落値は、物体の形状やパターンを損なう。
この問題は、オブジェクトからコヒーレントで完全な幾何学的情報を学ぶ際に、モデルにとって困難を生じさせる。
論文 参考訳(メタデータ) (2024-05-16T15:13:42Z) - CoordFill: Efficient High-Resolution Image Inpainting via Parameterized
Coordinate Querying [52.91778151771145]
本稿では,近年の連続的暗黙表現の発達により,その限界を初めて破ろうとする。
実験の結果,提案手法はGTX 2080 Ti GPUを用いて2048$times$2048の画像をリアルタイムに処理できることがわかった。
論文 参考訳(メタデータ) (2023-03-15T11:13:51Z) - PATS: Patch Area Transportation with Subdivision for Local Feature
Matching [78.67559513308787]
局所特徴マッチングは、一対のイメージ間のスパース対応を確立することを目的としている。
この問題に対処するために,PATS(Patch Area Transportation with Subdivision)を提案する。
PATSは、マッチング精度とカバレッジの両方を改善し、下流タスクにおいて優れたパフォーマンスを示す。
論文 参考訳(メタデータ) (2023-03-14T08:28:36Z) - Generating natural images with direct Patch Distributions Matching [7.99536002595393]
2つの画像におけるパッチ分布間の距離を明示的にかつ効率的に最小化するアルゴリズムを開発した。
我々の結果は、シングルイメージGANよりも優れていることが多く、トレーニングを必要とせず、数秒で高品質な画像を生成することができる。
論文 参考訳(メタデータ) (2022-03-22T16:38:52Z) - Patch-Based Stochastic Attention for Image Editing [4.8201607588546]
PatchMatchアルゴリズムをベースとした,近接する近傍近傍の同定に有効なアテンション層を提案する。
画像インペイント, ガイド画像のカラー化, シングルイメージ超解像など, 画像編集作業におけるPSALの有用性を示す。
論文 参考訳(メタデータ) (2022-02-07T13:42:00Z) - You Better Look Twice: a new perspective for designing accurate
detectors with reduced computations [56.34005280792013]
BLT-netは、新しい低計算の2段階オブジェクト検出アーキテクチャである。
非常にエレガントな第1ステージを使用して、オブジェクトをバックグラウンドから分離することで、計算を削減します。
結果のイメージ提案は、高度に正確なモデルによって第2段階で処理される。
論文 参考訳(メタデータ) (2021-07-21T12:39:51Z) - Efficient Scene Compression for Visual-based Localization [5.575448433529451]
3D再構成やシーン表現に関してカメラのポーズを推定することは、多くの複合現実とロボティクスアプリケーションにとって重要なステップである。
本研究では,制約付き二次プログラム(QP)を用いてシーン表現を圧縮する新しい手法を提案する。
公開データセットを用いた実験により,提案手法はシーン表現を高速に圧縮し,正確なポーズ推定を行うことを示す。
論文 参考訳(メタデータ) (2020-11-27T18:36:06Z) - The Power of Triply Complementary Priors for Image Compressive Sensing [89.14144796591685]
本稿では,一対の相補的な旅先を含むLRD画像モデルを提案する。
次に、画像CSのためのRDモデルに基づく新しいハイブリッド・プラグイン・アンド・プレイ・フレームワークを提案する。
そこで,提案したH-based image CS問題の解法として,単純で効果的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-16T08:17:44Z) - A Survey on Patch-based Synthesis: GPU Implementation and Optimization [0.0]
この論文は、小さな局所領域間の対応を見つけるためのパッチベースの合成とアルゴリズムの研究を調査する。
私たちが研究したアルゴリズムの1つは、PatchMatchで、画像の類似した領域や「パッチ」を見つけることができる。
コンピュータグラフィックスでは、画像から不要な物体を取り除き、画像中の物体をシームレスに移動させ、画像のアスペクト比を変え、映像の要約を行った。
論文 参考訳(メタデータ) (2020-05-11T19:25:28Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。