論文の概要: Anomaly Clustering: Grouping Images into Coherent Clusters of Anomaly
Types
- arxiv url: http://arxiv.org/abs/2112.11573v1
- Date: Tue, 21 Dec 2021 23:11:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-23 23:27:37.013402
- Title: Anomaly Clustering: Grouping Images into Coherent Clusters of Anomaly
Types
- Title(参考訳): 異常クラスタリング: 異常タイプのコヒーレントクラスタにイメージをグループ化する
- Authors: Kihyuk Sohn, Jinsung Yoon, Chun-Liang Li, Chen-Yu Lee, Tomas Pfister
- Abstract要約: 我々は異常クラスタリングを導入し、その目標はデータを異常型の一貫性のあるクラスタにまとめることである。
これは異常検出とは違い、その目標は異常を通常のデータから分割することである。
パッチベースの事前訓練されたディープ埋め込みとオフザシェルフクラスタリング手法を用いた,単純で効果的なクラスタリングフレームワークを提案する。
- 参考スコア(独自算出の注目度): 60.45942774425782
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce anomaly clustering, whose goal is to group data into
semantically coherent clusters of anomaly types. This is different from anomaly
detection, whose goal is to divide anomalies from normal data. Unlike
object-centered image clustering applications, anomaly clustering is
particularly challenging as anomalous patterns are subtle and local. We present
a simple yet effective clustering framework using a patch-based pretrained deep
embeddings and off-the-shelf clustering methods. We define a distance function
between images, each of which is represented as a bag of embeddings, by the
Euclidean distance between weighted averaged embeddings. The weight defines the
importance of instances (i.e., patch embeddings) in the bag, which may
highlight defective regions. We compute weights in an unsupervised way or in a
semi-supervised way if labeled normal data is available. Extensive experimental
studies show the effectiveness of the proposed clustering framework along with
a novel distance function upon existing multiple instance or deep clustering
frameworks. Overall, our framework achieves 0.451 and 0.674 normalized mutual
information scores on MVTec object and texture categories and further improve
with a few labeled normal data (0.577, 0.669), far exceeding the baselines
(0.244, 0.273) or state-of-the-art deep clustering methods (0.176, 0.277).
- Abstract(参考訳): 我々は,データを意味的にコヒーレントなanomaly型クラスタにグループ化することを目的としたanomaly clusteringを導入する。
これは異常検出とは違い、その目標は異常を通常のデータから分割することである。
オブジェクト中心の画像クラスタリングアプリケーションとは異なり、異常なパターンが微妙で局所的であるため、異常クラスタリングは特に難しい。
パッチベースの事前訓練されたディープ埋め込みとオフザシェルフクラスタリング手法を用いた,単純で効果的なクラスタリングフレームワークを提案する。
重み付き平均埋め込み間のユークリッド距離によって、それぞれが埋め込みの袋として表現される画像間の距離関数を定義する。
重みはバッグ内のインスタンス(すなわちパッチ埋め込み)の重要性を定義し、欠陥のある領域を強調する。
ラベル付き正規データが利用可能な場合、ウェイトを教師なしまたは半教師付きで計算する。
大規模実験により、既存の複数インスタンスまたはディープクラスタリングフレームワークに対する新しい距離関数とともに、提案するクラスタリングフレームワークの有効性が示されている。
全体として,MVTecオブジェクトおよびテクスチャカテゴリの正規化相互情報スコア0.451,0.674を達成し,さらにいくつかのラベル付き正規データ(0.577,0.669)を改良し,ベースライン(0.244,0.273)や最先端の深層クラスタリング手法(0.176,0.277)をはるかに上回った。
関連論文リスト
- Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - A Computational Theory and Semi-Supervised Algorithm for Clustering [0.0]
半教師付きクラスタリングアルゴリズムを提案する。
クラスタリング法のカーネルは、Mohammadの異常検出アルゴリズムである。
結果は、合成および実世界のデータセットで示される。
論文 参考訳(メタデータ) (2023-06-12T09:15:58Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Hard Regularization to Prevent Deep Online Clustering Collapse without
Data Augmentation [65.268245109828]
オンラインディープクラスタリング(オンラインディープクラスタリング)とは、機能抽出ネットワークとクラスタリングモデルを組み合わせて、クラスタラベルを処理された各新しいデータポイントまたはバッチに割り当てることである。
オフラインメソッドよりも高速で汎用性が高いが、オンラインクラスタリングは、エンコーダがすべての入力を同じポイントにマッピングし、すべてを単一のクラスタに配置する、崩壊したソリューションに容易に到達することができる。
本稿では,データ拡張を必要としない手法を提案する。
論文 参考訳(メタデータ) (2023-03-29T08:23:26Z) - Contrastive Hierarchical Clustering [8.068701201341065]
CoHiClustは、ディープニューラルネットワークに基づくContrastive Hierarchical Clusteringモデルである。
自己教師付き学習アプローチを採用することで、CoHiClustは、ラベル付きデータにアクセスせずに、ベースネットワークをバイナリツリーに蒸留する。
論文 参考訳(メタデータ) (2023-03-03T07:54:19Z) - Inv-SENnet: Invariant Self Expression Network for clustering under
biased data [17.25929452126843]
本研究では,各サブ空間におけるデータポイントのクラスタ化を学習しながら,不要な属性(バイアス)を共同で除去する新しいフレームワークを提案する。
合成および実世界のデータセットに対する実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2022-11-13T01:19:06Z) - On Mitigating Hard Clusters for Face Clustering [48.39472979642971]
顔クラスタリングは、大規模な未ラベルの顔画像を使用して顔認識システムをスケールアップするための有望な方法である。
我々はNDDe(Neighborhood-Diffusion-based Density)とTPDi(Transition-Probability-based Distance)の2つの新しいモジュールを紹介した。
複数のベンチマーク実験により,各モジュールが最終性能に寄与することが示された。
論文 参考訳(メタデータ) (2022-07-25T03:55:15Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Spectral Clustering with Smooth Tiny Clusters [14.483043753721256]
本稿では,データのスムーズさを初めて考慮した新しいクラスタリングアルゴリズムを提案する。
私たちのキーとなるアイデアは、スムーズなグラフを構成する小さなクラスタをクラスタ化することです。
本稿では,マルチスケールな状況に着目するが,データのスムーズさの考え方はどのクラスタリングアルゴリズムにも確実に拡張できる。
論文 参考訳(メタデータ) (2020-09-10T05:21:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。