論文の概要: Learning to Be a Transformer to Pinpoint Anomalies
- arxiv url: http://arxiv.org/abs/2407.04092v3
- Date: Thu, 26 Jun 2025 17:59:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-27 19:53:09.763238
- Title: Learning to Be a Transformer to Pinpoint Anomalies
- Title(参考訳): 変圧器からピンポイント異常への学習
- Authors: Alex Costanzino, Pierluigi Zama Ramirez, Giuseppe Lisanti, Luigi Di Stefano,
- Abstract要約: 最近の産業異常検出およびIADS(Industrial Anomaly Detection and (IADS))は、224x224ピクセルなどの低解像度画像を処理する。
本稿では,高精細な入力画像を非常に効率的に処理しながら,強い事前学習機能を活用する新しい教師-学生パラダイムを提案する。
提案手法では,高解像度画像から異常を検出でき,競合他社よりも高速に動作可能である。
- 参考スコア(独自算出の注目度): 12.442574943138794
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: To efficiently deploy strong, often pre-trained feature extractors, recent Industrial Anomaly Detection and Segmentation (IADS) methods process low-resolution images, e.g., 224x224 pixels, obtained by downsampling the original input images. However, while numerous industrial applications demand the identification of both large and small defects, downsampling the input image to a low resolution may hinder a method's ability to pinpoint tiny anomalies. We propose a novel Teacher--Student paradigm to leverage strong pre-trained features while processing high-resolution input images very efficiently. The core idea concerns training two shallow MLPs (the Students) by nominal images so as to mimic the mappings between the patch embeddings induced by the self-attention layers of a frozen vision Transformer (the Teacher). Indeed, learning these mappings sets forth a challenging pretext task that small-capacity models are unlikely to accomplish on out-of-distribution data such as anomalous images. Our method can spot anomalies from high-resolution images and runs way faster than competitors, achieving state-of-the-art performance on MVTec AD and the best segmentation results on VisA. We also propose novel evaluation metrics to capture robustness to defect size, i.e., the ability to preserve good localisation from large anomalies to tiny ones. Evaluating our method also by these metrics reveals its neatly superior performance.
- Abstract(参考訳): 近年のIADS(Industrial Anomaly Detection and Segmentation)法では,高精細度,高精細度,高精細度,高精細,高精細,高精細,高精細,高精細,高精細,高精細,高精細,高精細,高精細,高精細,高精細,高精細,高精細,高精細,高精細,高精細,高精細,高精細,高精細,高精細,高精細,高精細,高精細な。
しかし、多くの産業アプリケーションでは、大きな欠陥と小さな欠陥の両方を識別する必要があるが、入力画像の低解像度化は、小さな異常を特定できない可能性がある。
本稿では,高精細な入力画像を非常に効率的に処理しながら,強い事前学習機能を活用する新しい教師-学生パラダイムを提案する。
その中核となる考え方は、凍結した視覚変換器(教師)の自己保持層によって誘導されるパッチ埋め込み間のマッピングを模倣するために、名目で2つの浅いMLP(学生)を訓練することである。
実際、これらのマッピングを学習することは、異常な画像のような配布外データで小さな容量のモデルが達成できないという難しい前提条件を課す。
提案手法は,高解像度画像から異常を検出し,競合他社よりも高速に動作し,MVTec ADの最先端性能とVisAの最良のセグメンテーション結果が得られる。
また,欠陥サイズに対するロバスト性,すなわち,大きな異常から小さな異常まで良好な局所性を維持する能力を捉えるための新しい評価指標を提案する。
これらの測定値による手法の評価も,その優れた性能を示している。
関連論文リスト
- PETALface: Parameter Efficient Transfer Learning for Low-resolution Face Recognition [54.642714288448744]
PETALfaceは、PEFTのパワーを低解像度の顔認識に活用した最初の作品である。
バックボーンに2つの低ランク適応モジュールを導入し、入力画像の品質に基づいて重みを調整し、ギャラリーとプローブ画像の品質の違いを考慮に入れた。
実験により,提案手法は高分解能・混合品質データセットの性能を保ちながら,低分解能データセットの完全な微調整よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-12-10T18:59:45Z) - HiRes-LLaVA: Restoring Fragmentation Input in High-Resolution Large Vision-Language Models [96.76995840807615]
HiRes-LLaVAは、元の文脈情報や幾何学的情報を変更することなく、高解像度入力のサイズを処理するように設計された新しいフレームワークである。
HiRes-LLaVAは、2つの革新的なコンポーネントで構成されている: (i)スライスしたパッチを元の形式に再構築し、ダウンアップサンプリング層と畳み込み層を通じてグローバルとローカルの両方の特徴を効率的に抽出するSliceRestoreアダプタ、(ii)自分自身に基づいてビジョントークンを圧縮するセルフマイニングサンプリング。
論文 参考訳(メタデータ) (2024-07-11T17:42:17Z) - Feature Attenuation of Defective Representation Can Resolve Incomplete Masking on Anomaly Detection [1.0358639819750703]
教師なし異常検出(UAD)研究では、計算効率が高くスケーラブルなソリューションを開発する必要がある。
再建・塗り替えのアプローチを再考し、強みと弱みを分析して改善する。
異常再構成の特徴情報を減衰させる2つの層のみを用いるFADeR(Feature Attenuation of Defective Representation)を提案する。
論文 参考訳(メタデータ) (2024-07-05T15:44:53Z) - SOEDiff: Efficient Distillation for Small Object Editing [9.876242696640205]
スモールオブジェクト編集(SOE)と呼ばれる新しいタスクは、制約のある小さな領域におけるテキストベースの画像の描画に焦点を当てている。
小型オブジェクトの編集におけるStableDiffusionのようなベースラインモデルの性能向上を目的とした,新たなトレーニングベースアプローチであるSOEDiffを導入する。
提案手法は,MSCOCOとOpenImageから収集したテストデータセットに大きな改善をもたらす。
論文 参考訳(メタデータ) (2024-05-15T06:14:31Z) - MoE-FFD: Mixture of Experts for Generalized and Parameter-Efficient Face Forgery Detection [54.545054873239295]
ディープフェイクは、最近、国民の間で重大な信頼問題とセキュリティ上の懸念を提起した。
ViT法はトランスの表現性を生かし,優れた検出性能を実現する。
この研究は、汎用的でパラメータ効率のよいViTベースのアプローチであるFace Forgery Detection (MoE-FFD)のためのMixture-of-Expertsモジュールを導入する。
論文 参考訳(メタデータ) (2024-04-12T13:02:08Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Learning from Multi-Perception Features for Real-Word Image
Super-resolution [87.71135803794519]
入力画像の複数の知覚的特徴を利用する新しいSR手法MPF-Netを提案する。
本稿では,MPFEモジュールを組み込んで,多様な知覚情報を抽出する手法を提案する。
また、モデルの学習能力を向上する対照的な正規化項(CR)も導入する。
論文 参考訳(メタデータ) (2023-05-26T07:35:49Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - Multi-Scale Aligned Distillation for Low-Resolution Detection [68.96325141432078]
本稿では,高分解能モデルや多分解能モデルから知識を抽出することで,低分解能モデルの性能を向上させることに焦点を当てる。
いくつかのインスタンスレベルの検出タスクとデータセットにおいて,本手法を用いて訓練された低解像度モデルと,従来のマルチスケールトレーニングによる訓練された高解像度モデルとを競合的に処理する。
論文 参考訳(メタデータ) (2021-09-14T12:53:35Z) - Same Same But DifferNet: Semi-Supervised Defect Detection with
Normalizing Flows [24.734388664558708]
畳み込みニューラルネットワークによって抽出された特徴の記述性を利用して、その密度を推定する。
これらの可能性に基づいて、欠陥を示すスコアリング関数を開発する。
本稿では,新しいMVTec ADとMagnetic Tile Defectsデータセットに対する既存のアプローチよりも優れた性能を示す。
論文 参考訳(メタデータ) (2020-08-28T10:49:28Z) - Feature Super-Resolution Based Facial Expression Recognition for
Multi-scale Low-Resolution Faces [7.634398926381845]
超解像法はしばしば低分解能画像の高精細化に使用されるが、FERタスクの性能は極低分解能画像では制限される。
本研究では,物体検出のための特徴的超解像法に触発されて,頑健な表情認識のための新たな生成逆ネットワークに基づく超解像法を提案する。
論文 参考訳(メタデータ) (2020-04-05T15:38:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。