論文の概要: Focus the Discrepancy: Intra- and Inter-Correlation Learning for Image
Anomaly Detection
- arxiv url: http://arxiv.org/abs/2308.02983v1
- Date: Sun, 6 Aug 2023 01:30:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-08 17:31:02.068511
- Title: Focus the Discrepancy: Intra- and Inter-Correlation Learning for Image
Anomaly Detection
- Title(参考訳): 画像異常検出のための相関内および相関間学習
- Authors: Xincheng Yao and Ruoqi Li and Zefeng Qian and Yan Luo and Chongyang
Zhang
- Abstract要約: FOD(FOcus-the-Discrepancy)は、異常のパッチワイド、イントラ・イントラ・インター・ディレクレンシーを同時に検出することができる。
本稿では,新たなADフレームワークであるFOcus-the-Discrepancy(FOD)を提案する。
- 参考スコア(独自算出の注目度): 13.801572236048601
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humans recognize anomalies through two aspects: larger patch-wise
representation discrepancies and weaker patch-to-normal-patch correlations.
However, the previous AD methods didn't sufficiently combine the two
complementary aspects to design AD models. To this end, we find that
Transformer can ideally satisfy the two aspects as its great power in the
unified modeling of patch-wise representations and patch-to-patch correlations.
In this paper, we propose a novel AD framework: FOcus-the-Discrepancy (FOD),
which can simultaneously spot the patch-wise, intra- and inter-discrepancies of
anomalies. The major characteristic of our method is that we renovate the
self-attention maps in transformers to Intra-Inter-Correlation (I2Correlation).
The I2Correlation contains a two-branch structure to first explicitly establish
intra- and inter-image correlations, and then fuses the features of two-branch
to spotlight the abnormal patterns. To learn the intra- and inter-correlations
adaptively, we propose the RBF-kernel-based target-correlations as learning
targets for self-supervised learning. Besides, we introduce an entropy
constraint strategy to solve the mode collapse issue in optimization and
further amplify the normal-abnormal distinguishability. Extensive experiments
on three unsupervised real-world AD benchmarks show the superior performance of
our approach. Code will be available at https://github.com/xcyao00/FOD.
- Abstract(参考訳): 人間は2つの側面を通して異常を認識する:より大きなパッチ単位の表現の不一致とより弱いパッチ対正規パッチの相関。
しかし、以前のAD方式はADモデルを設計する2つの相補的な側面を十分に組み合わせていなかった。
この目的のために、transformerはパッチ毎の表現とパッチ対パッチの相関の統一モデリングにおいて、その大きな力として2つの側面を理想的に満たせることを見出します。
本稿では,新たなADフレームワークであるFOcus-the-Discrepancy(FOD)を提案する。
本手法の主な特徴は, トランスフォーマタにおける自己アテンションマップを相互相関(i2相関)に再構成することである。
i2相関は、まず画像内および画像間相関を明示的に確立し、次に2分岐の特徴を融合して異常パターンをスポットライトする2分岐構造を含む。
自己教師付き学習のための学習目標として,rbf-kernelに基づく目標相関を提案する。
さらに,最適化におけるモード崩壊問題を解くためのエントロピー制約戦略を導入し,正常-異常判別性をさらに増幅する。
3つの非教師付き実世界のADベンチマークに対する大規模な実験は、我々のアプローチの優れた性能を示している。
コードはhttps://github.com/xcyao00/fodで入手できる。
関連論文リスト
- Relation DETR: Exploring Explicit Position Relation Prior for Object Detection [26.03892270020559]
本稿では,DETR(Detection TRansformer)の収束性と性能を向上させる手法を提案する。
我々の手法であるRelation-DETRは、プログレッシブ・アテンション・リファインメントのための位置関係埋め込みを構築するエンコーダを導入している。
汎用データセットとタスク固有のデータセットの両方の実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2024-07-16T13:17:07Z) - Fully Differentiable Correlation-driven 2D/3D Registration for X-ray to CT Image Fusion [3.868072865207522]
画像ベース剛性2D/3Dレジストレーションは, 蛍光ガイド下外科手術において重要な技術である。
デュアルブランチCNN変換器エンコーダを用いた完全微分型相関型ネットワークを提案する。
組込み情報に基づく低周波特徴と高周波特徴の分解に対して相関型損失を提案する。
論文 参考訳(メタデータ) (2024-02-04T14:12:51Z) - Forgery-aware Adaptive Transformer for Generalizable Synthetic Image
Detection [106.39544368711427]
本研究では,様々な生成手法から偽画像を検出することを目的とした,一般化可能な合成画像検出の課題について検討する。
本稿では,FatFormerという新しいフォージェリー適応トランスフォーマー手法を提案する。
提案手法は, 平均98%の精度でGANを観測し, 95%の精度で拡散モデルを解析した。
論文 参考訳(メタデータ) (2023-12-27T17:36:32Z) - Fourier Test-time Adaptation with Multi-level Consistency for Robust
Classification [10.291631977766672]
本稿では,Fourier Test-Time Adaptation (FTTA) と呼ばれる新しい手法を提案する。
FTTAは、予測の自己監督を行うために、ペア入力の信頼性の高い多レベル整合性測定を構築する。
異なる形態と器官を持つ3つの大きな分類データセットで広範囲に検証された。
論文 参考訳(メタデータ) (2023-06-05T02:29:38Z) - Exploring Consistency in Cross-Domain Transformer for Domain Adaptive
Semantic Segmentation [51.10389829070684]
ドメインギャップは、自己注意の相違を引き起こす可能性がある。
このギャップのため、変圧器は、ターゲット領域の精度を低下させる刺激領域または画素に付随する。
ドメイン横断の注意層を持つアテンションマップに適応する。
論文 参考訳(メタデータ) (2022-11-27T02:40:33Z) - Interpolation-based Correlation Reduction Network for Semi-Supervised
Graph Learning [49.94816548023729]
補間型相関低減ネットワーク(ICRN)と呼ばれる新しいグラフコントラスト学習手法を提案する。
提案手法では,決定境界のマージンを大きくすることで,潜在特徴の識別能力を向上させる。
この2つの設定を組み合わせることで、豊富なラベル付きノードと稀に価値あるラベル付きノードから豊富な監視情報を抽出し、離散表現学習を行う。
論文 参考訳(メタデータ) (2022-06-06T14:26:34Z) - Relation Matters: Foreground-aware Graph-based Relational Reasoning for
Domain Adaptive Object Detection [81.07378219410182]
我々は、FGRR(Fearground-aware Graph-based Reasoning)というドメインDのための新しい汎用フレームワークを提案する。
FGRRはグラフ構造を検出パイプラインに組み込んで、ドメイン内およびドメイン間フォアグラウンドオブジェクト関係を明示的にモデル化する。
実験の結果、提案したFGRRは4つのDomainDベンチマークの最先端よりも優れていることが示された。
論文 参考訳(メタデータ) (2022-06-06T05:12:48Z) - Short Range Correlation Transformer for Occluded Person
Re-Identification [4.339510167603376]
PFTと呼ばれる部分的特徴変換器に基づく人物識別フレームワークを提案する。
提案したPFTは3つのモジュールを用いて視覚変換器の効率を向上する。
包括的および包括的再同定データセットに対する実験結果から,提案したPFTネットワークが一貫した性能を実現することを示す。
論文 参考訳(メタデータ) (2022-01-04T11:12:39Z) - Semantic Correspondence with Transformers [68.37049687360705]
本稿では,変換器を用いたコストアグリゲーション(CAT)を提案し,意味論的に類似した画像間の密接な対応を見出す。
初期相関マップと多レベルアグリゲーションを曖昧にするための外観親和性モデリングを含む。
提案手法の有効性を示す実験を行い,広範囲にわたるアブレーション研究を行った。
論文 参考訳(メタデータ) (2021-06-04T14:39:03Z) - Attentive WaveBlock: Complementarity-enhanced Mutual Networks for
Unsupervised Domain Adaptation in Person Re-identification and Beyond [97.25179345878443]
本稿では,新しい軽量モジュールであるAttentive WaveBlock (AWB)を提案する。
AWBは相互学習の二重ネットワークに統合され、相互学習の相補性を高め、擬似ラベルのノイズをさらに抑えることができる。
実験により, 提案手法は, 複数のUDA人物再識別タスクを大幅に改善し, 最先端の性能を達成できることが実証された。
論文 参考訳(メタデータ) (2020-06-11T15:40:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。