論文の概要: Investigating Shift Equivalence of Convolutional Neural Networks in
Industrial Defect Segmentation
- arxiv url: http://arxiv.org/abs/2309.16902v1
- Date: Fri, 29 Sep 2023 00:04:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-02 15:55:52.819551
- Title: Investigating Shift Equivalence of Convolutional Neural Networks in
Industrial Defect Segmentation
- Title(参考訳): 産業欠陥分割における畳み込みニューラルネットワークのシフト等価性の検討
- Authors: Zhen Qu, Xian Tao, Fei Shen, Zhengtao Zhang, Tao Li
- Abstract要約: 産業欠陥分割タスクでは、モデルの出力整合性(等価性とも呼ばれる)がしばしば見過ごされる。
CNNにおける従来のサンプリングレイヤの代替として,コンポーネントアテンション多相サンプリング(CAPS)と呼ばれる新しいダウン/アップサンプリング層が提案されている。
マイクロサーフェス欠陥(MSD)データセットと4つの実世界の産業的欠陥データセットの実験結果から,提案手法は高い等価性とセグメンテーション性能を示すことが示された。
- 参考スコア(独自算出の注目度): 3.843350895842836
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In industrial defect segmentation tasks, while pixel accuracy and
Intersection over Union (IoU) are commonly employed metrics to assess
segmentation performance, the output consistency (also referred to equivalence)
of the model is often overlooked. Even a small shift in the input image can
yield significant fluctuations in the segmentation results. Existing
methodologies primarily focus on data augmentation or anti-aliasing to enhance
the network's robustness against translational transformations, but their shift
equivalence performs poorly on the test set or is susceptible to nonlinear
activation functions. Additionally, the variations in boundaries resulting from
the translation of input images are consistently disregarded, thus imposing
further limitations on the shift equivalence. In response to this particular
challenge, a novel pair of down/upsampling layers called component attention
polyphase sampling (CAPS) is proposed as a replacement for the conventional
sampling layers in CNNs. To mitigate the effect of image boundary variations on
the equivalence, an adaptive windowing module is designed in CAPS to adaptively
filter out the border pixels of the image. Furthermore, a component attention
module is proposed to fuse all downsampled features to improve the segmentation
performance. The experimental results on the micro surface defect (MSD) dataset
and four real-world industrial defect datasets demonstrate that the proposed
method exhibits higher equivalence and segmentation performance compared to
other state-of-the-art methods.Our code will be available at
https://github.com/xiaozhen228/CAPS.
- Abstract(参考訳): 産業欠陥セグメンテーションタスクでは、ピクセル精度とIoU(Intersection over Union)が一般的にセグメンテーション性能を評価するために使用されるが、モデルの出力一貫性(等価性とも呼ばれる)はしばしば見過ごされる。
入力画像の小さなシフトであっても、セグメンテーション結果にかなりの変動をもたらす可能性がある。
既存の手法は主にデータ拡張やアンチエイリアスに焦点をあてて、翻訳変換に対するネットワークの堅牢性を高めるが、それらのシフト等価性はテストセットでは不十分である。
さらに、入力画像の変換による境界の変化は一貫して無視されるため、シフト等価性にさらなる制限が課される。
この課題に対応するために,cnnにおける従来のサンプリング層の代替として,コンポーネント・アテンション・ポリフェーズサンプリング(caps)と呼ばれる新しい一対のダウン・アップサンプリング層が提案されている。
画像境界変動が等価性に与える影響を軽減するため、適応ウィンドウモジュールをCAPSで設計し、画像の境界画素を適応的にフィルタリングする。
さらに,すべてのダウンサンプリング機能を融合してセグメンテーション性能を向上させるコンポーネントアテンションモジュールを提案する。
マイクロサーフェス欠陥(msd)データセットと4つの実世界の産業的欠陥データセットの実験結果は、提案手法が他の最先端手法に比べて高い等価性とセグメンテーション性能を示すことを示している。
関連論文リスト
- PseudoNeg-MAE: Self-Supervised Point Cloud Learning using Conditional Pseudo-Negative Embeddings [55.55445978692678]
PseudoNeg-MAEは,ポイントマスク自動エンコーダのグローバルな特徴表現を強化する,自己教師型学習フレームワークである。
PseudoNeg-MAE は ModelNet40 と ScanObjectNN のデータセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-09-24T07:57:21Z) - Change-Aware Siamese Network for Surface Defects Segmentation under Complex Background [0.6407952035735353]
変更検出フレームワークにおける欠陥セグメント化を解消する変更対応のSiameseネットワークを提案する。
トランスフォーマーベースのエンコーダを導くために,新しいマルチクラスのコントラスト損失を導入した。
距離マップで示される差分は、変更対応デコーダにスキップ接続され、クラス間およびクラス外の両方の欠陥の位置をアシストする。
論文 参考訳(メタデータ) (2024-09-01T02:48:11Z) - Improving Shift Invariance in Convolutional Neural Networks with Translation Invariant Polyphase Sampling [14.731788603429774]
ダウンサンプリング演算子は畳み込みニューラルネットワーク(CNN)のシフト不変性を破る
翻訳不変多相サンプリング(TIPS)と呼ばれる学習可能なプーリング演算子を提案する。
TIPSは精度、シフト一貫性、シフト忠実度で一貫したパフォーマンス向上をもたらす。
論文 参考訳(メタデータ) (2024-04-11T00:49:38Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - Adapting the Hypersphere Loss Function from Anomaly Detection to Anomaly
Segmentation [1.9458156037869137]
完全畳み込みデータ記述(FCDD)の漸進的改善を提案する。
FCDDは、異常検出から画像異常セグメンテーション(すなわち異常局在)への一級分類アプローチの適応である
我々は、元の損失関数を解析し、前任のハイパースフィア(HSC)によく似た代替関数を提案する。
論文 参考訳(メタデータ) (2023-01-23T18:06:35Z) - Treatment Learning Causal Transformer for Noisy Image Classification [62.639851972495094]
本研究では,この2値情報「ノイズの存在」を画像分類タスクに組み込んで予測精度を向上させる。
因果的変動推定から動機付け,雑音画像分類のための頑健な特徴表現を潜在生成モデルを用いて推定するトランスフォーマーに基づくアーキテクチャを提案する。
また、パフォーマンスベンチマークのための幅広いノイズ要素を取り入れた、新しいノイズの多い画像データセットも作成する。
論文 参考訳(メタデータ) (2022-03-29T13:07:53Z) - Dispensed Transformer Network for Unsupervised Domain Adaptation [21.256375606219073]
本稿では,新しい非教師付き領域適応 (UDA) 方式であるディスペンデントトランスフォーマーネットワーク (DTNet) について述べる。
提案するネットワークは,いくつかの最先端技術と比較して,最高の性能を実現している。
論文 参考訳(メタデータ) (2021-10-28T08:27:44Z) - TFill: Image Completion via a Transformer-Based Architecture [69.62228639870114]
画像補完を無方向性シーケンス対シーケンス予測タスクとして扱うことを提案する。
トークン表現には,小かつ重複しないRFを持つ制限型CNNを用いる。
第2フェーズでは、可視領域と発生領域の外観整合性を向上させるために、新しい注意認識層(aal)を導入する。
論文 参考訳(メタデータ) (2021-04-02T01:42:01Z) - Self-supervised Equivariant Attention Mechanism for Weakly Supervised
Semantic Segmentation [93.83369981759996]
本稿では,自己監督同変注意機構(SEAM)を提案する。
本手法は,完全教師付きセマンティックセグメンテーションにおいて,同値が暗黙の制約であることを示す。
本稿では,ネットワーク学習のための自己スーパービジョンを提供するために,様々な変換画像から予測されたCAMの整合性正則化を提案する。
論文 参考訳(メタデータ) (2020-04-09T14:57:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。