論文の概要: Masked Autoencoder Self Pre-Training for Defect Detection in Microelectronics
- arxiv url: http://arxiv.org/abs/2504.10021v1
- Date: Mon, 14 Apr 2025 09:25:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-15 16:51:37.735127
- Title: Masked Autoencoder Self Pre-Training for Defect Detection in Microelectronics
- Title(参考訳): マイクロエレクトロニクスにおける欠陥検出のためのマスク付きオートエンコーダの自己評価
- Authors: Nikolai Röhrich, Alwin Hoffmann, Richard Nordsieck, Emilio Zarbali, Alireza Javanmardi,
- Abstract要約: マスク付きオートエンコーダ(MAE)に基づくマイクロエレクトロニクスにおける欠陥検出のための視覚変換器(ViT)事前学習フレームワークを提案する。
過渡熱分析 (TTA) でラベル付けされた10万以下の走査型超音波顕微鏡(SAM)画像を用いて, 事前学習と欠陥検出を行う。
提案手法は,a) 教師付きViT,b) 自然言語データセット上で事前訓練されたViT,c) 文献で使用される最先端CNNベースの欠陥検出モデルと比較して,かなりの性能向上をもたらす。
- 参考スコア(独自算出の注目度): 0.7456526005219319
- License:
- Abstract: Whereas in general computer vision, transformer-based architectures have quickly become the gold standard, microelectronics defect detection still heavily relies on convolutional neural networks (CNNs). We hypothesize that this is due to the fact that a) transformers have an increased need for data and b) labelled image generation procedures for microelectronics are costly, and labelled data is therefore sparse. Whereas in other domains, pre-training on large natural image datasets can mitigate this problem, in microelectronics transfer learning is hindered due to the dissimilarity of domain data and natural images. Therefore, we evaluate self pre-training, where models are pre-trained on the target dataset, rather than another dataset. We propose a vision transformer (ViT) pre-training framework for defect detection in microelectronics based on masked autoencoders (MAE). In MAE, a large share of image patches is masked and reconstructed by the model during pre-training. We perform pre-training and defect detection using a dataset of less than 10.000 scanning acoustic microscopy (SAM) images labelled using transient thermal analysis (TTA). Our experimental results show that our approach leads to substantial performance gains compared to a) supervised ViT, b) ViT pre-trained on natural image datasets, and c) state-of-the-art CNN-based defect detection models used in the literature. Additionally, interpretability analysis reveals that our self pre-trained models, in comparison to ViT baselines, correctly focus on defect-relevant features such as cracks in the solder material. This demonstrates that our approach yields fault-specific feature representations, making our self pre-trained models viable for real-world defect detection in microelectronics.
- Abstract(参考訳): 一般的なコンピュータビジョンでは、トランスフォーマーベースのアーキテクチャが急速にゴールドスタンダードになっているが、マイクロエレクトロニクスの欠陥検出は畳み込みニューラルネットワーク(CNN)に大きく依存している。
これは事実によるものだと仮定する。
a) トランスフォーマーは、データの必要性が増し、
b) マイクロエレクトロニクスのラベル付き画像生成手順は費用がかかるため、ラベル付きデータは少ない。
他の領域では、大きな自然画像データセットの事前学習はこの問題を軽減することができるが、マイクロエレクトロニクス変換学習は、ドメインデータと自然画像の相違により妨げられる。
そこで我々は,モデルが他のデータセットではなく,対象データセット上で事前学習される自己事前学習を評価する。
マスク付きオートエンコーダ(MAE)に基づくマイクロエレクトロニクスにおける欠陥検出のための視覚変換器(ViT)事前学習フレームワークを提案する。
MAEでは、事前トレーニング中に大量の画像パッチをマスクし、モデルによって再構成する。
過渡熱分析 (TTA) を用いて, 10.000 以下の走査型超音波顕微鏡 (SAM) 画像を用いて, 事前学習および欠陥検出を行う。
実験結果から,本手法が性能向上に寄与していることが示唆された。
a) 監督されたViT
ロ 自然画像データセットに基づいて事前訓練したViT及び
c) 文献で使用されるCNNに基づく欠陥検出モデルの現状
さらに、解釈可能性分析により、我々の自己学習モデルが、ViTベースラインと比較して、ハンダ素材のひび割れなどの欠陥関連特徴に正しく焦点を合わせていることが明らかとなった。
このことは,本手法が欠陥特異的な特徴表現を生み出すことを示すものであり,マイクロエレクトロニクスにおける実世界の欠陥検出に有効であることを示す。
関連論文リスト
- MaskTerial: A Foundation Model for Automated 2D Material Flake Detection [48.73213960205105]
MaskTerialと呼ばれる深層学習モデルを提案する。このモデルでは、インスタンスセグメンテーションネットワークを用いて、2D素材のフレークを確実に識別する。
このモデルは、ラベルのないデータからリアルな顕微鏡画像を生成する合成データ生成装置を用いて、広範囲に事前訓練されている。
六方晶窒化ホウ素などの低コントラスト材料の検出において,既存の技術よりも顕著な改善が認められた。
論文 参考訳(メタデータ) (2024-12-12T15:01:39Z) - Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - Few-shot Online Anomaly Detection and Segmentation [29.693357653538474]
本稿では,難易度の高いオンライン異常検出・セグメンテーション(FOADS)の課題に対処することに焦点を当てる。
FOADSフレームワークでは、モデルを数ショットの通常のデータセットでトレーニングし、その後、正常サンプルと異常サンプルの両方を含む未ラベルのストリーミングデータを活用することで、その能力の検査と改善を行う。
限られたトレーニングサンプルを用いた性能向上のために,ImageNetで事前学習したCNNから抽出したマルチスケール特徴埋め込みを用いて,ロバストな表現を得る。
論文 参考訳(メタデータ) (2024-03-27T02:24:00Z) - Affine-Consistent Transformer for Multi-Class Cell Nuclei Detection [76.11864242047074]
本稿では, 原子核位置を直接生成する新しいアフィン一貫性変換器 (AC-Former) を提案する。
本稿では,AAT (Adaptive Affine Transformer) モジュールを導入し,ローカルネットワークトレーニングのためのオリジナル画像をワープするための重要な空間変換を自動学習する。
実験結果から,提案手法は様々なベンチマークにおいて既存の最先端アルゴリズムを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2023-10-22T02:27:02Z) - Defect Classification in Additive Manufacturing Using CNN-Based Vision
Processing [76.72662577101988]
本稿では、まず、畳み込みニューラルネットワーク(CNN)を用いて、画像データセットの欠陥をAMから第2に正確に分類し、発達した分類モデルにアクティブラーニング技術を適用する。
これにより、トレーニングデータやトレーニングデータの生成に必要なデータのサイズを削減できる、ヒューマン・イン・ザ・ループ機構の構築が可能になる。
論文 参考訳(メタデータ) (2023-07-14T14:36:58Z) - ISSTAD: Incremental Self-Supervised Learning Based on Transformer for
Anomaly Detection and Localization [12.975540251326683]
本稿では,Transformerのバックボーンネットワークに基づく新しいアプローチを提案する。
通常の画像のみに基づいてMasked Autoencoder(MAE)モデルを訓練する。
その後の段階では、劣化した正規画像を生成するためにピクセルレベルのデータ拡張技術を適用する。
このプロセスにより、モデルは破損した領域の修復方法を学び、各ピクセルの状態を分類できる。
論文 参考訳(メタデータ) (2023-03-30T13:11:26Z) - An Adversarial Active Sampling-based Data Augmentation Framework for
Manufacturable Chip Design [55.62660894625669]
リソグラフィーモデリングは、チップ設計マスクが製造可能であることを保証するため、チップ設計において重要な問題である。
機械学習の最近の進歩は、時間を要するリソグラフィーシミュレーションをディープニューラルネットワークに置き換えるための代替ソリューションを提供している。
本稿では,限られたデータのジレンマを解消し,機械学習モデルの性能を向上させるために,データ拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-27T20:53:39Z) - Benchmarking Detection Transfer Learning with Vision Transformers [60.97703494764904]
オブジェクト検出メソッドの複雑さは、ViT(Vision Transformer)モデルのような新しいアーキテクチャが到着するときに、ベンチマークを非簡単にする。
本研究では,これらの課題を克服し,標準的なVTモデルをMask R-CNNのバックボーンとして活用する訓練手法を提案する。
その結果,最近のマスキングに基づく教師なし学習手法は,COCOにおける説得力のあるトランスファー学習改善をもたらす可能性が示唆された。
論文 参考訳(メタデータ) (2021-11-22T18:59:15Z) - Performance, Successes and Limitations of Deep Learning Semantic
Segmentation of Multiple Defects in Transmission Electron Micrographs [9.237363938772479]
深層学習Mask Regional Convolutional Neural Network (Mask R-CNN)モデルを用いて, 電子顕微鏡によるFeCrAl合金の欠陥のセマンティックセグメンテーションを行う。
本稿では, 欠陥形状の予測分布, 欠陥サイズ, 欠陥同感度などの量に着目し, キーモデルの性能統計の詳細な分析を行う。
全体として、現在のモデルは、顕微鏡画像中の複数の欠陥タイプを自動解析し、定量化するための、高速で効果的なツールであることがわかった。
論文 参考訳(メタデータ) (2021-10-15T17:57:59Z) - X-ray Photon-Counting Data Correction through Deep Learning [3.535670189300134]
深層ニューラルネットワークを用いたPCDデータ補正手法を提案する。
本研究ではまず,電荷分割とパルス蓄積効果を取り入れた完全シミュレーションモデルを構築した。
シミュレーションされたPCDデータと地上の真理のデータは、PCDデータ修正のために特別に設計されたディープ・敵ネットワークに送られる。
論文 参考訳(メタデータ) (2020-07-06T23:29:16Z) - Learning-based Defect Recognition for Quasi-Periodic Microscope Images [0.0]
原子分解能顕微鏡画像からの格子欠陥の検出を支援する半教師付き機械学習手法を提案する。
これには、画像パッチを欠陥または非欠陥として分類する畳み込みニューラルネットワーク、モデルとして1つの非欠陥パッチを選択するグラフベース、そして最後に自動生成された畳み込みフィルタバンクが含まれる。
このアルゴリズムは、III-V/Si結晶材料上でテストされ、異なる測定値に対してうまく評価され、非常に小さなトレーニングデータセットであっても有望な結果を示す。
論文 参考訳(メタデータ) (2020-07-02T18:00:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。