Fugu-MT 論文翻訳(概要): Masked Autoencoder Self Pre-Training for Defect Detection in Microelectronics

論文の概要: Masked Autoencoder Self Pre-Training for Defect Detection in Microelectronics

arxiv url: http://arxiv.org/abs/2504.10021v2
Date: Tue, 12 Aug 2025 10:28:05 GMT
ステータス: 翻訳完了
システム内更新日: 2025-08-13 14:32:16.053358
Title: Masked Autoencoder Self Pre-Training for Defect Detection in Microelectronics
Title（参考訳）: マイクロエレクトロニクスにおける欠陥検出のためのマスク付きオートエンコーダの自己評価
Authors: Nikolai Röhrich, Alwin Hoffmann, Richard Nordsieck, Emilio Zarbali, Alireza Javanmardi,
Abstract要約: マイクロエレクトロニクスにおける欠陥検出のための資源効率の高いビジョントランス (ViT) 事前学習フレームワークを提案する。我々は,1万枚未満の走査型超音波顕微鏡(SAM)画像を用いて,事前学習と欠陥検出を行う。
参考スコア（独自算出の注目度）: 0.7456526005219319
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: While transformers have surpassed convolutional neural networks (CNNs) in various computer vision tasks, microelectronics defect detection still largely relies on CNNs. We hypothesize that this gap is due to the fact that a) transformers have an increased need for data and b) (labelled) image generation procedures for microelectronics are costly, and data is therefore sparse. Whereas in other domains, pre-training on large natural image datasets can mitigate this problem, in microelectronics transfer learning is hindered due to the dissimilarity of domain data and natural images. We address this challenge through self pre-training, where models are pre-trained directly on the target dataset, rather than another dataset. We propose a resource-efficient vision transformer (ViT) pre-training framework for defect detection in microelectronics based on masked autoencoders (MAE). We perform pre-training and defect detection using a dataset of less than 10,000 scanning acoustic microscopy (SAM) images. Our experimental results show that our approach leads to substantial performance gains compared to a) supervised ViT, b) ViT pre-trained on natural image datasets, and c) state-of-the-art CNN-based defect detection models used in microelectronics. Additionally, interpretability analysis reveals that our self pre-trained models attend to defect-relevant features such as cracks in the solder material, while baseline models often attend to spurious patterns. This shows that our approach yields defect-specific feature representations, resulting in more interpretable and generalizable transformer models for this data-sparse domain.
Abstract（参考訳）: トランスフォーマーは様々なコンピュータビジョンタスクにおいて畳み込みニューラルネットワーク(CNN)を超えたが、マイクロエレクトロニクスの欠陥検出は依然としてCNNに大きく依存している。このギャップは事実によるものだと仮定する。 a) トランスフォーマーは、データの必要性が増し、 b) マイクロエレクトロニクスの(遅延した)画像生成手順は費用がかかるため、データは希少である。他の領域では、大きな自然画像データセットの事前学習はこの問題を軽減することができるが、マイクロエレクトロニクス変換学習は、ドメインデータと自然画像の相違により妨げられる。モデルは他のデータセットではなく、ターゲットデータセット上で直接トレーニングされる。マスク付きオートエンコーダ(MAE)に基づくマイクロエレクトロニクスにおける欠陥検出のための資源効率の高いビジョントランスフォーマ(ViT)事前学習フレームワークを提案する。我々は,1万枚未満の走査型超音波顕微鏡(SAM)画像を用いて,事前学習と欠陥検出を行う。実験結果から,本手法が性能向上に寄与していることが示唆された。 a) 監督されたViT ロ自然画像データセットに基づいて事前訓練したViT及び c) マイクロエレクトロニクスで使用される最先端CNNベースの欠陥検出モデルさらに、解釈可能性分析により、我々の自己事前学習モデルが、ハンダ素材のひび割れなどの欠陥関連特徴に付随する一方、ベースラインモデルは、しばしば刺激的なパターンに付随することが明らかとなった。これにより, このデータスパース領域に対して, より解釈可能な, 一般化可能なトランスフォーマーモデルが得られる。

関連論文リスト

Physics Informed Generative AI Enabling Labour Free Segmentation For Microscopy Analysis [3.3176565054468714]
本稿では、シミュレーションと現実のギャップを埋めることのできる、労働自由化のための新しい枠組みを提案する。我々は、不対向画像画像変換にCycleGAN(Cycle-Consistent Generative Adversarial Network)を用いる。この合成データに特化して訓練されたU-Netモデルは、目に見えない実験画像に展開する際、顕著な一般化を示した。
論文参考訳（メタデータ） (2026-02-02T06:36:06Z)
Comparative Analysis of Deep Learning Strategies for Hypertensive Retinopathy Detection from Fundus Images: From Scratch and Pre-trained Models [5.860609259063137]
本稿では,眼底画像から高血圧性網膜症を検出するためのディープラーニング手法の比較分析を行った。我々は、カスタムCNN、トレーニング済みトランスフォーマーベースモデルのスイート、AutoMLソリューションの3つの異なるアプローチについて検討する。
論文参考訳（メタデータ） (2025-06-14T13:11:33Z)
PerFormer: A Permutation Based Vision Transformer for Remaining Useful Life Prediction [0.0]
本稿では,多変量時系列データをパーミュレートするパーフォーメーション・ベース・ビジョン・トランスフォーマー手法PerFormerを紹介する。 NASAのC-MAPSSデータセットに関する実験は、PerFormerのRUL予測における優れた性能を実証している。
論文参考訳（メタデータ） (2025-05-30T21:49:10Z)
MaskTerial: A Foundation Model for Automated 2D Material Flake Detection [48.73213960205105]
MaskTerialと呼ばれる深層学習モデルを提案する。このモデルでは、インスタンスセグメンテーションネットワークを用いて、2D素材のフレークを確実に識別する。このモデルは、ラベルのないデータからリアルな顕微鏡画像を生成する合成データ生成装置を用いて、広範囲に事前訓練されている。六方晶窒化ホウ素などの低コントラスト材料の検出において,既存の技術よりも顕著な改善が認められた。
論文参考訳（メタデータ） (2024-12-12T15:01:39Z)
Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文参考訳（メタデータ） (2024-11-28T13:04:45Z)
Few-shot Online Anomaly Detection and Segmentation [29.693357653538474]
本稿では,難易度の高いオンライン異常検出・セグメンテーション(FOADS)の課題に対処することに焦点を当てる。 FOADSフレームワークでは、モデルを数ショットの通常のデータセットでトレーニングし、その後、正常サンプルと異常サンプルの両方を含む未ラベルのストリーミングデータを活用することで、その能力の検査と改善を行う。限られたトレーニングサンプルを用いた性能向上のために,ImageNetで事前学習したCNNから抽出したマルチスケール特徴埋め込みを用いて,ロバストな表現を得る。
論文参考訳（メタデータ） (2024-03-27T02:24:00Z)
Affine-Consistent Transformer for Multi-Class Cell Nuclei Detection [76.11864242047074]
本稿では, 原子核位置を直接生成する新しいアフィン一貫性変換器 (AC-Former) を提案する。本稿では,AAT (Adaptive Affine Transformer) モジュールを導入し,ローカルネットワークトレーニングのためのオリジナル画像をワープするための重要な空間変換を自動学習する。実験結果から,提案手法は様々なベンチマークにおいて既存の最先端アルゴリズムを著しく上回ることがわかった。
論文参考訳（メタデータ） (2023-10-22T02:27:02Z)
CINFormer: Transformer network with multi-stage CNN feature injection for surface defect segmentation [73.02218479926469]
表面欠陥分割のための多段CNN特徴注入を用いた変圧器ネットワークを提案する。 CINFormerは、入力画像のマルチレベルCNN機能をエンコーダ内のトランスフォーマーネットワークの異なるステージに注入する、シンプルだが効果的な機能統合機構を提供する。さらに、CINFormerはTop-Kセルフアテンションモジュールを提供し、欠陥に関するより重要な情報を持つトークンにフォーカスする。
論文参考訳（メタデータ） (2023-09-22T06:12:02Z)
Defect Classification in Additive Manufacturing Using CNN-Based Vision Processing [76.72662577101988]
本稿では、まず、畳み込みニューラルネットワーク(CNN)を用いて、画像データセットの欠陥をAMから第2に正確に分類し、発達した分類モデルにアクティブラーニング技術を適用する。これにより、トレーニングデータやトレーニングデータの生成に必要なデータのサイズを削減できる、ヒューマン・イン・ザ・ループ機構の構築が可能になる。
論文参考訳（メタデータ） (2023-07-14T14:36:58Z)
ISSTAD: Incremental Self-Supervised Learning Based on Transformer for Anomaly Detection and Localization [12.975540251326683]
本稿では,Transformerのバックボーンネットワークに基づく新しいアプローチを提案する。通常の画像のみに基づいてMasked Autoencoder(MAE)モデルを訓練する。その後の段階では、劣化した正規画像を生成するためにピクセルレベルのデータ拡張技術を適用する。このプロセスにより、モデルは破損した領域の修復方法を学び、各ピクセルの状態を分類できる。
論文参考訳（メタデータ） (2023-03-30T13:11:26Z)
An Adversarial Active Sampling-based Data Augmentation Framework for Manufacturable Chip Design [55.62660894625669]
リソグラフィーモデリングは、チップ設計マスクが製造可能であることを保証するため、チップ設計において重要な問題である。機械学習の最近の進歩は、時間を要するリソグラフィーシミュレーションをディープニューラルネットワークに置き換えるための代替ソリューションを提供している。本稿では,限られたデータのジレンマを解消し,機械学習モデルの性能を向上させるために,データ拡張フレームワークを提案する。
論文参考訳（メタデータ） (2022-10-27T20:53:39Z)
Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文参考訳（メタデータ） (2022-06-23T14:16:30Z)
Negligible effect of brain MRI data preprocessing for tumor segmentation [36.89606202543839]
我々は3つの公開データセットの実験を行い、ディープニューラルネットワークにおける異なる前処理ステップの効果を評価する。その結果、最も一般的な標準化手順は、ネットワーク性能に何の価値も与えないことが示されている。画像の規格化に伴う信号分散の低減のため,画像強度正規化手法はモデル精度に寄与しない。
論文参考訳（メタデータ） (2022-04-11T17:29:36Z)
Self-Supervised Pre-Training for Transformer-Based Person Re-Identification [54.55281692768765]
トランスフォーマーに基づく教師付き事前訓練は、人物再識別(ReID)において大きなパフォーマンスを達成する ImageNetとReIDデータセットのドメインギャップのため、通常、パフォーマンスを高めるために、より大きなトレーニング済みデータセットが必要です。この研究は、データとモデル構造の観点から、事前トレーニングデータセットとReIDデータセットのギャップを軽減することを目的としている。
論文参考訳（メタデータ） (2021-11-23T18:59:08Z)
Benchmarking Detection Transfer Learning with Vision Transformers [60.97703494764904]
オブジェクト検出メソッドの複雑さは、ViT(Vision Transformer)モデルのような新しいアーキテクチャが到着するときに、ベンチマークを非簡単にする。本研究では,これらの課題を克服し,標準的なVTモデルをMask R-CNNのバックボーンとして活用する訓練手法を提案する。その結果,最近のマスキングに基づく教師なし学習手法は,COCOにおける説得力のあるトランスファー学習改善をもたらす可能性が示唆された。
論文参考訳（メタデータ） (2021-11-22T18:59:15Z)
Performance, Successes and Limitations of Deep Learning Semantic Segmentation of Multiple Defects in Transmission Electron Micrographs [9.237363938772479]
深層学習Mask Regional Convolutional Neural Network (Mask R-CNN)モデルを用いて, 電子顕微鏡によるFeCrAl合金の欠陥のセマンティックセグメンテーションを行う。本稿では, 欠陥形状の予測分布, 欠陥サイズ, 欠陥同感度などの量に着目し, キーモデルの性能統計の詳細な分析を行う。全体として、現在のモデルは、顕微鏡画像中の複数の欠陥タイプを自動解析し、定量化するための、高速で効果的なツールであることがわかった。
論文参考訳（メタデータ） (2021-10-15T17:57:59Z)
Intriguing Properties of Vision Transformers [114.28522466830374]
視覚変換器(ViT)は、様々なマシンビジョン問題にまたがって印象的な性能を誇示している。我々は、この問題を広範囲の実験を通して体系的に研究し、高性能畳み込みニューラルネットワーク(CNN)との比較を行った。 ViTsの効果的な特徴は、自己認識機構によって可能なフレキシブルな受容と動的場によるものであることを示す。
論文参考訳（メタデータ） (2021-05-21T17:59:18Z)
X-ray Photon-Counting Data Correction through Deep Learning [3.535670189300134]
深層ニューラルネットワークを用いたPCDデータ補正手法を提案する。本研究ではまず,電荷分割とパルス蓄積効果を取り入れた完全シミュレーションモデルを構築した。シミュレーションされたPCDデータと地上の真理のデータは、PCDデータ修正のために特別に設計されたディープ・敵ネットワークに送られる。
論文参考訳（メタデータ） (2020-07-06T23:29:16Z)
Learning-based Defect Recognition for Quasi-Periodic Microscope Images [0.0]
原子分解能顕微鏡画像からの格子欠陥の検出を支援する半教師付き機械学習手法を提案する。これには、画像パッチを欠陥または非欠陥として分類する畳み込みニューラルネットワーク、モデルとして1つの非欠陥パッチを選択するグラフベース、そして最後に自動生成された畳み込みフィルタバンクが含まれる。このアルゴリズムは、III-V/Si結晶材料上でテストされ、異なる測定値に対してうまく評価され、非常に小さなトレーニングデータセットであっても有望な結果を示す。
論文参考訳（メタデータ） (2020-07-02T18:00:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。