論文の概要: Evaluating Vision Transformer Models for Visual Quality Control in Industrial Manufacturing
- arxiv url: http://arxiv.org/abs/2411.14953v1
- Date: Fri, 22 Nov 2024 14:12:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-25 15:04:27.903657
- Title: Evaluating Vision Transformer Models for Visual Quality Control in Industrial Manufacturing
- Title(参考訳): 産業生産における視覚品質制御のための視覚変換器モデルの評価
- Authors: Miriam Alber, Christoph Hönes, Patrick Baier,
- Abstract要約: 工業生産における機械学習の最も有望なユースケースの1つは、欠陥のある製品の早期発見である。
我々は、異常検出手法とともに、現在の視覚変換器モデルを評価する。
品質管理システムに適したモデルアーキテクチャを実際に選択するためのガイドラインを提示する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: One of the most promising use-cases for machine learning in industrial manufacturing is the early detection of defective products using a quality control system. Such a system can save costs and reduces human errors due to the monotonous nature of visual inspections. Today, a rich body of research exists which employs machine learning methods to identify rare defective products in unbalanced visual quality control datasets. These methods typically rely on two components: A visual backbone to capture the features of the input image and an anomaly detection algorithm that decides if these features are within an expected distribution. With the rise of transformer architecture as visual backbones of choice, there exists now a great variety of different combinations of these two components, ranging all along the trade-off between detection quality and inference time. Facing this variety, practitioners in the field often have to spend a considerable amount of time on researching the right combination for their use-case at hand. Our contribution is to help practitioners with this choice by reviewing and evaluating current vision transformer models together with anomaly detection methods. For this, we chose SotA models of both disciplines, combined them and evaluated them towards the goal of having small, fast and efficient anomaly detection models suitable for industrial manufacturing. We evaluated the results of our experiments on the well-known MVTecAD and BTAD datasets. Moreover, we give guidelines for choosing a suitable model architecture for a quality control system in practice, considering given use-case and hardware constraints.
- Abstract(参考訳): 工業生産における機械学習の最も有望なユースケースの1つは、品質管理システムを使用して欠陥製品を早期に検出することである。
このようなシステムは、視覚検査の単調な性質により、コストを節約し、ヒューマンエラーを低減することができる。
今日では、不均衡な視覚的品質管理データセットで希少な欠陥製品を識別するために、機械学習手法を用いる、豊富な研究団体が存在する。
入力画像の特徴をキャプチャする視覚的バックボーンと、これらの特徴が期待される分布内にあるかどうかを決定する異常検出アルゴリズムである。
トランスフォーマーアーキテクチャが選択の視覚的バックボーンとして台頭した今、これらの2つのコンポーネントの組み合わせには様々な種類があり、検出品質と推論時間の間のトレードオフに沿っている。
この多様性に直面すると、現場の実践者は、手元にあるユースケースの適切な組み合わせを研究するのにかなりの時間を費やしなければならないことが多い。
我々の貢献は、現在の視覚変換器モデルと異常検出手法をレビューし、評価することで、この選択を実践する実践者を支援することである。
そこで我々は、両分野のSotAモデルを選択し、それらを組み合わせて、工業生産に適した小型で高速で効率的な異常検出モデルを構築するという目標に向けて評価した。
我々は、よく知られたMVTecADおよびBTADデータセットを用いて実験結果を評価した。
さらに,特定のユースケースやハードウェア制約を考慮して,品質制御システムに適したモデルアーキテクチャを実際に選択するためのガイドラインを提示する。
関連論文リスト
- Automated Detection of Defects on Metal Surfaces using Vision Transformers [1.6381055567716192]
深層学習技術を用いた視覚変換器(ViT)を用いた金属表面欠陥検出モデルの開発
提案モデルは,特徴抽出のためのViTを用いた欠陥の分類と局所化に焦点を当てている。
実験結果から, 自動欠陥検出, 運転効率の向上, 金属製造における誤差の低減に有効であることが示唆された。
論文 参考訳(メタデータ) (2024-10-06T10:29:45Z) - A Reliable Framework for Human-in-the-Loop Anomaly Detection in Time Series [17.08674819906415]
HILADは、人間とAIの動的かつ双方向なコラボレーションを促進するために設計された、新しいフレームワークである。
ビジュアルインターフェースを通じて、HILADはドメインの専門家に、大規模な予期せぬモデルの振る舞いを検出し、解釈し、修正する権限を与えます。
論文 参考訳(メタデータ) (2024-05-06T07:44:07Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - An Improved Anomaly Detection Model for Automated Inspection of Power Line Insulators [0.0]
電力系統の信頼性を確保するためには絶縁体の検査が重要である。
検査プロセスを自動化するために、ディープラーニングがますます活用されています。
本稿では,異常検出とオブジェクト検出の2段階的アプローチを提案する。
論文 参考訳(メタデータ) (2023-11-14T11:36:20Z) - Diffusion-based Visual Counterfactual Explanations -- Towards Systematic
Quantitative Evaluation [64.0476282000118]
視覚的対物的説明法(VCE)の最新手法は、深い生成モデルの力を利用して、印象的な画質の高次元画像の新しい例を合成する。
評価手順が大きく異なり,個々の実例の視覚検査や小規模なユーザスタディなど,これらのVCE手法の性能を比較することは,現時点では困難である。
本稿では,VCE手法の体系的,定量的評価のためのフレームワークと,使用する指標の最小セットを提案する。
論文 参考訳(メタデータ) (2023-08-11T12:22:37Z) - Component-aware anomaly detection framework for adjustable and logical
industrial visual inspection [4.444590838289701]
我々は新しいコンポーネント認識異常検出フレームワーク(ComAD)を提案する。
産業シナリオに対する調整可能かつ論理的異常検出を同時に達成することができる。
本フレームワークは,画像レベルの論理異常検出における最先端性能を実現する。
論文 参考訳(メタデータ) (2023-05-15T10:18:52Z) - Recognition of Defective Mineral Wool Using Pruned ResNet Models [88.24021148516319]
我々はミネラルウールのための視覚品質管理システムを開発した。
ウール標本のX線画像が収集され、欠陥および非欠陥サンプルのトレーニングセットが作成された。
我々は98%以上の精度のモデルを得たが、同社の現在の手順と比較すると、20%以上の欠陥製品を認識することができる。
論文 参考訳(メタデータ) (2022-11-01T13:58:02Z) - An Outlier Exposure Approach to Improve Visual Anomaly Detection
Performance for Mobile Robots [76.36017224414523]
移動ロボットの視覚異常検出システム構築の問題点を考察する。
標準異常検出モデルは、非異常データのみからなる大規模なデータセットを用いて訓練される。
本研究では,これらのデータを利用してリアルNVP異常検出モデルの性能向上を図る。
論文 参考訳(メタデータ) (2022-09-20T15:18:13Z) - Cognitive Visual Inspection Service for LCD Manufacturing Industry [80.63336968475889]
本論文では,現在FPD業界で主流となっている液晶ディスプレイ(LCD)の視覚検査システムについて述べる。
システムは、堅牢/高性能欠陥認識モデルと認知視覚検査サービスアーキテクチャの2つの基礎に基づいています。
論文 参考訳(メタデータ) (2021-01-11T08:14:35Z) - Unsupervised Anomaly Detection with Adversarial Mirrored AutoEncoders [51.691585766702744]
本稿では,識別器のミラー化ワッサースタイン損失を利用して,よりセマンティックレベルの再構築を行う逆自動エンコーダの変種を提案する。
我々は,再建基準の代替として,異常スコアの代替尺度を提案した。
提案手法は,OOD検出ベンチマークにおける異常検出の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-03-24T08:26:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。