論文の概要: A Survey on Foundation-Model-Based Industrial Defect Detection
- arxiv url: http://arxiv.org/abs/2502.19106v2
- Date: Thu, 27 Feb 2025 08:28:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-28 11:31:36.818898
- Title: A Survey on Foundation-Model-Based Industrial Defect Detection
- Title(参考訳): 基礎モデルに基づく産業欠陥検出に関する調査研究
- Authors: Tianle Yang, Luyao Chang, Jiadong Yan, Juntao Li, Zhi Wang, Ke Zhang,
- Abstract要約: 我々は,基礎モデル手法の比較と議論を行い,体系的な調査を行う。
我々は最近発表された非境界モデル (NFM) の手法を概観した。
FM法は,実際の産業アプリケーションシナリオに則った,少数ショット学習やゼロショット学習に適している。
- 参考スコア(独自算出の注目度): 16.30213354186722
- License:
- Abstract: As industrial products become abundant and sophisticated, visual industrial defect detection receives much attention, including two-dimensional and three-dimensional visual feature modeling. Traditional methods use statistical analysis, abnormal data synthesis modeling, and generation-based models to separate product defect features and complete defect detection. Recently, the emergence of foundation models has brought visual and textual semantic prior knowledge. Many methods are based on foundation models (FM) to improve the accuracy of detection, but at the same time, increase model complexity and slow down inference speed. Some FM-based methods have begun to explore lightweight modeling ways, which have gradually attracted attention and deserve to be systematically analyzed. In this paper, we conduct a systematic survey with comparisons and discussions of foundation model methods from different aspects and briefly review non-foundation model (NFM) methods recently published. Furthermore, we discuss the differences between FM and NFM methods from training objectives, model structure and scale, model performance, and potential directions for future exploration. Through comparison, we find FM methods are more suitable for few-shot and zero-shot learning, which are more in line with actual industrial application scenarios and worthy of in-depth research.
- Abstract(参考訳): 工業製品が豊富で洗練されたものになると、視覚的産業欠陥検出は2次元および3次元の視覚特徴モデリングを含む多くの注目を集める。
従来の手法では、統計解析、異常データ合成モデリング、および生成ベースモデルを使用して、製品欠陥の特徴と完全な欠陥検出を分離する。
近年、基礎モデルの出現は、視覚的およびテキスト的意味論的事前知識をもたらしている。
多くの手法は、検出精度を向上させるための基礎モデル(FM)に基づいているが、同時にモデルの複雑さを高め、推論速度を遅くする。
いくつかのFMベースの手法は、より軽量なモデリング方法を探求し始めており、徐々に注目を集め、体系的に分析されるべきである。
本稿では,異なる側面から基礎モデル手法の比較と議論を行い,最近発表された非基礎モデル(NFM)法について概観する。
さらに, FM法とNFM法の違い, モデル構造とスケール, モデル性能, 将来探査の可能性について検討した。
比較により,FM法は実産業応用シナリオに適合し,詳細な研究に相応しい,少数ショット学習やゼロショット学習に適していることがわかった。
関連論文リスト
- Alignment of Diffusion Models: Fundamentals, Challenges, and Future [28.64041196069495]
拡散モデルは生成モデルの主要なパラダイムとして登場し、様々な応用に優れています。
彼らの成功にもかかわらず、これらのモデルは、しばしば人間の意図に反し、テキストのプロンプトと一致しない、あるいは望ましい特性を持たない出力を生成する。
大規模言語モデルの調整におけるアライメントの成功に触発された最近の研究は、人間の期待や嗜好と拡散モデルの整合性について研究している。
論文 参考訳(メタデータ) (2024-09-11T13:21:32Z) - SMILE: Zero-Shot Sparse Mixture of Low-Rank Experts Construction From Pre-Trained Foundation Models [85.67096251281191]
我々は、ゼロショットスパースミクチャー(SMILE)と呼ばれるモデル融合に対する革新的なアプローチを提案する。
SMILEは、余分なデータやさらなるトレーニングなしに、ソースモデルをMoEモデルにアップスケーリングできる。
画像分類やテキスト生成タスクなど,さまざまなシナリオに対して,フル微調整とLoRA微調整を用いて広範な実験を行う。
論文 参考訳(メタデータ) (2024-08-19T17:32:15Z) - Diffusion Models in Low-Level Vision: A Survey [82.77962165415153]
拡散モデルに基づくソリューションは、優れた品質と多様性のサンプルを作成する能力で広く称賛されている。
本稿では,3つの一般化拡散モデリングフレームワークを提案し,それらと他の深層生成モデルとの相関関係について検討する。
医療、リモートセンシング、ビデオシナリオなど、他のタスクに適用された拡張拡散モデルについて要約する。
論文 参考訳(メタデータ) (2024-06-17T01:49:27Z) - Learning from models beyond fine-tuning [78.20895343699658]
Learn From Model (LFM) は、モデルインターフェースに基づいた基礎モデル(FM)の研究、修正、設計に焦点を当てている。
LFM技術の研究は、モデルチューニング、モデル蒸留、モデル再利用、メタラーニング、モデル編集の5つの分野に大別できる。
本稿では, LFM の観点から, FM に基づく現在の手法を概観する。
論文 参考訳(メタデータ) (2023-10-12T10:20:36Z) - Diffusion Models for Image Restoration and Enhancement -- A
Comprehensive Survey [96.99328714941657]
本稿では,近年の拡散モデルに基づく画像復元手法について概観する。
我々は、赤外線とブラインド/現実世界の両方で拡散モデルを用いて、革新的なデザインを分類し、強調する。
本稿では,拡散モデルに基づくIRの今後の研究に向けた5つの可能性と課題を提案する。
論文 参考訳(メタデータ) (2023-08-18T08:40:38Z) - Interpretable ODE-style Generative Diffusion Model via Force Field
Construction [0.0]
本稿では,数理的な観点からODE型生成拡散モデルを構築するのに適した様々な物理モデルを特定することを目的とする。
我々は,本手法で同定された理論モデルを用いて,新しい拡散モデル手法の開発を行うケーススタディを行う。
論文 参考訳(メタデータ) (2023-03-14T16:58:11Z) - A Survey on Generative Diffusion Model [75.93774014861978]
拡散モデルは、深層生成モデルの新たなクラスである。
時間を要する反復生成過程や高次元ユークリッド空間への閉じ込めなど、いくつかの制限がある。
本調査では,拡散モデルの向上を目的とした高度な手法を多数提示する。
論文 参考訳(メタデータ) (2022-09-06T16:56:21Z) - Improving the Reconstruction of Disentangled Representation Learners via Multi-Stage Modeling [54.94763543386523]
現在の自己エンコーダに基づく非絡み合い表現学習法は、(集合体)後部をペナルティ化し、潜伏因子の統計的独立を促進することで、非絡み合いを実現する。
本稿では,不整合因子をペナルティに基づく不整合表現学習法を用いて学習する,新しい多段階モデリング手法を提案する。
次に、低品質な再構成を、欠落した関連潜伏変数をモデル化するために訓練された別の深層生成モデルで改善する。
論文 参考訳(メタデータ) (2020-10-25T18:51:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。