論文の概要: A Survey on Industrial Anomalies Synthesis
- arxiv url: http://arxiv.org/abs/2502.16412v1
- Date: Sun, 23 Feb 2025 02:48:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-25 15:52:42.727422
- Title: A Survey on Industrial Anomalies Synthesis
- Title(参考訳): 産業用異常合成に関する調査研究
- Authors: Xichen Xu, Yanshu Wang, Yawen Huang, Jiaqi Liu, Xiaoning Lei, Guoyang Xie, Guannan Jiang, Zhichao Lu,
- Abstract要約: 本稿では,異常合成手法を包括的にレビューする。
既存の調査では、限られた技術に焦点が当てられ、全体的な視野の欠如とメソッド相互接続の理解に焦点が当てられている。
対照的に、本研究では、手作り、分布ハイブリッドに基づく、生成モデル(GM)ベースの、視覚言語モデル(VLM)ベースの合成において、約40の代表的な手法を網羅した統一的なレビューを行っている。
- 参考スコア(独自算出の注目度): 24.649665449594355
- License:
- Abstract: This paper comprehensively reviews anomaly synthesis methodologies. Existing surveys focus on limited techniques, missing an overall field view and understanding method interconnections. In contrast, our study offers a unified review, covering about 40 representative methods across Hand-crafted, Distribution-hypothesis-based, Generative models (GM)-based, and Vision-language models (VLM)-based synthesis. We introduce the first industrial anomaly synthesis (IAS) taxonomy. Prior works lack formal classification or use simplistic taxonomies, hampering structured comparisons and trend identification. Our taxonomy provides a fine-grained framework reflecting methodological progress and practical implications, grounding future research. Furthermore, we explore cross-modality synthesis and large-scale VLM. Previous surveys overlooked multimodal data and VLM in anomaly synthesis, limiting insights into their advantages. Our survey analyzes their integration, benefits, challenges, and prospects, offering a roadmap to boost IAS with multimodal learning. More resources are available at https://github.com/M-3LAB/awesome-anomaly-synthesis.
- Abstract(参考訳): 本稿では,異常合成手法を包括的にレビューする。
既存の調査では、限られた技術に焦点が当てられ、全体的な視野の欠如とメソッド相互接続の理解に焦点が当てられている。
対照的に、本研究では、手作り、分布ハイブリッドに基づく、生成モデル(GM)ベースの、視覚言語モデル(VLM)ベースの合成において、約40の代表的な手法を網羅した統一的なレビューを行っている。
第1回産業異常合成(IAS)分類法について紹介する。
以前の作品には形式的な分類や簡素な分類法、構造化された比較と傾向の同定が欠如していた。
我々の分類学は、方法論の進歩と実践的な意味を反映したきめ細かい枠組みを提供し、将来の研究を基礎にしている。
さらに, クロスモダリティ合成と大規模VLMについて検討する。
以前の調査では、マルチモーダルデータとVLMが異常合成において見過ごされ、その利点に関する洞察が制限されていた。
私たちの調査では、統合、メリット、課題、見通しを分析し、マルチモーダル学習によるIAS向上のロードマップを提供しています。
さらなるリソースはhttps://github.com/M-3LAB/awesome-anomaly- synthesisで入手できる。
関連論文リスト
- Towards a Theoretical Understanding of Synthetic Data in LLM Post-Training: A Reverse-Bottleneck Perspective [9.590540796223715]
学習後モデルの一般化能力は生成モデルから得られる情報ゲインによって決定されることを示す。
この分析は、合成データ生成の理論基盤として機能し、後学習モデルの一般化能力との関係を強調している。
ソースコードはhttps://github.com/ZyGan 1999/Towards-a-theoretical-Understanding-of-Synthetic-Data-in-LLM-Post-Trainingで公開しています。
論文 参考訳(メタデータ) (2024-10-02T16:32:05Z) - From Linguistic Giants to Sensory Maestros: A Survey on Cross-Modal Reasoning with Large Language Models [56.9134620424985]
クロスモーダル推論(CMR)は、より高度な人工知能システムへの進化における重要な能力として、ますます認識されている。
CMRタスクに取り組むためにLLM(Large Language Models)をデプロイする最近のトレンドは、その有効性を高めるためのアプローチの新たな主流となっている。
本調査では,LLMを用いてCMRで適用された現在の方法論を,詳細な3階層分類に分類する。
論文 参考訳(メタデータ) (2024-09-19T02:51:54Z) - Model Merging in LLMs, MLLMs, and Beyond: Methods, Theories, Applications and Opportunities [89.40778301238642]
モデルマージは、機械学習コミュニティにおける効率的なエンパワーメント技術である。
これらの手法の体系的かつ徹底的なレビューに関する文献には大きなギャップがある。
論文 参考訳(メタデータ) (2024-08-14T16:58:48Z) - SynthesizRR: Generating Diverse Datasets with Retrieval Augmentation [55.2480439325792]
トピック分類,感情分析,トーン検出,ユーモアの6つのデータセットの合成について検討した。
その結果,SynthesizRRは語彙や意味の多様性,人文との類似性,蒸留性能を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2024-05-16T12:22:41Z) - Continual Learning with Pre-Trained Models: A Survey [61.97613090666247]
継続的な学習は、新しい知識を学ぶ際に、かつての知識の破滅的な忘れを克服することを目的としている。
本稿では, PTM を用いた CL の最近の進歩を包括的に調査する。
論文 参考訳(メタデータ) (2024-01-29T18:27:52Z) - Relation Extraction in underexplored biomedical domains: A
diversity-optimised sampling and synthetic data generation approach [0.0]
ラベル付きデータの空間性は関係抽出モデルの開発に障害となる。
我々は、最初のキュレートされた評価データセットを作成し、LOTUSデータベースから文献項目を抽出し、トレーニングセットを構築する。
我々は,オープンな大規模言語モデルを用いた生成タスクと数ショット学習として,標準微調整の性能を評価する。
論文 参考訳(メタデータ) (2023-11-10T19:36:00Z) - Bias and Fairness in Large Language Models: A Survey [73.87651986156006]
本稿では,大規模言語モデル(LLM)のバイアス評価と緩和手法に関する総合的な調査を行う。
まず、自然言語処理における社会的偏見と公平性の概念を統合し、形式化し、拡張する。
次に,3つの直感的な2つのバイアス評価法と1つの緩和法を提案し,文献を統一する。
論文 参考訳(メタデータ) (2023-09-02T00:32:55Z) - Replicability Study: Corpora For Understanding Simulink Models &
Projects [8.261117235807607]
本研究は, 前回のSimulinkモデル研究で採用した方法論とデータソースをレビューし, SLNETを用いて過去の解析を再現する。
オープンソースSimulinkモデルは優れたモデリングプラクティスに従っており、プロプライエタリモデルに匹敵するサイズと特性を持つモデルを含んでいることがわかった。
論文 参考訳(メタデータ) (2023-08-03T18:14:54Z) - ContraNeRF: Generalizable Neural Radiance Fields for Synthetic-to-real
Novel View Synthesis via Contrastive Learning [102.46382882098847]
まず,合成から現実への新規な視点合成における合成データの影響について検討した。
本稿では,幾何制約を伴う多視点一貫した特徴を学習するために,幾何対応のコントラスト学習を導入することを提案する。
提案手法は,PSNR,SSIM,LPIPSの点で,既存の一般化可能な新規ビュー合成手法よりも高い画質で精細な画像を描画することができる。
論文 参考訳(メタデータ) (2023-03-20T12:06:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。