論文の概要: Small Object Few-shot Segmentation for Vision-based Industrial Inspection
- arxiv url: http://arxiv.org/abs/2407.21351v1
- Date: Wed, 31 Jul 2024 05:43:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-01 18:41:45.434023
- Title: Small Object Few-shot Segmentation for Vision-based Industrial Inspection
- Title(参考訳): 視覚に基づく産業検査のための小物体Few-shotセグメンテーション
- Authors: Zilong Zhang, Chang Niu, Zhibin Zhao, Xingwu Zhang, Xuefeng Chen,
- Abstract要約: 視覚に基づく産業検査(VII)は、欠陥を迅速かつ正確に発見することを目的としている。
様々な十分な欠陥は得られ難いが、特定の欠陥は発見できない。
そこで本研究では,いくつかのアノテーションに条件づけられた未確認の欠陥を再学習せずに検出するFSS法を提案する。
- 参考スコア(独自算出の注目度): 3.3759920809568316
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Vision-based industrial inspection (VII) aims to locate defects quickly and accurately. Supervised learning under a close-set setting and industrial anomaly detection, as two common paradigms in VII, face different problems in practical applications. The former is that various and sufficient defects are difficult to obtain, while the latter is that specific defects cannot be located. To solve these problems, in this paper, we focus on the few-shot semantic segmentation (FSS) method, which can locate unseen defects conditioned on a few annotations without retraining. Compared to common objects in natural images, the defects in VII are small. This brings two problems to current FSS methods: 1 distortion of target semantics and 2 many false positives for backgrounds. To alleviate these problems, we propose a small object few-shot segmentation (SOFS) model. The key idea for alleviating 1 is to avoid the resizing of the original image and correctly indicate the intensity of target semantics. SOFS achieves this idea via the non-resizing procedure and the prototype intensity downsampling of support annotations. To alleviate 2, we design an abnormal prior map in SOFS to guide the model to reduce false positives and propose a mixed normal Dice loss to preferentially prevent the model from predicting false positives. SOFS can achieve FSS and few-shot anomaly detection determined by support masks. Diverse experiments substantiate the superior performance of SOFS. Code is available at https://github.com/zhangzilongc/SOFS.
- Abstract(参考訳): 視覚に基づく産業検査(VII)は、欠陥を迅速かつ正確に発見することを目的としている。
密接な設定と工業的異常検出に基づく教師付き学習は、VIIの2つの共通パラダイムとして、実践的応用において異なる問題に直面している。
前者は、様々な十分な欠陥を得るのが困難であり、後者は特定の欠陥を見つけることができないことである。
これらの問題を解決するために,本論文では,いくつかのアノテーションに条件付された未知の欠陥を再学習することなく検出する,FSS法に焦点をあてる。
自然画像の一般的な物体と比較して、VIIの欠陥は小さい。
これは現在のFSSメソッドに2つの問題をもたらす。1つのターゲットセマンティクスの歪みと2つの背景に対する偽陽性である。
これらの問題を緩和するため、我々は小さなオブジェクト・ショット・セグメンテーション(SOFS)モデルを提案する。
1を緩和する鍵となる考え方は、元のイメージの縮小を回避し、ターゲットセマンティクスの強度を正しく示すことである。
SOFSは、非サイズ化プロシージャと、サポートアノテーションのプロトタイプ強度ダウンサンプリングによって、このアイデアを実現している。
2 を緩和するために、SOFS における異常事前マップを設計し、偽陽性を減少させるためにモデルを誘導し、偽陽性の予測を優先的に防止するために混合正規Dice損失を提案する。
SOFSは、サポートマスクによって決定されたFSSと数発の異常検出を達成できる。
各種実験はSOFSの優れた性能を裏付けるものである。
コードはhttps://github.com/zhangzilongc/SOFSで入手できる。
関連論文リスト
- Fine-grained Abnormality Prompt Learning for Zero-shot Anomaly Detection [88.34095233600719]
FAPromptは、より正確なZSADのためにきめ細かい異常プロンプトを学習するために設計された新しいフレームワークである。
画像レベルおよび画素レベルのZSADタスクにおいて、最先端の手法を少なくとも3%-5%のAUC/APで大幅に上回っている。
論文 参考訳(メタデータ) (2024-10-14T08:41:31Z) - Cycle-Consistency Uncertainty Estimation for Visual Prompting based One-Shot Defect Segmentation [0.0]
産業的欠陥検出は伝統的に、既知の欠陥型の固定データセットに基づいて訓練された教師付き学習モデルに依存している。
視覚的プロンプトの最近の進歩は、提供された視覚的手がかりに基づいて、モデルが新しいカテゴリを適応的に推論できるようにすることによってソリューションを提供する。
本稿では,サイクル整合性による視覚刺激過程の不確かさを推定する手法を提案する。
論文 参考訳(メタデータ) (2024-09-21T02:25:32Z) - SINDER: Repairing the Singular Defects of DINOv2 [61.98878352956125]
大規模なデータセットでトレーニングされたビジョントランスフォーマーモデルは、抽出したパッチトークンにアーティファクトを表示することが多い。
本稿では,小さなデータセットのみを用いて構造欠陥を補正するスムーズなスムーズな正規化を提案する。
論文 参考訳(メタデータ) (2024-07-23T20:34:23Z) - Looking for Tiny Defects via Forward-Backward Feature Transfer [12.442574943138794]
そこで本研究では,従来の高解像度画像と地中トラスマスクの手法を評価する新しいベンチマークを提案する。
私たちのベンチマークには、欠陥サイズに関する堅牢性をキャプチャするメトリクスが含まれています。
提案手法は,欠陥サイズに対する高いロバスト性,高速動作,最先端セグメンテーション性能を特徴とする。
論文 参考訳(メタデータ) (2024-07-04T17:59:26Z) - Progressive Alignment with VLM-LLM Feature to Augment Defect Classification for the ASE Dataset [7.1083241462091165]
従来の欠陥分類アプローチは2つの障壁に直面している。
不十分なトレーニングデータと不安定なデータ品質。
画像上に記録されたリッチなデータ記述を含む,欠陥分類のための特別なデータセットを提案するが,欠陥特徴を直接学習するのは困難である。
論文 参考訳(メタデータ) (2024-04-08T04:17:27Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - SOOD: Towards Semi-Supervised Oriented Object Detection [57.05141794402972]
本稿では, 主流の擬似ラベリングフレームワーク上に構築された, SOOD と呼ばれる, 半教師付きオブジェクト指向物体検出モデルを提案する。
提案した2つの損失をトレーニングした場合,SOODはDOTA-v1.5ベンチマークの様々な設定下で,最先端のSSOD法を超越することを示した。
論文 参考訳(メタデータ) (2023-04-10T11:10:42Z) - Boosting Few-shot Fine-grained Recognition with Background Suppression
and Foreground Alignment [53.401889855278704]
FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。
本研究では,背景アクティベーション抑制 (BAS) モジュール,フォアグラウンドオブジェクトアライメント (FOA) モジュール,および局所的局所的(L2L) 類似度測定器からなる2段階の背景アライメントとフォアグラウンドアライメントフレームワークを提案する。
複数のベンチマークで行った実験により,提案手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-10-04T07:54:40Z) - Reference-based Defect Detection Network [57.89399576743665]
最初の問題はテクスチャシフトであり、これはトレーニングされた欠陥検出モデルが目に見えないテクスチャの影響を受けやすいことを意味する。
第2の問題は部分的な視覚的混乱であり、部分的な欠陥ボックスが完全なボックスと視覚的に類似していることを示している。
本稿では,これら2つの問題に対処する参照型欠陥検出ネットワーク(RDDN)を提案する。
論文 参考訳(メタデータ) (2021-08-10T05:44:23Z) - Few-Shot Defect Segmentation Leveraging Abundant Normal Training Samples
Through Normal Background Regularization and Crop-and-Paste Operation [4.626338154327536]
産業検査作業では, 欠陥のない画像サンプルが豊富だが, 異常な画像が極めて少ないことが一般的である。
本論文は,正常な(欠陥のない)トレーニングイメージを十分に用いながら,異常な部分しか持たない,難解な少数ショット欠陥分割課題に対処する。
UNetライクなエンコーダ-デコーダ欠陥分割ネットワークのトレーニングに、豊富な欠陥のないイメージを組み込むことにより、2つの効果的な正則化手法を提案する。
論文 参考訳(メタデータ) (2020-07-18T14:15:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。