論文の概要: MLMA-Net: multi-level multi-attentional learning for multi-label object
detection in textile defect images
- arxiv url: http://arxiv.org/abs/2102.00376v1
- Date: Sun, 31 Jan 2021 04:50:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-02 16:34:20.443740
- Title: MLMA-Net: multi-level multi-attentional learning for multi-label object
detection in textile defect images
- Title(参考訳): MLMA-Net:繊維欠陥画像におけるマルチラベル物体検出のためのマルチレベルマルチアテンショナル学習
- Authors: Bing Wei (Student Member, IEEE), Kuangrong Hao (Member, IEEE), Lei Gao
(Member, IEEE)
- Abstract要約: 本稿では,マルチレベル・マルチアテンショナル・ディープ・ラーニング・ネットワーク(MLMA-Net)を提案する。
その結果,実世界の産業データセットに対する最先端のアプローチよりも,ネットワークが特徴的特徴を抽出し,性能が向上していることが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For the sake of recognizing and classifying textile defects, deep
learning-based methods have been proposed and achieved remarkable success in
single-label textile images. However, detecting multi-label defects in a
textile image remains challenging due to the coexistence of multiple defects
and small-size defects. To address these challenges, a multi-level,
multi-attentional deep learning network (MLMA-Net) is proposed and built to 1)
increase the feature representation ability to detect small-size defects; 2)
generate a discriminative representation that maximizes the capability of
attending the defect status, which leverages higher-resolution feature maps for
multiple defects. Moreover, a multi-label object detection dataset (DHU-ML1000)
in textile defect images is built to verify the performance of the proposed
model. The results demonstrate that the network extracts more distinctive
features and has better performance than the state-of-the-art approaches on the
real-world industrial dataset.
- Abstract(参考訳): 繊維欠陥の認識・分類のために, 深層学習法が提案され, シングルラベル織物画像において顕著な成功を収めている。
しかし、複数の欠陥と小さな欠陥が共存しているため、織物画像における多重ラベル欠陥の検出は依然として困難である。
これらの課題を解決するために、マルチレベルのマルチアテンテーショナルディープラーニングネットワーク(MLMA-Net)が提案され、1)小型欠陥を検出する機能表現能力の向上、2)複数の欠陥に対する高分解能機能マップを活用する欠陥状態への出席能力を最大化する識別表現を生成する。
さらに,繊維欠陥画像における多ラベル物体検出データセット(DHU-ML1000)を構築し,提案モデルの性能を検証する。
その結果、ネットワークはより特徴的な特徴を抽出し、実世界の産業データセットに対する最先端のアプローチよりも優れたパフォーマンスを示す。
関連論文リスト
- Change-Aware Siamese Network for Surface Defects Segmentation under Complex Background [0.6407952035735353]
変更検出フレームワークにおける欠陥セグメント化を解消する変更対応のSiameseネットワークを提案する。
トランスフォーマーベースのエンコーダを導くために,新しいマルチクラスのコントラスト損失を導入した。
距離マップで示される差分は、変更対応デコーダにスキップ接続され、クラス間およびクラス外の両方の欠陥の位置をアシストする。
論文 参考訳(メタデータ) (2024-09-01T02:48:11Z) - Multi-label Sewer Pipe Defect Recognition with Mask Attention Feature Enhancement and Label Correlation Learning [5.9184143707401775]
マスク注意誘導特徴強調とラベル相関学習に基づくマルチラベルパイプ欠陥認識を提案する。
提案手法は,Swer-MLトレーニングデータセットの1/16のみを用いて,現在の最先端の分類性能を実現する。
論文 参考訳(メタデータ) (2024-08-01T11:51:50Z) - Looking for Tiny Defects via Forward-Backward Feature Transfer [12.442574943138794]
そこで本研究では,従来の高解像度画像と地中トラスマスクの手法を評価する新しいベンチマークを提案する。
私たちのベンチマークには、欠陥サイズに関する堅牢性をキャプチャするメトリクスが含まれています。
提案手法は,欠陥サイズに対する高いロバスト性,高速動作,最先端セグメンテーション性能を特徴とする。
論文 参考訳(メタデータ) (2024-07-04T17:59:26Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Improving Vision Anomaly Detection with the Guidance of Language
Modality [64.53005837237754]
本稿では,マルチモーダルの観点から視覚モダリティの課題に取り組む。
本稿では,冗長な情報問題とスパース空間問題に対処するために,クロスモーダルガイダンス(CMG)を提案する。
視覚異常検出のためのよりコンパクトな潜在空間を学習するために、CMLEは言語モダリティから相関構造行列を学習する。
論文 参考訳(メタデータ) (2023-10-04T13:44:56Z) - Hybrid-Supervised Dual-Search: Leveraging Automatic Learning for
Loss-free Multi-Exposure Image Fusion [60.221404321514086]
マルチ露光画像融合(MEF)は、様々な露光レベルを表すデジタルイメージングの限界に対処するための重要な解決策である。
本稿では、ネットワーク構造と損失関数の両方を自動設計するための二段階最適化探索方式であるHSDS-MEFと呼ばれるMEFのためのハイブリッドスーパービジョンデュアルサーチ手法を提案する。
論文 参考訳(メタデータ) (2023-09-03T08:07:26Z) - Few-Shot Defect Image Generation via Defect-Aware Feature Manipulation [19.018561017953957]
そこで本研究では, 難易度の高いいくつかの症例において, 第一の欠陥画像生成法を提案する。
まず、欠陥のない画像をバックボーンとしてデータ効率の良いStyleGAN2をトレーニングする。
第二に、欠陥を意識した残留ブロックを背骨に取り付け、適切な欠陥マスクを生成することを学習する。
論文 参考訳(メタデータ) (2023-03-04T11:43:08Z) - High-resolution Iterative Feedback Network for Camouflaged Object
Detection [128.893782016078]
カモフラージュされたオブジェクトを背景に視覚的に同化させることは、オブジェクト検出アルゴリズムにとって難しい。
エッジやバウンダリのぼやけた視界を生じさせる細部劣化を避けるために,高分解能テクスチャの詳細を抽出することを目的としている。
我々は,高解像度特徴量による低解像度表現を反復的フィードバック方式で洗練する新しいHitNetを提案する。
論文 参考訳(メタデータ) (2022-03-22T11:20:21Z) - M2TR: Multi-modal Multi-scale Transformers for Deepfake Detection [74.19291916812921]
Deepfake技術によって生成された鍛造画像は、デジタル情報の信頼性に深刻な脅威をもたらします。
本稿では,Deepfake検出のための微妙な操作アーチファクトを異なるスケールで捉えることを目的とする。
最先端の顔スワッピングと顔の再現方法によって生成された4000のDeepFakeビデオで構成される高品質のDeepFakeデータセットSR-DFを紹介します。
論文 参考訳(メタデータ) (2021-04-20T05:43:44Z) - Computer Vision and Normalizing Flow Based Defect Detection [0.0]
本稿では,オブジェクト検出モデルYOLOとフローベース欠陥検出モデルDifferNetに基づく2段階欠陥検出ネットワークを提案する。
本モデルは,生産ライン監視システムから撮影した実世界のビデオクリップを用いた欠陥検出において,高い堅牢性と性能を有する。
提案モデルでは,単一製品や複数製品の欠陥のない少数のサンプルを学習できる。
論文 参考訳(メタデータ) (2020-12-12T05:38:21Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。