論文の概要: MINet: Multi-scale Interactive Network for Real-time Salient Object Detection of Strip Steel Surface Defects
- arxiv url: http://arxiv.org/abs/2405.16096v1
- Date: Sat, 25 May 2024 07:09:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-29 01:10:08.021851
- Title: MINet: Multi-scale Interactive Network for Real-time Salient Object Detection of Strip Steel Surface Defects
- Title(参考訳): MINet:鋼板表面欠陥をリアルタイムに検出するマルチスケールインタラクティブネットワーク
- Authors: Kunye Shen, Xiaofei Zhou, Zhi Liu,
- Abstract要約: 我々は,DWConv(Deepwise Convolution)とPWConv(Pointwise Convolution)を用いて,異なるスケールの機能を独立して抽出し,対話的に融合する多スケール対話型(MI)モジュールを考案した。
本研究では,ストリップ鋼表面欠陥をリアルタイムに検出するための軽量なマルチスケールインタラクティブネットワーク(MINET)を提案する。
- 参考スコア(独自算出の注目度): 10.550627100986894
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The automated surface defect detection is a fundamental task in industrial production, and the existing saliencybased works overcome the challenging scenes and give promising detection results. However, the cutting-edge efforts often suffer from large parameter size, heavy computational cost, and slow inference speed, which heavily limits the practical applications. To this end, we devise a multi-scale interactive (MI) module, which employs depthwise convolution (DWConv) and pointwise convolution (PWConv) to independently extract and interactively fuse features of different scales, respectively. Particularly, the MI module can provide satisfactory characterization for defect regions with fewer parameters. Embarking on this module, we propose a lightweight Multi-scale Interactive Network (MINet) to conduct real-time salient object detection of strip steel surface defects. Comprehensive experimental results on SD-Saliency-900 dataset, which contains three kinds of strip steel surface defect detection images (i.e., inclusion, patches, and scratches), demonstrate that the proposed MINet presents comparable detection accuracy with the state-of-the-art methods while running at a GPU speed of 721FPS and a CPU speed of 6.3FPS for 368*368 images with only 0.28M parameters. The code is available at https://github.com/Kunye-Shen/MINet.
- Abstract(参考訳): 自動表面欠陥検出は工業生産における基本的な課題であり、既存の衛生ベースの作業は困難なシーンを克服し、有望な検出結果を与える。
しかし、最先端の取り組みは、しばしば大きなパラメータサイズ、重い計算コスト、遅い推論速度に悩まされ、実用的な応用を厳しく制限する。
そこで我々は,DWConv(Deepwise Convolution)とPWConv(Pointwise Convolution)を用いて,異なるスケールの機能を独立して抽出し,相互に融合する多層対話型(MI)モジュールを考案した。
特に、MIモジュールは、少ないパラメータで欠陥領域を満足できる特徴を与えることができる。
本研究では, 鋼板表面欠陥をリアルタイムに検出するマルチスケールインタラクティブネットワーク(MINet)を提案する。
SD-Saliency-900データセットは,3種類のストリップ鋼表面欠陥検出画像(包含,パッチ,スクラッチなど)を含んでいて,GPU速度721FPS,CPU速度6.3FPS,パラメータ0.28Mの368*368に対して,MINetが最先端手法と同等な検出精度を示すことを示した。
コードはhttps://github.com/Kunye-Shen/MINet.comで公開されている。
関連論文リスト
- M3DM-NR: RGB-3D Noisy-Resistant Industrial Anomaly Detection via Multimodal Denoising [63.39134873744748]
既存の産業異常検出手法は主に、原始RGB画像を用いた教師なし学習に重点を置いている。
本稿では,CLIPの強力なマルチモーダル識別機能を利用する新しい耐雑音性M3DM-NRフレームワークを提案する。
M3DM-NRは3D-RGBマルチモーダルノイズ異常検出において最先端の手法より優れていた。
論文 参考訳(メタデータ) (2024-06-04T12:33:02Z) - Cross-Cluster Shifting for Efficient and Effective 3D Object Detection
in Autonomous Driving [69.20604395205248]
本稿では,自律運転における3次元物体検出のための3次元点検出モデルであるShift-SSDを提案する。
我々は、ポイントベース検出器の表現能力を解き放つために、興味深いクロスクラスタシフト操作を導入する。
我々は、KITTI、ランタイム、nuScenesデータセットに関する広範な実験を行い、Shift-SSDの最先端性能を実証した。
論文 参考訳(メタデータ) (2024-03-10T10:36:32Z) - Global Context Aggregation Network for Lightweight Saliency Detection of
Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。
まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。
3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2023-09-22T06:19:11Z) - MSECNet: Accurate and Robust Normal Estimation for 3D Point Clouds by
Multi-Scale Edge Conditioning [8.177876899141486]
3次元点雲から表面の正規度を推定することは、表面の再構成やレンダリングなど、様々な用途に欠かせない。
MSECNetと呼ばれる新しい手法を提案し、エッジ検出問題として正規変分モデリングを扱い、正常変分領域の推定を改善する。
論文 参考訳(メタデータ) (2023-08-04T10:26:59Z) - EasyNet: An Easy Network for 3D Industrial Anomaly Detection [49.26348455493123]
3D異常検出は、産業生産において、新しくて重要なコンピュータビジョンタスクである。
我々は,事前訓練されたモデルやメモリバンクを使わずに,容易に展開可能なネットワーク(EasyNet)を提案する。
実験の結果、EasyNetはトレーニング済みのモデルやメモリバンクを使わずに92.6%の異常検出AUROCを実現していることがわかった。
論文 参考訳(メタデータ) (2023-07-26T02:46:50Z) - Multi-Modal 3D Object Detection by Box Matching [109.43430123791684]
マルチモーダル3次元検出のためのボックスマッチング(FBMNet)による新しいフュージョンネットワークを提案する。
3Dオブジェクトと2Dオブジェクトの提案を学習することで、ROI特徴を組み合わせることで、検出のための融合を効果的に行うことができる。
論文 参考訳(メタデータ) (2023-05-12T18:08:51Z) - Multimodal Industrial Anomaly Detection via Hybrid Fusion [59.16333340582885]
ハイブリッド核融合方式を用いた新しいマルチモーダル異常検出法を提案する。
本モデルでは,MVTecD-3 ADデータセットにおける検出精度とセグメンテーション精度の両面で,最先端(SOTA)手法より優れている。
論文 参考訳(メタデータ) (2023-03-01T15:48:27Z) - DPNet: Dual-Path Network for Real-time Object Detection with Lightweight
Attention [15.360769793764526]
本稿では,リアルタイム物体検出のための軽量アテンション方式を用いて,DPNetというデュアルパスネットワークを提案する。
DPNetは、検出精度と実装効率の間の最先端のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-09-28T09:11:01Z) - CAMO-MOT: Combined Appearance-Motion Optimization for 3D Multi-Object
Tracking with Camera-LiDAR Fusion [34.42289908350286]
3D Multi-object Track (MOT) は、連続的な動的検出時の一貫性を保証する。
LiDAR法で物体の不規則な動きを正確に追跡することは困難である。
複合外観運動最適化(CAMO-MOT)に基づく新しいカメラ-LiDAR融合3DMOTフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-06T14:41:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。