論文の概要: End-to-end training of a two-stage neural network for defect detection
- arxiv url: http://arxiv.org/abs/2007.07676v1
- Date: Wed, 15 Jul 2020 13:42:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-10 06:03:47.208601
- Title: End-to-end training of a two-stage neural network for defect detection
- Title(参考訳): 欠陥検出のための2段階ニューラルネットワークのエンドツーエンドトレーニング
- Authors: Jakob Bo\v{z}i\v{c}, Domen Tabernik and Danijel Sko\v{c}aj
- Abstract要約: 勾配に基づく2段階ニューラルネットワークは、表面欠陥検出に優れた結果を示している。
本稿では,2段階ネットワークのエンドツーエンドトレーニングと,トレーニングプロセスの拡張について紹介する。
3つの欠陥検出データセットについて、最先端の結果を示す。
- 参考スコア(独自算出の注目度): 4.38301148531795
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Segmentation-based, two-stage neural network has shown excellent results in
the surface defect detection, enabling the network to learn from a relatively
small number of samples. In this work, we introduce end-to-end training of the
two-stage network together with several extensions to the training process,
which reduce the amount of training time and improve the results on the surface
defect detection tasks. To enable end-to-end training we carefully balance the
contributions of both the segmentation and the classification loss throughout
the learning. We adjust the gradient flow from the classification into the
segmentation network in order to prevent the unstable features from corrupting
the learning. As an additional extension to the learning, we propose
frequency-of-use sampling scheme of negative samples to address the issue of
over- and under-sampling of images during the training, while we employ the
distance transform algorithm on the region-based segmentation masks as weights
for positive pixels, giving greater importance to areas with higher probability
of presence of defect without requiring a detailed annotation. We demonstrate
the performance of the end-to-end training scheme and the proposed extensions
on three defect detection datasets - DAGM, KolektorSDD and Severstal Steel
defect dataset - where we show state-of-the-art results. On the DAGM and the
KolektorSDD we demonstrate 100\% detection rate, therefore completely solving
the datasets. Additional ablation study performed on all three datasets
quantitatively demonstrates the contribution to the overall result improvements
for each of the proposed extensions.
- Abstract(参考訳): セグメンテーションに基づく2段階のニューラルネットワークは、表面欠陥検出に優れた結果を示し、比較的少数のサンプルからネットワークを学ぶことができる。
本研究では,2段階ネットワークのエンドツーエンドトレーニングと,トレーニングプロセスへのいくつかの拡張を導入し,トレーニング時間を短縮し,表面欠陥検出タスクにおける結果を改善する。
エンドツーエンドのトレーニングを可能にするために、学習を通じてセグメンテーションと分類損失の両方の貢献を慎重にバランスさせます。
我々は,不安定な特徴が学習を損なうのを防ぐために,分類からセグメンテーションネットワークへの勾配流を調整する。
学習のさらなる拡張として,画像のオーバーサンプリングやアンダーサンプリングの問題に対処するために,負サンプルの頻度・オブ・ユースサンプリングスキームを提案する。一方,領域ベースのセグメンテーションマスクにおける距離変換アルゴリズムを正画素の重みとして採用し,詳細な注釈を必要とせず,欠陥の存在確率の高い領域を重要視する。
DAGM, KolektorSDD, Severstal Steel欠陥データセットという3つの欠陥検出データセットに対して, エンドツーエンドのトレーニングスキームと, 提案した拡張性能を示す。
DAGMとKolektorSDDでは100\%の検出率を示し、したがってデータセットを完全に解決する。
3つのデータセットで行った追加のアブレーション研究は、提案した拡張のそれぞれに対する全体的な改善への貢献を定量的に示す。
関連論文リスト
- A Scalable and Generalized Deep Learning Framework for Anomaly Detection in Surveillance Videos [0.47279903800557493]
ビデオにおける異常検出は、暴力、万引き、破壊など、複雑さ、騒音、多様な活動の性質のために困難である。
既存のアプローチでは、広範囲な再トレーニングなしに、さまざまな異常なタスクにディープラーニングモデルを適用するのに苦労しています。
本研究では,特徴一般化向上のための伝達学習,特徴表現向上のためのモデル融合,マルチタスク分類という,3つの重要なコンポーネントからなる新しいDLフレームワークを導入する。
RLVSデータセット(違反検出)では97.99%、UCFデータセットでは83.59%の精度を達成した。
論文 参考訳(メタデータ) (2024-07-17T22:41:12Z) - Revisiting Generative Adversarial Networks for Binary Semantic
Segmentation on Imbalanced Datasets [20.538287907723713]
異常き裂領域検出は典型的なバイナリセマンティックセグメンテーションタスクであり、アルゴリズムによって舗装面画像上のひび割れを表す画素を自動的に検出することを目的としている。
既存のディープラーニングベースの手法は、特定の公共舗装のデータセットで優れた結果を得たが、不均衡なデータセットでは性能が劇的に低下する。
画素レベルの異常き裂領域検出タスクに対して,条件付き生成逆ネットワーク(cGAN)に基づくディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-03T19:24:40Z) - 2D Feature Distillation for Weakly- and Semi-Supervised 3D Semantic
Segmentation [92.17700318483745]
合成訓練された2Dセマンティックセマンティックセグメンテーションネットワークから高レベル特徴情報を蒸留するアイデアに基づく画像誘導ネットワーク(IGNet)を提案する。
IGNetは、ScribbleKITTI上の弱い教師付きLiDARセマンティックセマンティックセグメンテーションの最先端の結果を達成し、8%のラベル付きポイントしか持たない完全な教師付きトレーニングに対して最大98%のパフォーマンスを誇っている。
論文 参考訳(メタデータ) (2023-11-27T07:57:29Z) - Learning Compact Features via In-Training Representation Alignment [19.273120635948363]
各エポックでは、トレーニングセットからサンプリングしたミニバッチを用いて損失関数の真の勾配を推定する。
In-Training Representation Alignment (ITRA) を提案する。
また,特徴表現学習における一致損失の望ましい影響を厳密に分析する。
論文 参考訳(メタデータ) (2022-11-23T22:23:22Z) - Test-time Adaptation with Slot-Centric Models [63.981055778098444]
Slot-TTAは、半教師付きシーン分解モデルであり、シーンごとのテスト時間は、再構成やクロスビュー合成の目的に対する勾配降下を通じて適用される。
我々は、最先端の監視フィードフォワード検出器と代替テスト時間適応法に対して、配電性能が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2022-03-21T17:59:50Z) - Guided Point Contrastive Learning for Semi-supervised Point Cloud
Semantic Segmentation [90.2445084743881]
そこで本研究では,モデル性能を向上させるために,未ラベルの点群をトレーニングに採用するための半教師付き点群セマンティックセマンティックセマンティックセマンティクスを提案する。
近年の自己監督型タスクのコントラスト損失に触発されて,特徴表現とモデル一般化能力を高めるためのガイド付きポイントコントラスト損失を提案する。
論文 参考訳(メタデータ) (2021-10-15T16:38:54Z) - Point Discriminative Learning for Unsupervised Representation Learning
on 3D Point Clouds [54.31515001741987]
3次元点雲上での教師なし表現学習のための点識別学習法を提案する。
我々は、中間レベルとグローバルレベルの特徴に新しい点識別損失を課すことにより、これを達成した。
提案手法は強力な表現を学習し,新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2021-08-04T15:11:48Z) - Unsupervised Scale-consistent Depth Learning from Video [131.3074342883371]
本研究では,単眼深度推定器SC-Depthを提案する。
スケール一貫性予測の能力により,我々の単分子学習深層ネットワークは簡単にORB-SLAM2システムに統合可能であることを示す。
提案したハイブリッドPseudo-RGBD SLAMは、KITTIにおいて魅力的な結果を示し、追加のトレーニングなしでKAISTデータセットにうまく一般化する。
論文 参考訳(メタデータ) (2021-05-25T02:17:56Z) - InverseForm: A Loss Function for Structured Boundary-Aware Segmentation [80.39674800972182]
逆変換ネットワークを用いたセマンティックセグメンテーションのための新しい境界認識損失項を提案する。
このプラグイン損失項は境界変換の捕捉におけるクロスエントロピー損失を補完する。
室内および屋外のセグメンテーションベンチマークにおける損失関数の定量的および定性的効果を解析した。
論文 参考訳(メタデータ) (2021-04-06T18:52:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。