論文の概要: Analysis on DeepLabV3+ Performance for Automatic Steel Defects Detection
- arxiv url: http://arxiv.org/abs/2004.04822v2
- Date: Wed, 15 Apr 2020 03:50:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 03:13:03.422682
- Title: Analysis on DeepLabV3+ Performance for Automatic Steel Defects Detection
- Title(参考訳): 自動鋼板欠陥検出のためのDeepLabV3+の性能解析
- Authors: Zheng Nie, Jiachen Xu, Shengchang Zhang
- Abstract要約: DeepLabV3+は3つの異なるバックボーン、ResNet、DenseNet、EfficientNetをスチールイメージ上のセグメンテーション障害領域でモデル化する。
ResNet101やEfficientNetをバックボーンとして適用すれば、テストセット上で最高のIoUスコアに到達することができる。
バックボーンとしてResNet101を使用したDeepLabV3+モデルは、最も少ないトレーニング時間を持つ。
- 参考スコア(独自算出の注目度): 2.5229940062544505
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Our works experimented DeepLabV3+ with different backbones on a large volume
of steel images aiming to automatically detect different types of steel
defects. Our methods applied random weighted augmentation to balance different
defects types in the training set. And then applied DeeplabV3+ model three
different backbones, ResNet, DenseNet and EfficientNet, on segmenting defection
regions on the steel images. Based on experiments, we found that applying
ResNet101 or EfficientNet as backbones could reach the best IoU scores on the
test set, which is around 0.57, comparing with 0.325 for using DenseNet. Also,
DeepLabV3+ model with ResNet101 as backbone has the fewest training time.
- Abstract(参考訳): 我々の研究は、異なる種類の鋼の欠陥を自動的に検出することを目的として、大量のスチール画像上に異なるバックボーンを持つDeepLabV3+を実験した。
トレーニングセットの異なる欠陥タイプをバランスさせるために,ランダム重み付け法を適用した。
そして、deeplabv3+モデル3つの異なるバックボーン、resnet, densenet, efficientnetをスチール画像のセグメンテーション欠陥領域に適用した。
実験の結果,ResNet101やEfficientNetをバックボーンとして適用すれば,テストセット上で最高のIoUスコアが得られることがわかった。
また、ResNet101をバックボーンとするDeepLabV3+モデルは、最も少ないトレーニング時間を持つ。
関連論文リスト
- Swin3D: A Pretrained Transformer Backbone for 3D Indoor Scene
Understanding [40.68012530554327]
室内3Dシーン理解のための3DバックボーンであるSSTを導入する。
我々は,線形メモリの複雑さを伴うスパースボクセルの自己アテンションを効率的に行える3Dスウィントランスを,バックボーンネットワークとして設計する。
我々のアプローチによって実現されたスケーラビリティ、汎用性、優れたパフォーマンスをさらに検証する大規模なアブレーション研究のシリーズである。
論文 参考訳(メタデータ) (2023-04-14T02:49:08Z) - Reinforce Data, Multiply Impact: Improved Model Accuracy and Robustness
with Dataset Reinforcement [68.44100784364987]
本研究では、強化データセット上でトレーニングされたモデルアーキテクチャの精度が、ユーザにとって追加のトレーニングコストなしで向上するように、データセットを改善する戦略を提案する。
ImageNet+と呼ばれるImageNetトレーニングデータセットの強化バージョンと、強化されたデータセットCIFAR-100+、Flowers-102+、Food-101+を作成します。
ImageNet+でトレーニングされたモデルは、より正確で、堅牢で、校正され、下流タスクにうまく転送されます。
論文 参考訳(メタデータ) (2023-03-15T23:10:17Z) - TANet++: Triple Attention Network with Filtered Pointcloud on 3D
Detection [7.64943832687184]
TANetはKITTIおよびJRDBベンチマークにおける最先端の3Dオブジェクト検出手法の1つである。
本稿では,TANet++による3次元検出の性能向上を提案する。
弱いサンプルによる負の影響を減らすために、トレーニング戦略は以前トレーニングデータをフィルタリングし、TANet++は残りのデータによってトレーニングされる。
論文 参考訳(メタデータ) (2021-06-26T16:56:35Z) - DisCo: Remedy Self-supervised Learning on Lightweight Models with
Distilled Contrastive Learning [94.89221799550593]
SSL(Self-supervised representation Learning)はコミュニティから広く注目を集めている。
最近の研究では、モデルサイズが小さくなれば、その性能は低下すると主張している。
単純かつ効果的な蒸留コントラスト学習(DisCo)を提案し、問題を大きなマージンで緩和します。
論文 参考訳(メタデータ) (2021-04-19T08:22:52Z) - MT3: Meta Test-Time Training for Self-Supervised Test-Time Adaption [69.76837484008033]
ディープラーニングの未解決の問題は、ニューラルネットワークがテスト時間中のドメインシフトに対処する能力である。
メタラーニング、自己監督、テストタイムトレーニングを組み合わせて、目に見えないテスト分布に適応する方法を学びます。
この手法はcifar-10による画像分類ベンチマークの最先端結果を大幅に改善する。
論文 参考訳(メタデータ) (2021-03-30T09:33:38Z) - CNN Model & Tuning for Global Road Damage Detection [0.0]
オブジェクト検出のためのシングルステージおよびマルチステージネットワークアーキテクチャを評価する。
チェコ、インド、日本のスマートフォンカメラを用いた道路被害訓練データセットのデータ準備について述べる。
Resnet-50 と ResnetCSP-101 のバックボーンを持つ多段高速 R-CNN モデルを用いて,Test2 の 0.542 と Test1 の 0.536 の平均 F1 スコアを示す。
論文 参考訳(メタデータ) (2021-03-17T09:01:23Z) - High-Performance Large-Scale Image Recognition Without Normalization [34.58818094675353]
バッチ正規化は、ほとんどの画像分類モデルのキーコンポーネントであるが、多くの望ましくない性質を持っている。
我々は,これらの不安定性を克服する適応的勾配クリッピング手法を開発し,より優れた正規化自由レスネットのクラスを設計する。
大規模事前トレーニング後のImageNetの微調整では,バッチ正規化よりも大幅に性能が向上した。
論文 参考訳(メタデータ) (2021-02-11T18:23:20Z) - Bottleneck Transformers for Visual Recognition [97.16013761605254]
視覚タスクに自己注意を組み込んだ強力なバックボーンアーキテクチャであるBoTNetを提案する。
我々は、ImageNetベンチマークにおいて84.7%のトップ1の精度で高いパフォーマンスを達成するモデルを提案する。
私たちのシンプルで効果的なアプローチが、将来のビジョンのための自己注意モデル研究の強力なベースラインになることを期待しています。
論文 参考訳(メタデータ) (2021-01-27T18:55:27Z) - Model Rubik's Cube: Twisting Resolution, Depth and Width for TinyNets [65.28292822614418]
解像度、深さ、幅を同時に拡大する巨大な公式は、ニューラルネットワークのためのルービックキューブを提供する。
本稿では,最小モデルサイズと計算コストで深層ニューラルネットワークを得るためのツイストルールを検討することを目的とする。
論文 参考訳(メタデータ) (2020-10-28T08:49:45Z) - Improved Residual Networks for Image and Video Recognition [98.10703825716142]
ResNets(Residual Networks)は、CNN(Convolutional Neural Network)アーキテクチャの強力なタイプである。
ベースライン上での精度と学習収束性を一貫した改善を示す。
提案手法では,高度に深いネットワークをトレーニングできるが,ベースラインは厳密な最適化問題を示す。
論文 参考訳(メタデータ) (2020-04-10T11:09:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。