論文の概要: CNN Model & Tuning for Global Road Damage Detection
- arxiv url: http://arxiv.org/abs/2103.09512v1
- Date: Wed, 17 Mar 2021 09:01:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-18 18:28:25.030241
- Title: CNN Model & Tuning for Global Road Damage Detection
- Title(参考訳): グローバル道路損傷検出のためのCNNモデルとチューニング
- Authors: Rahul Vishwakarma and Ravigopal Vennelakanti (Hitachi America Ltd.
R&D)
- Abstract要約: オブジェクト検出のためのシングルステージおよびマルチステージネットワークアーキテクチャを評価する。
チェコ、インド、日本のスマートフォンカメラを用いた道路被害訓練データセットのデータ準備について述べる。
Resnet-50 と ResnetCSP-101 のバックボーンを持つ多段高速 R-CNN モデルを用いて,Test2 の 0.542 と Test1 の 0.536 の平均 F1 スコアを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This paper provides a report on our solution including model selection,
tuning strategy and results obtained for Global Road Damage Detection
Challenge. This Big Data Cup Challenge was held as a part of IEEE International
Conference on Big Data 2020. We assess single and multi-stage network
architectures for object detection and provide a benchmark using popular
state-of-the-art open-source PyTorch frameworks like Detectron2 and Yolov5.
Data preparation for provided Road Damage training dataset, captured using
smartphone camera from Czech, India and Japan is discussed. We studied the
effect of training on a per country basis with respect to a single
generalizable model. We briefly describe the tuning strategy for the
experiments conducted on two-stage Faster R-CNN with Deep Residual Network
(Resnet) and Feature Pyramid Network (FPN) backbone. Additionally, we compare
this to a one-stage Yolov5 model with Cross Stage Partial Network (CSPNet)
backbone. We show a mean F1 score of 0.542 on Test2 and 0.536 on Test1 datasets
using a multi-stage Faster R-CNN model, with Resnet-50 and Resnet-101 backbones
respectively. This shows the generalizability of the Resnet-50 model when
compared to its more complex counterparts. Experiments were conducted using
Google Colab having K80 and a Linux PC with 1080Ti, NVIDIA consumer grade GPU.
A PyTorch based Detectron2 code to preprocess, train, test and submit the Avg
F1 score to is made available at https://github.com/vishwakarmarhl/rdd2020
- Abstract(参考訳): 本稿では,Global Road Damage Detection Challengeにおいて得られたモデル選択,チューニング戦略,および結果を含むソリューションについて報告する。
このBig Data Cup Challengeは、IEEE International Conference on Big Data 2020の一部として開催された。
我々は、オブジェクト検出のためのシングルステージおよびマルチステージネットワークアーキテクチャを評価し、Tectron2やYolov5のような最先端のオープンソースのPyTorchフレームワークを使用したベンチマークを提供する。
チェコ、インド、日本のスマートフォンカメラを用いた道路被害訓練データセットのデータ準備について述べる。
本研究では,1つの一般化可能なモデルに対して,国ごとのトレーニングの効果を検討した。
本稿では,Deep Residual Network (Resnet) とFeature Pyramid Network (FPN) のバックボーンを用いた2段高速R-CNN実験のチューニング戦略について述べる。
さらに、これをクロスステージ部分ネットワーク(cspnet)バックボーンを持つ1段階のyolov5モデルと比較する。
テスト2では平均F1スコアが0.542、テスト1では0.536と、Resnet-50とResnet-101のバックボーンを持つマルチステージの高速R-CNNモデルを用いて示す。
これはResnet-50モデルのより複雑なモデルと比較して一般化可能であることを示している。
k80を持つgoogle colabと1080tiのnvidia consumer grade gpuを備えたlinux pcを用いて実験を行った。
PyTorch ベースの Detectron2 コードによる Avg F1 スコアの事前処理、トレーニング、テスト、提出は https://github.com/vishwakarmarhl/rdd2020 で行われている。
関連論文リスト
- Distributionally Robust Classification on a Data Budget [26.69877485937123]
2.4万の画像サンプル上でのクロスエントロピー損失でトレーニングされた標準ResNet-50は、4億の画像サンプルでトレーニングされたCLIP ResNet-50と同等の堅牢性を達成できることを示す。
これは、限られたデータ予算に対して(ほぼ)最先端の分散ロバスト性を示す最初の結果である。
論文 参考訳(メタデータ) (2023-08-07T15:30:02Z) - InternImage: Exploring Large-Scale Vision Foundation Models with
Deformable Convolutions [95.94629864981091]
この研究は、パラメータの増加やViTsのようなトレーニングデータから得られるインターンイメージと呼ばれる、CNNベースの新しい大規模ファンデーションモデルを提案する。
提案されたInternImageは、従来のCNNの厳格な帰納バイアスを低減し、ViTのような大規模データから、より強く堅牢なパターンを学習できるようにする。
論文 参考訳(メタデータ) (2022-11-10T18:59:04Z) - EAutoDet: Efficient Architecture Search for Object Detection [110.99532343155073]
EAutoDetフレームワークは、1.4GPU日でオブジェクト検出のための実用的なバックボーンとFPNアーキテクチャを検出できる。
本稿では,一方のエッジ上での候補演算の重みを共有し,それらを一つの畳み込みに集約することでカーネル再利用手法を提案する。
特に、発見されたアーキテクチャは最先端のオブジェクト検出NAS法を超越し、120 FPSで40.1 mAP、49.2 mAP、41.3 FPSをCOCOテストデブセットで達成している。
論文 参考訳(メタデータ) (2022-03-21T05:56:12Z) - Machine Learning Models in Stock Market Prediction [0.0]
本論文は,8つの教師付き機械学習モデルを用いて,ニフティ50指数を予測することに焦点を当てている。
実験は、1996年4月22日から2021年4月16日までのインド株式市場ニフティ50指数の歴史的データに基づいている。
論文 参考訳(メタデータ) (2022-02-06T10:33:42Z) - Pixel Difference Networks for Efficient Edge Detection [71.03915957914532]
本稿では,Pixel Difference Network (PiDiNet) という軽量かつ効率的なエッジ検出アーキテクチャを提案する。
BSDS500、NYUD、Multicueのデータセットに関する大規模な実験が、その効果を示すために提供されている。
0.1M未満のパラメータを持つPiDiNetのより高速なバージョンは、200FPSのアーティファクトで同等のパフォーマンスを達成できる。
論文 参考訳(メタデータ) (2021-08-16T10:42:59Z) - ANNETTE: Accurate Neural Network Execution Time Estimation with Stacked
Models [56.21470608621633]
本稿では,アーキテクチャ検索を対象ハードウェアから切り離すための時間推定フレームワークを提案する。
提案手法は,マイクロカーネルと多層ベンチマークからモデルの集合を抽出し,マッピングとネットワーク実行時間推定のためのスタックモデルを生成する。
生成した混合モデルの推定精度と忠実度, 統計モデルとルーフラインモデル, 評価のための洗練されたルーフラインモデルを比較した。
論文 参考訳(メタデータ) (2021-05-07T11:39:05Z) - Road Damage Detection and Classification with Detectron2 and Faster
R-CNN [0.0]
我々は,異なるベースモデルと構成を用いて,より高速なR-CNNの実装を評価する。
我々はまた、これらのアプローチを、IEEE Big Data 2020 Big Data Cup ChallengeデータセットのトラックであるGlobal Road Damage Detection Challenge 2020を用いて実験した。
論文 参考訳(メタデータ) (2020-10-28T14:53:17Z) - A CNN-LSTM Architecture for Detection of Intracranial Hemorrhage on CT
scans [0.3670422696827525]
本稿では,脳内出血の正確な予測のために,畳み込みニューラルネットワーク(CNN)と長期記憶機構(LSTM)を組み合わせた新しい手法を提案する。
CNNはスライスワイズ機能抽出器の役割を担い、LSTMはスライス機能間のリンクを担当している。
近年のRSNA頭蓋内出血検出とCQ500データセットを用いて本手法の有効性を検証した。
論文 参考訳(メタデータ) (2020-05-22T04:00:04Z) - Improved Residual Networks for Image and Video Recognition [98.10703825716142]
ResNets(Residual Networks)は、CNN(Convolutional Neural Network)アーキテクチャの強力なタイプである。
ベースライン上での精度と学習収束性を一貫した改善を示す。
提案手法では,高度に深いネットワークをトレーニングできるが,ベースラインは厳密な最適化問題を示す。
論文 参考訳(メタデータ) (2020-04-10T11:09:50Z) - R-FCN: Object Detection via Region-based Fully Convolutional Networks [87.62557357527861]
我々は,高精度かつ効率的な物体検出のための領域ベースの完全畳み込みネットワークを提案する。
我々の結果は、Faster R-CNNよりも2.5-20倍高速で、1画像あたり170msのテストタイムで達成される。
論文 参考訳(メタデータ) (2016-05-20T15:50:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。