Fugu-MT 論文翻訳(概要): CNN Model & Tuning for Global Road Damage Detection

論文の概要: CNN Model & Tuning for Global Road Damage Detection

arxiv url: http://arxiv.org/abs/2103.09512v1
Date: Wed, 17 Mar 2021 09:01:23 GMT
ステータス: 翻訳完了
システム内更新日: 2021-03-18 18:28:25.030241
Title: CNN Model & Tuning for Global Road Damage Detection
Title（参考訳）: グローバル道路損傷検出のためのCNNモデルとチューニング
Authors: Rahul Vishwakarma and Ravigopal Vennelakanti (Hitachi America Ltd. R&D)
Abstract要約: オブジェクト検出のためのシングルステージおよびマルチステージネットワークアーキテクチャを評価する。チェコ、インド、日本のスマートフォンカメラを用いた道路被害訓練データセットのデータ準備について述べる。 Resnet-50 と ResnetCSP-101 のバックボーンを持つ多段高速 R-CNN モデルを用いて,Test2 の 0.542 と Test1 の 0.536 の平均 F1 スコアを示す。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: This paper provides a report on our solution including model selection, tuning strategy and results obtained for Global Road Damage Detection Challenge. This Big Data Cup Challenge was held as a part of IEEE International Conference on Big Data 2020. We assess single and multi-stage network architectures for object detection and provide a benchmark using popular state-of-the-art open-source PyTorch frameworks like Detectron2 and Yolov5. Data preparation for provided Road Damage training dataset, captured using smartphone camera from Czech, India and Japan is discussed. We studied the effect of training on a per country basis with respect to a single generalizable model. We briefly describe the tuning strategy for the experiments conducted on two-stage Faster R-CNN with Deep Residual Network (Resnet) and Feature Pyramid Network (FPN) backbone. Additionally, we compare this to a one-stage Yolov5 model with Cross Stage Partial Network (CSPNet) backbone. We show a mean F1 score of 0.542 on Test2 and 0.536 on Test1 datasets using a multi-stage Faster R-CNN model, with Resnet-50 and Resnet-101 backbones respectively. This shows the generalizability of the Resnet-50 model when compared to its more complex counterparts. Experiments were conducted using Google Colab having K80 and a Linux PC with 1080Ti, NVIDIA consumer grade GPU. A PyTorch based Detectron2 code to preprocess, train, test and submit the Avg F1 score to is made available at https://github.com/vishwakarmarhl/rdd2020
Abstract（参考訳）: 本稿では,Global Road Damage Detection Challengeにおいて得られたモデル選択,チューニング戦略,および結果を含むソリューションについて報告する。このBig Data Cup Challengeは、IEEE International Conference on Big Data 2020の一部として開催された。我々は、オブジェクト検出のためのシングルステージおよびマルチステージネットワークアーキテクチャを評価し、Tectron2やYolov5のような最先端のオープンソースのPyTorchフレームワークを使用したベンチマークを提供する。チェコ、インド、日本のスマートフォンカメラを用いた道路被害訓練データセットのデータ準備について述べる。本研究では,1つの一般化可能なモデルに対して,国ごとのトレーニングの効果を検討した。本稿では,Deep Residual Network (Resnet) とFeature Pyramid Network (FPN) のバックボーンを用いた2段高速R-CNN実験のチューニング戦略について述べる。さらに、これをクロスステージ部分ネットワーク(cspnet)バックボーンを持つ1段階のyolov5モデルと比較する。テスト2では平均F1スコアが0.542、テスト1では0.536と、Resnet-50とResnet-101のバックボーンを持つマルチステージの高速R-CNNモデルを用いて示す。これはResnet-50モデルのより複雑なモデルと比較して一般化可能であることを示している。 k80を持つgoogle colabと1080tiのnvidia consumer grade gpuを備えたlinux pcを用いて実験を行った。 PyTorch ベースの Detectron2 コードによる Avg F1 スコアの事前処理、トレーニング、テスト、提出は https://github.com/vishwakarmarhl/rdd2020 で行われている。

関連論文リスト

Distributionally Robust Classification on a Data Budget [26.69877485937123]
2.4万の画像サンプル上でのクロスエントロピー損失でトレーニングされた標準ResNet-50は、4億の画像サンプルでトレーニングされたCLIP ResNet-50と同等の堅牢性を達成できることを示す。これは、限られたデータ予算に対して(ほぼ)最先端の分散ロバスト性を示す最初の結果である。
論文参考訳（メタデータ） (2023-08-07T15:30:02Z)
InternImage: Exploring Large-Scale Vision Foundation Models with Deformable Convolutions [95.94629864981091]
この研究は、パラメータの増加やViTsのようなトレーニングデータから得られるインターンイメージと呼ばれる、CNNベースの新しい大規模ファンデーションモデルを提案する。提案されたInternImageは、従来のCNNの厳格な帰納バイアスを低減し、ViTのような大規模データから、より強く堅牢なパターンを学習できるようにする。
論文参考訳（メタデータ） (2022-11-10T18:59:04Z)
EAutoDet: Efficient Architecture Search for Object Detection [110.99532343155073]
EAutoDetフレームワークは、1.4GPU日でオブジェクト検出のための実用的なバックボーンとFPNアーキテクチャを検出できる。本稿では,一方のエッジ上での候補演算の重みを共有し,それらを一つの畳み込みに集約することでカーネル再利用手法を提案する。特に、発見されたアーキテクチャは最先端のオブジェクト検出NAS法を超越し、120 FPSで40.1 mAP、49.2 mAP、41.3 FPSをCOCOテストデブセットで達成している。
論文参考訳（メタデータ） (2022-03-21T05:56:12Z)
Machine Learning Models in Stock Market Prediction [0.0]
本論文は,8つの教師付き機械学習モデルを用いて,ニフティ50指数を予測することに焦点を当てている。実験は、1996年4月22日から2021年4月16日までのインド株式市場ニフティ50指数の歴史的データに基づいている。
論文参考訳（メタデータ） (2022-02-06T10:33:42Z)
Pixel Difference Networks for Efficient Edge Detection [71.03915957914532]
本稿では,Pixel Difference Network (PiDiNet) という軽量かつ効率的なエッジ検出アーキテクチャを提案する。 BSDS500、NYUD、Multicueのデータセットに関する大規模な実験が、その効果を示すために提供されている。 0.1M未満のパラメータを持つPiDiNetのより高速なバージョンは、200FPSのアーティファクトで同等のパフォーマンスを達成できる。
論文参考訳（メタデータ） (2021-08-16T10:42:59Z)
ANNETTE: Accurate Neural Network Execution Time Estimation with Stacked Models [56.21470608621633]
本稿では,アーキテクチャ検索を対象ハードウェアから切り離すための時間推定フレームワークを提案する。提案手法は,マイクロカーネルと多層ベンチマークからモデルの集合を抽出し,マッピングとネットワーク実行時間推定のためのスタックモデルを生成する。生成した混合モデルの推定精度と忠実度, 統計モデルとルーフラインモデル, 評価のための洗練されたルーフラインモデルを比較した。
論文参考訳（メタデータ） (2021-05-07T11:39:05Z)
Road Damage Detection and Classification with Detectron2 and Faster R-CNN [0.0]
我々は,異なるベースモデルと構成を用いて,より高速なR-CNNの実装を評価する。我々はまた、これらのアプローチを、IEEE Big Data 2020 Big Data Cup ChallengeデータセットのトラックであるGlobal Road Damage Detection Challenge 2020を用いて実験した。
論文参考訳（メタデータ） (2020-10-28T14:53:17Z)
A CNN-LSTM Architecture for Detection of Intracranial Hemorrhage on CT scans [0.3670422696827525]
本稿では,脳内出血の正確な予測のために,畳み込みニューラルネットワーク(CNN)と長期記憶機構(LSTM)を組み合わせた新しい手法を提案する。 CNNはスライスワイズ機能抽出器の役割を担い、LSTMはスライス機能間のリンクを担当している。近年のRSNA頭蓋内出血検出とCQ500データセットを用いて本手法の有効性を検証した。
論文参考訳（メタデータ） (2020-05-22T04:00:04Z)
Improved Residual Networks for Image and Video Recognition [98.10703825716142]
ResNets(Residual Networks)は、CNN(Convolutional Neural Network)アーキテクチャの強力なタイプである。ベースライン上での精度と学習収束性を一貫した改善を示す。提案手法では,高度に深いネットワークをトレーニングできるが,ベースラインは厳密な最適化問題を示す。
論文参考訳（メタデータ） (2020-04-10T11:09:50Z)
R-FCN: Object Detection via Region-based Fully Convolutional Networks [87.62557357527861]
我々は,高精度かつ効率的な物体検出のための領域ベースの完全畳み込みネットワークを提案する。我々の結果は、Faster R-CNNよりも2.5-20倍高速で、1画像あたり170msのテストタイムで達成される。
論文参考訳（メタデータ） (2016-05-20T15:50:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。