論文の概要: Near real-time map building with multi-class image set labelling and
classification of road conditions using convolutional neural networks
- arxiv url: http://arxiv.org/abs/2001.09947v1
- Date: Mon, 27 Jan 2020 18:07:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-06 07:21:53.767610
- Title: Near real-time map building with multi-class image set labelling and
classification of road conditions using convolutional neural networks
- Title(参考訳): 畳み込みニューラルネットワークを用いたマルチクラス画像ラベリングと道路条件の分類を用いた近時間地図作成
- Authors: Sheela Ramanna and Cenker Sengoz and Scott Kehler and Dat Pham
- Abstract要約: 天候は交通と道路の安全に影響を与える重要な要因である。
北米のストリートカメラやハイウェイカメラが撮影した画像のラベル付けには、最先端の畳み込みニューラルネットワークを活用しています。
- 参考スコア(独自算出の注目度): 3.441021278275805
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weather is an important factor affecting transportation and road safety. In
this paper, we leverage state-of-the-art convolutional neural networks in
labelling images taken by street and highway cameras located across across
North America. Road camera snapshots were used in experiments with multiple
deep learning frameworks to classify images by road condition. The training
data for these experiments used images labelled as dry, wet, snow/ice, poor,
and offline. The experiments tested different configurations of six
convolutional neural networks (VGG-16, ResNet50, Xception, InceptionResNetV2,
EfficientNet-B0 and EfficientNet-B4) to assess their suitability to this
problem. The precision, accuracy, and recall were measured for each framework
configuration. In addition, the training sets were varied both in overall size
and by size of individual classes. The final training set included 47,000
images labelled using the five aforementioned classes. The EfficientNet-B4
framework was found to be most suitable to this problem, achieving validation
accuracy of 90.6%, although EfficientNet-B0 achieved an accuracy of 90.3% with
half the execution time. It was observed that VGG-16 with transfer learning
proved to be very useful for data acquisition and pseudo-labelling with limited
hardware resources, throughout this project. The EfficientNet-B4 framework was
then placed into a real-time production environment, where images could be
classified in real-time on an ongoing basis. The classified images were then
used to construct a map showing real-time road conditions at various camera
locations across North America. The choice of these frameworks and our analysis
take into account unique requirements of real-time map building functions. A
detailed analysis of the process of semi-automated dataset labelling using
these frameworks is also presented in this paper.
- Abstract(参考訳): 天候は交通と道路の安全に影響を与える重要な要因である。
本稿では,北米を横断する道路カメラやハイウェイカメラが撮影した画像のラベル付けに最先端の畳み込みニューラルネットワークを活用する。
道路カメラスナップショットは、複数のディープラーニングフレームワークを用いた実験で、道路条件による画像の分類に使用された。
これらの実験のトレーニングデータには、乾燥、湿潤、雪と氷、貧弱、オフラインというラベルのついた画像が使用された。
実験では、6つの畳み込みニューラルネットワーク(vgg-16, resnet50, xception, inceptionresnetv2, efficientnet-b0, efficientnet-b4)の異なる構成をテストし、この問題に対する適合性を評価した。
各フレームワークの構成について,精度,精度,リコールを測定した。
また、トレーニングセットは、全体のサイズと個々のクラスの大きさの両方で変化した。
最終トレーニングセットには、前述の5つのクラスを使用してラベル付けされた47,000の画像が含まれていた。
EfficientNet-B4フレームワークは90.6%の精度でこの問題に最も適していることが判明したが、EfficientNet-B0は実行時間の半分で90.3%の精度を達成した。
転送学習を用いたVGG-16は, ハードウェアリソースの限られたデータ取得や擬似ラベリングに非常に有用であることが確認された。
EfficientNet-B4フレームワークはその後リアルタイム生産環境に配置され、画像は継続的にリアルタイムで分類される。
分類された画像は、北米の様々なカメラでリアルタイムの道路状況を示す地図を構築するために使用された。
これらのフレームワークの選択と分析は、リアルタイムマップ構築機能のユニークな要件を考慮している。
本稿では,これらのフレームワークを用いた半自動データセットラベリングのプロセスの詳細な解析を行う。
関連論文リスト
- XLD: A Cross-Lane Dataset for Benchmarking Novel Driving View Synthesis [84.23233209017192]
本稿では,自律走行シミュレーションに特化して設計された新しい駆動ビュー合成データセットとベンチマークを提案する。
データセットには、トレーニング軌跡から1-4mずれて取得した画像のテストが含まれているため、ユニークなものだ。
我々は、フロントオンリーおよびマルチカメラ設定下で、既存のNVSアプローチを評価するための最初の現実的なベンチマークを確立する。
論文 参考訳(メタデータ) (2024-06-26T14:00:21Z) - Beyond Cross-view Image Retrieval: Highly Accurate Vehicle Localization
Using Satellite Image [91.29546868637911]
本稿では,地上画像と架空衛星地図とをマッチングすることにより,車載カメラのローカライゼーションの問題に対処する。
鍵となる考え方は、タスクをポーズ推定として定式化し、ニューラルネットベースの最適化によってそれを解くことである。
標準自動運転車のローカライゼーションデータセットの実験により,提案手法の優位性が確認された。
論文 参考訳(メタデータ) (2022-04-10T19:16:58Z) - Efficient deep learning models for land cover image classification [0.29748898344267777]
土地利用土地被覆(LULC)画像分類のためのBigEarthNetデータセットを用いて実験を行った。
コンボリューションニューラルネットワーク、マルチ層パーセプトロン、ビジュアルトランスフォーマー、効率的なネットワーク、ワイド残留ネットワーク(WRN)など、さまざまな最先端モデルをベンチマークする。
提案する軽量モデルは、訓練可能なパラメータが桁違いに小さく、平均的なFスコア分類精度が19のLULCクラスすべてに対して4.5%向上し、ベースラインとして使用するResNet50の2倍高速に訓練される。
論文 参考訳(メタデータ) (2021-11-18T00:03:14Z) - Rail-5k: a Real-World Dataset for Rail Surface Defects Detection [10.387206647221626]
本稿では,実世界のアプリケーションシナリオにおける視覚アルゴリズムの性能をベンチマークするためのRail-5kデータセットを提案する。
われわれは、中国各地の鉄道から5万枚以上の高品質の画像を集め、1100枚の画像に注釈を付け、鉄道の専門家の助けを借りて、最も一般的な13種類の鉄道欠陥を特定した。
論文 参考訳(メタデータ) (2021-06-28T01:53:52Z) - Post-training deep neural network pruning via layer-wise calibration [70.65691136625514]
本論文では,自動合成フラクタル画像に基づくコンピュータビジョンモデルに対するデータフリーな拡張を提案する。
実データを使用する場合は、トレーニング後の設定で65%の間隔で8ビットの精度でImageNet上のResNet50モデルを取得できます。
論文 参考訳(メタデータ) (2021-04-30T14:20:51Z) - 3D-DEEP: 3-Dimensional Deep-learning based on elevation patterns forroad
scene interpretation [0.0]
CNNに基づくセマンティックセグメンテーションのための新しいネットアーキテクチャ(3D-DEEP)とそのエンドツーエンドトレーニング手法について述べる。
開発されたモデルは、Cityscapesデータセット上でトレーニングされ、検証された。
一方、KITTIdatasetでは、F1エラー値は97.85%、96.02%に達している。
論文 参考訳(メタデータ) (2020-09-01T10:18:08Z) - Syn2Real Transfer Learning for Image Deraining using Gaussian Processes [92.15895515035795]
CNNに基づく画像デライニング手法は,再現誤差や視覚的品質の点で優れた性能を発揮している。
実世界の完全ラベル付き画像デライニングデータセットを取得する上での課題により、既存の手法は合成されたデータのみに基づいて訓練される。
本稿では,ガウス過程に基づく半教師付き学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-10T00:33:18Z) - Optimization of Image Embeddings for Few Shot Learning [0.0]
私たちは、それらを生成するのに要する時間とコストで作られた埋め込みの品質を改善します。
提案した実装は,Omniglotデータセット上での1ショットと5ショットの学習において,既存の手法よりも優れている。
論文 参考訳(メタデータ) (2020-04-04T22:17:08Z) - Fixing the train-test resolution discrepancy: FixEfficientNet [98.64315617109344]
本稿では,複数のトレーニング手順を用いて,効率的なNet画像分類器の性能解析を行う。
FixEfficientNetと呼ばれる結果のネットワークは、同じ数のパラメータで初期アーキテクチャを著しく上回る。
論文 参考訳(メタデータ) (2020-03-18T14:22:58Z) - R-FCN: Object Detection via Region-based Fully Convolutional Networks [87.62557357527861]
我々は,高精度かつ効率的な物体検出のための領域ベースの完全畳み込みネットワークを提案する。
我々の結果は、Faster R-CNNよりも2.5-20倍高速で、1画像あたり170msのテストタイムで達成される。
論文 参考訳(メタデータ) (2016-05-20T15:50:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。