論文の概要: A Framework for Fast Scalable BNN Inference using Googlenet and Transfer
Learning
- arxiv url: http://arxiv.org/abs/2101.00793v2
- Date: Tue, 5 Jan 2021 07:28:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-11 23:05:33.951369
- Title: A Framework for Fast Scalable BNN Inference using Googlenet and Transfer
Learning
- Title(参考訳): googlenetと転送学習を用いた高速スケーラブルbnn推論のためのフレームワーク
- Authors: Karthik E
- Abstract要約: 本論文は、リアルタイム性能の良い物体検出の高精度化を目指します。
バイナライズニューラルネットワークは、画像分類、オブジェクト検出、セマンティックセグメンテーションなど、さまざまな視覚タスクで高いパフォーマンスを発揮しています。
その結果,移動学習法により検出された物体の精度は,既存手法と比較して高いことがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Efficient and accurate object detection in video and image analysis is one of
the major beneficiaries of the advancement in computer vision systems with the
help of deep learning. With the aid of deep learning, more powerful tools
evolved, which are capable to learn high-level and deeper features and thus can
overcome the existing problems in traditional architectures of object detection
algorithms. The work in this thesis aims to achieve high accuracy in object
detection with good real-time performance.
In the area of computer vision, a lot of research is going into the area of
detection and processing of visual information, by improving the existing
algorithms. The binarized neural network has shown high performance in various
vision tasks such as image classification, object detection, and semantic
segmentation. The Modified National Institute of Standards and Technology
database (MNIST), Canadian Institute for Advanced Research (CIFAR), and Street
View House Numbers (SVHN) datasets are used which is implemented using a
pre-trained convolutional neural network (CNN) that is 22 layers deep.
Supervised learning is used in the work, which classifies the particular
dataset with the proper structure of the model. In still images, to improve
accuracy, Googlenet is used. The final layer of the Googlenet is replaced with
the transfer learning to improve the accuracy of the Googlenet. At the same
time, the accuracy in moving images can be maintained by transfer learning
techniques. Hardware is the main backbone for any model to obtain faster
results with a large number of datasets. Here, Nvidia Jetson Nano is used which
is a graphics processing unit (GPU), that can handle a large number of
computations in the process of object detection. Results show that the accuracy
of objects detected by the transfer learning method is more when compared to
the existing methods.
- Abstract(参考訳): 映像・画像解析における効率よく正確な物体検出は、深層学習の助けを借りたコンピュータビジョンシステムの進歩の大きな恩恵の1つである。
ディープラーニングの助けを借りて、より強力なツールが進化し、高いレベルと深い機能を学ぶことができ、オブジェクト検出アルゴリズムの従来のアーキテクチャにおける既存の問題を克服することができる。
本論文の目的は,オブジェクト検出における高精度なリアルタイム性能の実現である。
コンピュータビジョンの分野では、既存のアルゴリズムを改善することで、視覚情報の検出と処理の分野で多くの研究が進められている。
バイナライズされたニューラルネットワークは、画像分類、オブジェクト検出、セマンティックセグメンテーションなどの様々なビジョンタスクで高いパフォーマンスを示している。
MNIST(Modified National Institute of Standards and Technology database)、CIFAR(Canadian Institute for Advanced Research)、SVHN(Street View House Numbers)データセットは、22層の深さを持つ事前訓練された畳み込みニューラルネットワーク(CNN)を用いて実装されている。
教師付き学習は、特定のデータセットをモデルの適切な構造に分類する作業で使用される。
静止画像では精度を向上させるために、Googlenetが使用される。
Googlenetの最終レイヤは転送学習に置き換えられ、Googlenetの精度が向上する。
同時に、移動画像の精度を転送学習技術により維持することができる。
ハードウェアは、多くのデータセットでより高速な結果を得るために、あらゆるモデルの主要なバックボーンである。
ここで、Nvidia Jetson Nanoはグラフィクス処理ユニット(GPU)であり、オブジェクト検出の過程で大量の計算を処理することができる。
その結果,移動学習法により検出された物体の精度は,既存手法と比較して高いことがわかった。
関連論文リスト
- Deep Neural Networks in Video Human Action Recognition: A Review [21.00217656391331]
映像行動認識はコンピュータビジョンの最も基本的なタスクの1つである。
ディープニューラルネットワークは、RGB、RGB-D、光学フローフォーマットなどの画像のようなピクセルレベルの情報を認識するために構築されている。
本稿では,深層ニューラルネットワークの性能が,特徴学習および抽出タスクにおけるほとんどの技術を上回った。
論文 参考訳(メタデータ) (2023-05-25T03:54:41Z) - Backdoor Attack Detection in Computer Vision by Applying Matrix
Factorization on the Weights of Deep Networks [6.44397009982949]
本稿では,事前訓練したDNNの重みから特徴を抽出するバックドア検出手法を提案する。
他の検出技術と比較して、これはトレーニングデータを必要としないなど、多くのメリットがある。
提案手法は, 競合するアルゴリズムよりも効率性が高く, より正確であり, 深層学習とAIの安全な適用を確実にするのに役立つ。
論文 参考訳(メタデータ) (2022-12-15T20:20:18Z) - Deep Learning Computer Vision Algorithms for Real-time UAVs On-board
Camera Image Processing [77.34726150561087]
本稿では,ディープラーニングに基づくコンピュータビジョンアルゴリズムを用いて,小型UAVのリアルタイムセンサ処理を実現する方法について述べる。
すべてのアルゴリズムは、ディープニューラルネットワークに基づく最先端の画像処理手法を用いて開発されている。
論文 参考訳(メタデータ) (2022-11-02T11:10:42Z) - Comparison Analysis of Traditional Machine Learning and Deep Learning
Techniques for Data and Image Classification [62.997667081978825]
本研究の目的は、コンピュータビジョン2次元オブジェクト分類タスクに使用される最も一般的な機械学習およびディープラーニング技術を分析し比較することである。
まず、視覚語モデルと深部畳み込みニューラルネットワーク(DCNN)の理論的背景を示す。
次に、Bag of Visual Wordsモデル、VGG16 CNN Architectureを実装します。
論文 参考訳(メタデータ) (2022-04-11T11:34:43Z) - Hybrid Optimized Deep Convolution Neural Network based Learning Model
for Object Detection [0.0]
物体の識別はコンピュータビジョンにおける最も基本的で難しい問題の1つである。
近年,ディープラーニングに基づく物体検出技術が大衆の関心を集めている。
本研究では,自律型物体検出システムを構築するために,独自のディープラーニング分類手法を用いる。
提案するフレームワークは検出精度0.9864であり、現在の技術よりも高い。
論文 参考訳(メタデータ) (2022-03-02T04:39:37Z) - NAS-FCOS: Efficient Search for Object Detection Architectures [113.47766862146389]
簡易なアンカーフリー物体検出器の特徴ピラミッドネットワーク (FPN) と予測ヘッドを探索し, より効率的な物体検出手法を提案する。
慎重に設計された検索空間、検索アルゴリズム、ネットワーク品質を評価するための戦略により、8つのV100 GPUを使用して、4日以内に最高のパフォーマンスの検知アーキテクチャを見つけることができる。
論文 参考訳(メタデータ) (2021-10-24T12:20:04Z) - PCLs: Geometry-aware Neural Reconstruction of 3D Pose with Perspective
Crop Layers [111.55817466296402]
我々は、カメラ幾何学に基づく関心領域の視点作物であるパースペクティブ・クロップ・レイヤ(PCL)を紹介する。
PCLは、エンドツーエンドのトレーニングと基礎となるニューラルネットワークのパラメータ数を残しながら、位置依存的な視点効果を決定論的に除去する。
PCLは、既存の3D再構成ネットワークを幾何学的に認識することで、容易に精度を向上させる手段を提供する。
論文 参考訳(メタデータ) (2020-11-27T08:48:43Z) - Unsupervised Foveal Vision Neural Networks with Top-Down Attention [0.3058685580689604]
本稿では,教師なし学習技術のみを用いたボトムアップ・サリエンシーとトップダウン・アテンションの融合を提案する。
トロントおよびCAT2000データベース上で提案したガンマ塩分濃度法の性能を検証した。
また,CNNの上位層に適用したガンマ塩分度に基づくトップダウンアテンション機構を開発し,背景が乱れの強いマルチオブジェクト画像や画像のシーン理解を改善する。
論文 参考訳(メタデータ) (2020-10-18T20:55:49Z) - Satellite Image Classification with Deep Learning [0.0]
IARPA関数マップ(FMoW)データセットから対象物や施設を63のクラスに分類する深層学習システムについて述べる。
このシステムは、畳み込みニューラルネットワークと、衛星メタデータと画像特徴を統合する追加のニューラルネットワークのアンサンブルで構成されている。
執筆時点では、このシステムはfMoW TopCoderコンペティションで2位だ。
論文 参考訳(メタデータ) (2020-10-13T15:56:58Z) - Curriculum By Smoothing [52.08553521577014]
畳み込みニューラルネットワーク(CNN)は、画像分類、検出、セグメンテーションなどのコンピュータビジョンタスクにおいて顕著な性能を示している。
アンチエイリアスフィルタやローパスフィルタを用いてCNNの機能埋め込みを円滑化するエレガントなカリキュラムベースのスキームを提案する。
トレーニング中に特徴マップ内の情報量が増加するにつれて、ネットワークはデータのより優れた表現を徐々に学習することができる。
論文 参考訳(メタデータ) (2020-03-03T07:27:44Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。