論文の概要: Deep Learning Approach Combining Lightweight CNN Architecture with
Transfer Learning: An Automatic Approach for the Detection and Recognition of
Bangladeshi Banknotes
- arxiv url: http://arxiv.org/abs/2101.05081v1
- Date: Thu, 10 Dec 2020 15:36:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-15 14:17:39.984069
- Title: Deep Learning Approach Combining Lightweight CNN Architecture with
Transfer Learning: An Automatic Approach for the Detection and Recognition of
Bangladeshi Banknotes
- Title(参考訳): ライトウェイトCNNアーキテクチャとトランスファーラーニングを組み合わせた深層学習アプローチ:バングラデシュ紙幣の自動検出と認識のためのアプローチ
- Authors: Ali Hasan Md. Linkon, Md. Mahir Labib, Faisal Haque Bappy, Soumik
Sarker, Marium-E-Jannat and Md Saiful Islam
- Abstract要約: 本稿では,軽量畳み込みニューラルネットワークアーキテクチャに基づく最先端の深層学習手法について述べる。
MobileNet を使用した 8000 画像データセットの最大テスト精度は 98.88%、NASNetMobile を用いた 1970 画像データセットでは 100%、MobileNet を用いた組み合わせデータセット (9970 画像) では 97.77% を達成しました。
- 参考スコア(独自算出の注目度): 0.7503129292751939
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic detection and recognition of banknotes can be a very useful
technology for people with visual difficulties and also for the banks itself by
providing efficient management for handling different paper currencies.
Lightweight models can easily be integrated into any handy IoT based
gadgets/devices. This article presents our experiments on several
state-of-the-art deep learning methods based on Lightweight Convolutional
Neural Network architectures combining with transfer learning. ResNet152v2,
MobileNet, and NASNetMobile were used as the base models with two different
datasets containing Bangladeshi banknote images. The Bangla Currency dataset
has 8000 Bangladeshi banknote images where the Bangla Money dataset consists of
1970 images. The performances of the models were measured using both the
datasets and the combination of the two datasets. In order to achieve maximum
efficiency, we used various augmentations, hyperparameter tuning, and
optimizations techniques. We have achieved maximum test accuracy of 98.88\% on
8000 images dataset using MobileNet, 100\% on the 1970 images dataset using
NASNetMobile, and 97.77\% on the combined dataset (9970 images) using
MobileNet.
- Abstract(参考訳): 紙幣の自動検出と認識は、視覚障害者や銀行自身にとって、異なる紙幣を扱うための効率的な管理を提供することで、非常に有用な技術である。
軽量モデルは、あらゆる便利なIoTベースのガジェット/デバイスに簡単に統合できる。
本稿では,移動学習と組み合わせた軽量畳み込みニューラルネットワークアーキテクチャに基づく最先端の深層学習手法について述べる。
バングラデシュの紙幣画像を含む2つの異なるデータセットを持つベースモデルとして、ResNet152v2、MobileNet、NASNetMobileが使用された。
バングラ通貨のデータセットは、バングラデシュの銀行券8000枚で、バングラ通貨のデータセットは1970年の画像で構成されている。
モデルの性能は、データセットと2つのデータセットの組み合わせの両方を用いて測定した。
最大効率を達成するために,様々な拡張,ハイパーパラメータチューニング,最適化技術を用いた。
我々は、MobileNetを用いた8000の画像データセットで98.88\%、NASNetMobileを用いた1970年の画像データセットで100\%、MobileNetを用いた組み合わせデータセット(9970画像)で97.77\%の最大テスト精度を達成した。
関連論文リスト
- Self-Supervised Masked Digital Elevation Models Encoding for
Low-Resource Downstream Tasks [0.6374763930914523]
GeoAIは、何十年にもわたって収集されてきたデータのために、自己管理の方法論を活用することができる。
提案されたアーキテクチャは、ImageNetで事前トレーニングされたMasked Autoencoderである。
論文 参考訳(メタデータ) (2023-09-06T21:20:10Z) - Dataset Quantization [72.61936019738076]
大規模データセットを小さなサブセットに圧縮する新しいフレームワークであるデータセット量子化(DQ)を提案する。
DQは、ImageNet-1kのような大規模データセットを最先端圧縮比で蒸留する最初の方法である。
論文 参考訳(メタデータ) (2023-08-21T07:24:29Z) - Squeezing nnU-Nets with Knowledge Distillation for On-Board Cloud
Detection [29.014110832117993]
nnU-Netsは、さまざまなデータセット上でセグメンテーションネットワークのメタラーニングを実行することができる、自己再構成可能なフレームワークである。
我々は知識蒸留でnnU-Netをより小さくコンパクトなU-Netに圧縮する。
当社のアプローチは、On Cloud N: Cloud Cover Detection Challengeで、上位7%のソリューション(847チーム中)にランクインしました。
論文 参考訳(メタデータ) (2023-06-16T14:53:36Z) - ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders [104.05133094625137]
完全畳み込み型マスク付きオートエンコーダフレームワークと,新たなグローバル応答正規化層を提案する。
この自己教師付き学習技術とアーキテクチャ改善の共設計により、純粋なConvNetの性能を大幅に向上させるConvNeXt V2と呼ばれる新しいモデルファミリが生まれる。
論文 参考訳(メタデータ) (2023-01-02T18:59:31Z) - Training Efficient CNNS: Tweaking the Nuts and Bolts of Neural Networks
for Lighter, Faster and Robust Models [0.0]
トレーニングパラメータ数を逐次減少させることで,効率的な深層畳み込みネットワークを段階的に構築する方法を実証する。
我々は、MNISTのデータに対して、わずか1500のパラメータで99.2%のSOTA精度と、CIFAR-10データセットで140K以上のパラメータで86.01%の精度を達成した。
論文 参考訳(メタデータ) (2022-05-23T13:51:06Z) - Learning Co-segmentation by Segment Swapping for Retrieval and Discovery [67.6609943904996]
この研究の目的は、一対のイメージから視覚的に類似したパターンを効率的に識別することである。
画像中のオブジェクトセグメントを選択し、それを別の画像にコピーペーストすることで、合成トレーニングペアを生成する。
提案手法は,Brueghelデータセット上でのアートワークの詳細検索に対して,明確な改善をもたらすことを示す。
論文 参考訳(メタデータ) (2021-10-29T16:51:16Z) - Multi-Robot Deep Reinforcement Learning for Mobile Navigation [82.62621210336881]
階層的統合モデル(HInt)を用いた深層強化学習アルゴリズムを提案する。
トレーニング時には、HIntは別々の知覚モデルとダイナミクスモデルを学び、テスト時には、HIntは2つのモデルを階層的な方法で統合し、統合モデルとアクションを計画する。
我々のモバイルナビゲーション実験は、HIntが従来の階層的ポリシーや単一ソースアプローチよりも優れていることを示している。
論文 参考訳(メタデータ) (2021-06-24T19:07:40Z) - TNCR: Table Net Detection and Classification Dataset [62.997667081978825]
TNCRデータセットは、スキャンされた文書画像のテーブル検出と5つのクラスに分類される。
我々は、テーブル検出のための最先端のディープラーニングベースの手法を実装し、いくつかの強力なベースラインを構築した。
我々は、テーブルの検出、分類、構造認識に対するより深い学習アプローチを促進するために、TNCRをオープンソースにしました。
論文 参考訳(メタデータ) (2021-06-19T10:48:58Z) - NSGANetV2: Evolutionary Multi-Objective Surrogate-Assisted Neural
Architecture Search [22.848528877480796]
複数の競合対象下で競合するタスク固有モデルを生成するための効率的なNASアルゴリズムを提案する。
2つのサロゲートで構成され、1つはサンプル効率を改善するためにアーキテクチャレベルで、1つはスーパーネットを介して重量レベルで、勾配降下訓練効率を改善する。
提案手法の有効性と汎用性を6つの非標準データセットで示す。
論文 参考訳(メタデータ) (2020-07-20T18:30:11Z) - AutoFCL: Automatically Tuning Fully Connected Layers for Handling Small
Dataset [13.909484906513102]
提案したAutoFCLモデルは,ベイズ最適化を用いてCNNのFC層の構造を自動学習する。
新しく学習された(ターゲットに依存しない)FC層の微調整は、最先端のパフォーマンスをもたらす。
提案したAutoFCL法は,CalTech-101とOxford-102 Flowersデータセット上で既存の手法より優れている。
論文 参考訳(メタデータ) (2020-01-22T08:39:00Z) - Neural Data Server: A Large-Scale Search Engine for Transfer Learning
Data [78.74367441804183]
我々は,ターゲットドメインに最も有用な転送学習データを見つけるための大規模検索エンジンであるNeural Data Server (NDS)を紹介した。
NDSは、いくつかの人気のある画像データセットをインデックスするデータサーバで構成され、クライアントにデータを推奨することを目的としている。
我々は,NDSが様々な伝達学習シナリオにおいて有効であることを示し,複数のターゲットデータセットに対して最先端の性能を示す。
論文 参考訳(メタデータ) (2020-01-09T01:21:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。