論文の概要: Deep Learning Approach Combining Lightweight CNN Architecture with
Transfer Learning: An Automatic Approach for the Detection and Recognition of
Bangladeshi Banknotes
- arxiv url: http://arxiv.org/abs/2101.05081v1
- Date: Thu, 10 Dec 2020 15:36:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-15 14:17:39.984069
- Title: Deep Learning Approach Combining Lightweight CNN Architecture with
Transfer Learning: An Automatic Approach for the Detection and Recognition of
Bangladeshi Banknotes
- Title(参考訳): ライトウェイトCNNアーキテクチャとトランスファーラーニングを組み合わせた深層学習アプローチ:バングラデシュ紙幣の自動検出と認識のためのアプローチ
- Authors: Ali Hasan Md. Linkon, Md. Mahir Labib, Faisal Haque Bappy, Soumik
Sarker, Marium-E-Jannat and Md Saiful Islam
- Abstract要約: 本稿では,軽量畳み込みニューラルネットワークアーキテクチャに基づく最先端の深層学習手法について述べる。
MobileNet を使用した 8000 画像データセットの最大テスト精度は 98.88%、NASNetMobile を用いた 1970 画像データセットでは 100%、MobileNet を用いた組み合わせデータセット (9970 画像) では 97.77% を達成しました。
- 参考スコア(独自算出の注目度): 0.7503129292751939
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic detection and recognition of banknotes can be a very useful
technology for people with visual difficulties and also for the banks itself by
providing efficient management for handling different paper currencies.
Lightweight models can easily be integrated into any handy IoT based
gadgets/devices. This article presents our experiments on several
state-of-the-art deep learning methods based on Lightweight Convolutional
Neural Network architectures combining with transfer learning. ResNet152v2,
MobileNet, and NASNetMobile were used as the base models with two different
datasets containing Bangladeshi banknote images. The Bangla Currency dataset
has 8000 Bangladeshi banknote images where the Bangla Money dataset consists of
1970 images. The performances of the models were measured using both the
datasets and the combination of the two datasets. In order to achieve maximum
efficiency, we used various augmentations, hyperparameter tuning, and
optimizations techniques. We have achieved maximum test accuracy of 98.88\% on
8000 images dataset using MobileNet, 100\% on the 1970 images dataset using
NASNetMobile, and 97.77\% on the combined dataset (9970 images) using
MobileNet.
- Abstract(参考訳): 紙幣の自動検出と認識は、視覚障害者や銀行自身にとって、異なる紙幣を扱うための効率的な管理を提供することで、非常に有用な技術である。
軽量モデルは、あらゆる便利なIoTベースのガジェット/デバイスに簡単に統合できる。
本稿では,移動学習と組み合わせた軽量畳み込みニューラルネットワークアーキテクチャに基づく最先端の深層学習手法について述べる。
バングラデシュの紙幣画像を含む2つの異なるデータセットを持つベースモデルとして、ResNet152v2、MobileNet、NASNetMobileが使用された。
バングラ通貨のデータセットは、バングラデシュの銀行券8000枚で、バングラ通貨のデータセットは1970年の画像で構成されている。
モデルの性能は、データセットと2つのデータセットの組み合わせの両方を用いて測定した。
最大効率を達成するために,様々な拡張,ハイパーパラメータチューニング,最適化技術を用いた。
我々は、MobileNetを用いた8000の画像データセットで98.88\%、NASNetMobileを用いた1970年の画像データセットで100\%、MobileNetを用いた組み合わせデータセット(9970画像)で97.77\%の最大テスト精度を達成した。
関連論文リスト
- Semantic segmentation on multi-resolution optical and microwave data using deep learning [0.0]
畳み込みニューラルネットワークに基づく修正U-NetモデルとVGG-UNetモデルにより、衛星画像からオブジェクトを自動的に識別する。
Cartosat 2S (1m空間分解能)データセットが使用された。
ディープラーニングモデルは、95%以上の精度でテストデータセットから構築された形状と船を検出するために実装された。
論文 参考訳(メタデータ) (2024-11-12T06:33:09Z) - CtrLoRA: An Extensible and Efficient Framework for Controllable Image Generation [69.43106794519193]
本稿では,複数のベース条件からイメージ・ツー・イメージ生成の共通知識を学習するために,ベース制御ネットを訓練するCtrLoRAフレームワークを提案する。
学習可能なパラメータをControlNetと比較して90%削減し,モデルの重み付けとデプロイのしきい値を大幅に下げる。
論文 参考訳(メタデータ) (2024-10-12T07:04:32Z) - Self-Supervised Masked Digital Elevation Models Encoding for
Low-Resource Downstream Tasks [0.6374763930914523]
GeoAIは、何十年にもわたって収集されてきたデータのために、自己管理の方法論を活用することができる。
提案されたアーキテクチャは、ImageNetで事前トレーニングされたMasked Autoencoderである。
論文 参考訳(メタデータ) (2023-09-06T21:20:10Z) - Dataset Quantization [72.61936019738076]
大規模データセットを小さなサブセットに圧縮する新しいフレームワークであるデータセット量子化(DQ)を提案する。
DQは、ImageNet-1kのような大規模データセットを最先端圧縮比で蒸留する最初の方法である。
論文 参考訳(メタデータ) (2023-08-21T07:24:29Z) - Squeezing nnU-Nets with Knowledge Distillation for On-Board Cloud
Detection [29.014110832117993]
nnU-Netsは、さまざまなデータセット上でセグメンテーションネットワークのメタラーニングを実行することができる、自己再構成可能なフレームワークである。
我々は知識蒸留でnnU-Netをより小さくコンパクトなU-Netに圧縮する。
当社のアプローチは、On Cloud N: Cloud Cover Detection Challengeで、上位7%のソリューション(847チーム中)にランクインしました。
論文 参考訳(メタデータ) (2023-06-16T14:53:36Z) - Training Efficient CNNS: Tweaking the Nuts and Bolts of Neural Networks
for Lighter, Faster and Robust Models [0.0]
トレーニングパラメータ数を逐次減少させることで,効率的な深層畳み込みネットワークを段階的に構築する方法を実証する。
我々は、MNISTのデータに対して、わずか1500のパラメータで99.2%のSOTA精度と、CIFAR-10データセットで140K以上のパラメータで86.01%の精度を達成した。
論文 参考訳(メタデータ) (2022-05-23T13:51:06Z) - Learning Co-segmentation by Segment Swapping for Retrieval and Discovery [67.6609943904996]
この研究の目的は、一対のイメージから視覚的に類似したパターンを効率的に識別することである。
画像中のオブジェクトセグメントを選択し、それを別の画像にコピーペーストすることで、合成トレーニングペアを生成する。
提案手法は,Brueghelデータセット上でのアートワークの詳細検索に対して,明確な改善をもたらすことを示す。
論文 参考訳(メタデータ) (2021-10-29T16:51:16Z) - Multi-Robot Deep Reinforcement Learning for Mobile Navigation [82.62621210336881]
階層的統合モデル(HInt)を用いた深層強化学習アルゴリズムを提案する。
トレーニング時には、HIntは別々の知覚モデルとダイナミクスモデルを学び、テスト時には、HIntは2つのモデルを階層的な方法で統合し、統合モデルとアクションを計画する。
我々のモバイルナビゲーション実験は、HIntが従来の階層的ポリシーや単一ソースアプローチよりも優れていることを示している。
論文 参考訳(メタデータ) (2021-06-24T19:07:40Z) - TNCR: Table Net Detection and Classification Dataset [62.997667081978825]
TNCRデータセットは、スキャンされた文書画像のテーブル検出と5つのクラスに分類される。
我々は、テーブル検出のための最先端のディープラーニングベースの手法を実装し、いくつかの強力なベースラインを構築した。
我々は、テーブルの検出、分類、構造認識に対するより深い学習アプローチを促進するために、TNCRをオープンソースにしました。
論文 参考訳(メタデータ) (2021-06-19T10:48:58Z) - NSGANetV2: Evolutionary Multi-Objective Surrogate-Assisted Neural
Architecture Search [22.848528877480796]
複数の競合対象下で競合するタスク固有モデルを生成するための効率的なNASアルゴリズムを提案する。
2つのサロゲートで構成され、1つはサンプル効率を改善するためにアーキテクチャレベルで、1つはスーパーネットを介して重量レベルで、勾配降下訓練効率を改善する。
提案手法の有効性と汎用性を6つの非標準データセットで示す。
論文 参考訳(メタデータ) (2020-07-20T18:30:11Z) - Neural Data Server: A Large-Scale Search Engine for Transfer Learning
Data [78.74367441804183]
我々は,ターゲットドメインに最も有用な転送学習データを見つけるための大規模検索エンジンであるNeural Data Server (NDS)を紹介した。
NDSは、いくつかの人気のある画像データセットをインデックスするデータサーバで構成され、クライアントにデータを推奨することを目的としている。
我々は,NDSが様々な伝達学習シナリオにおいて有効であることを示し,複数のターゲットデータセットに対して最先端の性能を示す。
論文 参考訳(メタデータ) (2020-01-09T01:21:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。