論文の概要: Reinforcement Learning Based Handwritten Digit Recognition with
Two-State Q-Learning
- arxiv url: http://arxiv.org/abs/2007.01193v2
- Date: Mon, 10 Aug 2020 10:17:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-16 02:32:54.475308
- Title: Reinforcement Learning Based Handwritten Digit Recognition with
Two-State Q-Learning
- Title(参考訳): 強化学習に基づく2状態q-learningによる手書き文字認識
- Authors: Abdul Mueed Hafiz, Ghulam Mohiuddin Bhat
- Abstract要約: 本稿では,ディープラーニングと強化学習に基づくハイブリッドアプローチを提案する。
Q-Learningは2つのQ状態と4つのアクションで使用される。
提案手法は,AlexNet,CNN-Nearest Neighbor,CNNSupport Vector Machineなどの現代技術よりも優れている。
- 参考スコア(独自算出の注目度): 1.8782750537161614
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a simple yet efficient Hybrid Classifier based on Deep Learning
and Reinforcement Learning. Q-Learning is used with two Q-states and four
actions. Conventional techniques use feature maps extracted from Convolutional
Neural Networks (CNNs) and include them in the Qstates along with past history.
This leads to difficulties with these approaches as the number of states is
very large number due to high dimensions of the feature maps. Since our method
uses only two Q-states it is simple and has much lesser number of parameters to
optimize and also thus has a straightforward reward function. Also, the
approach uses unexplored actions for image processing vis-a-vis other
contemporary techniques. Three datasets have been used for benchmarking of the
approach. These are the MNIST Digit Image Dataset, the USPS Digit Image Dataset
and the MATLAB Digit Image Dataset. The performance of the proposed hybrid
classifier has been compared with other contemporary techniques like a
well-established Reinforcement Learning Technique, AlexNet, CNN-Nearest
Neighbor Classifier and CNNSupport Vector Machine Classifier. Our approach
outperforms these contemporary hybrid classifiers on all the three datasets
used.
- Abstract(参考訳): 深層学習と強化学習に基づく簡易かつ効率的なハイブリッド分類器を提案する。
Q-Learningは2つのQ状態と4つのアクションで使用される。
従来の手法では畳み込みニューラルネットワーク(cnns)から抽出された特徴マップを使用し、過去の履歴とともにqstateに含める。
このことは、特徴写像の高次元のため状態の数が非常に多いため、これらのアプローチの難しさにつながる。
本手法は2つのq状態のみを使用するため,最適化するパラメータがはるかに少なく,簡単な報酬機能を備えている。
また、このアプローチは未探索のアクションを画像処理のvis-a-visに使用する。
このアプローチのベンチマークには3つのデータセットが使用されている。
これらはMNIST Digit Image Dataset、USPS Digit Image Dataset、MATLAB Digit Image Datasetである。
このハイブリッド分類器の性能は、よく確立された強化学習技術、AlexNet、CNN-Nearest Neighbor Classifier、CNNSupport Vector Machine Classifierなどの現代技術と比較されている。
提案手法は, 使用した3つのデータセットすべてにおいて, 現代のハイブリッド分類器よりも優れている。
関連論文リスト
- Hybrid CNN Bi-LSTM neural network for Hyperspectral image classification [1.2691047660244332]
本稿では,3次元CNN,2次元CNN,Bi-LSTMを組み合わせたニューラルネットワークを提案する。
99.83、99.98、100%の精度を達成でき、それぞれIP、PU、SAデータセットにおける最先端モデルのトレーニング可能なパラメータは30%に過ぎなかった。
論文 参考訳(メタデータ) (2024-02-15T15:46:13Z) - MOCA: Self-supervised Representation Learning by Predicting Masked Online Codebook Assignments [72.6405488990753]
自己教師付き学習は、ビジョントランスフォーマーネットワークの欲求を軽減できる。
所望のプロパティを統一する単段および単段のMOCAを提案する。
我々は,様々な評価プロトコルにおいて,低照度設定と強力な実験結果に対して,最先端の新たな結果を得る。
論文 参考訳(メタデータ) (2023-07-18T15:46:20Z) - Boosting Low-Data Instance Segmentation by Unsupervised Pre-training
with Saliency Prompt [103.58323875748427]
この研究は、低データ体制のための新しい教師なし事前学習ソリューションを提供する。
近年のPrompting技術の成功に触発されて,QEISモデルを強化した新しい事前学習手法を導入する。
実験結果から,本手法は3つのデータセット上でのいくつかのQEISモデルを大幅に向上させることが示された。
論文 参考訳(メタデータ) (2023-02-02T15:49:03Z) - RankDNN: Learning to Rank for Few-shot Learning [70.49494297554537]
本稿では、画像検索の関連性ランキングをバイナリランキング関係分類として活用する、新しい数ショット学習パイプラインを提案する。
これは、数ショットの学習に関する新しい視点を提供し、最先端の手法を補完する。
論文 参考訳(メタデータ) (2022-11-28T13:59:31Z) - Focal Sparse Convolutional Networks for 3D Object Detection [121.45950754511021]
我々はスパースCNNの能力を高めるために2つの新しいモジュールを導入する。
焦点スパース・コンボリューション(Focals Conv)であり、焦点スパース・コンボリューションの多様変種である。
スパース・コンボリューションにおける空間的に学習可能な空間空間性は,高度な3次元物体検出に不可欠であることを示す。
論文 参考訳(メタデータ) (2022-04-26T17:34:10Z) - Comparison Analysis of Traditional Machine Learning and Deep Learning
Techniques for Data and Image Classification [62.997667081978825]
本研究の目的は、コンピュータビジョン2次元オブジェクト分類タスクに使用される最も一般的な機械学習およびディープラーニング技術を分析し比較することである。
まず、視覚語モデルと深部畳み込みニューラルネットワーク(DCNN)の理論的背景を示す。
次に、Bag of Visual Wordsモデル、VGG16 CNN Architectureを実装します。
論文 参考訳(メタデータ) (2022-04-11T11:34:43Z) - A Novel Hand Gesture Detection and Recognition system based on
ensemble-based Convolutional Neural Network [3.5665681694253903]
コンピュータビジョンとパターン認識コミュニティでは,手の部分検出が課題となっている。
畳み込みニューラルネットワーク(CNN)アーキテクチャのようなディープラーニングアルゴリズムは、分類タスクにおいて非常に一般的な選択肢となっている。
本稿では,CNNに基づくアプローチのアンサンブルを用いて,予測時の高分散や過度な問題,予測誤差などの問題を克服する。
論文 参考訳(メタデータ) (2022-02-25T06:46:58Z) - Overhead-MNIST: Machine Learning Baselines for Image Classification [0.0]
23の機械学習アルゴリズムをトレーニングし、ベースライン比較メトリクスを確立する。
Overhead-MNISTデータセットは、ユビキタスなMNISTの手書き桁に似たスタイルの衛星画像の集合である。
本稿では,エッジの展開性および今後の性能向上のためのベースラインとして,全体的な性能向上アルゴリズムについて述べる。
論文 参考訳(メタデータ) (2021-07-01T13:30:39Z) - Segment as Points for Efficient Online Multi-Object Tracking and
Segmentation [66.03023110058464]
本稿では,コンパクトな画像表現を非秩序な2次元点クラウド表現に変換することで,セグメントに基づくインスタンス埋め込みの学習に有効な方法を提案する。
本手法は,画像ではなく,ランダムに選択された点から識別インスタンスの埋め込みを学習する,新たなトラッキング・バイ・ポイントのパラダイムを生成する。
PointTrackという名前のオンラインMOTSフレームワークは、最先端のすべてのメソッドを大きなマージンで上回っている。
論文 参考訳(メタデータ) (2020-07-03T08:29:35Z) - Image Classification by Reinforcement Learning with Two-State Q-Learning [0.0]
深層学習と強化学習に基づくハイブリッドインセプションが提案されている。
提案手法は2つのQ状態しか使用せず,最適化パラメータがはるかに少ない。
論文 参考訳(メタデータ) (2020-06-28T14:54:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。