論文の概要: Image Classification by Reinforcement Learning with Two-State Q-Learning
- arxiv url: http://arxiv.org/abs/2007.01298v3
- Date: Sat, 31 Oct 2020 13:23:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-16 02:32:35.907827
- Title: Image Classification by Reinforcement Learning with Two-State Q-Learning
- Title(参考訳): 2状態q-learningによる強化学習による画像分類
- Authors: Abdul Mueed Hafiz
- Abstract要約: 深層学習と強化学習に基づくハイブリッドインセプションが提案されている。
提案手法は2つのQ状態しか使用せず,最適化パラメータがはるかに少ない。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, a simple and efficient Hybrid Classifier is presented which is
based on deep learning and reinforcement learning. Here, Q-Learning has been
used with two states and 'two or three' actions. Other techniques found in the
literature use feature map extracted from Convolutional Neural Networks and use
these in the Q-states along with past history. This leads to technical
difficulties in these approaches because the number of states is high due to
large dimensions of the feature map. Because the proposed technique uses only
two Q-states it is straightforward and consequently has much lesser number of
optimization parameters, and thus also has a simple reward function. Also, the
proposed technique uses novel actions for processing images as compared to
other techniques found in literature. The performance of the proposed technique
is compared with other recent algorithms like ResNet50, InceptionV3, etc. on
popular databases including ImageNet, Cats and Dogs Dataset, and Caltech-101
Dataset. The proposed approach outperforms others techniques on all the
datasets used.
- Abstract(参考訳): 本稿では,深層学習と強化学習に基づく,シンプルで効率的なハイブリッド分類器を提案する。
ここで、q-learningは2つの状態と2、3のアクションで使われている。
文献で見られる他のテクニックは、畳み込みニューラルネットワークから抽出された特徴マップを使用し、過去の歴史とともにQ状態で使用する。
これは、機能マップの寸法が大きいため、状態数が多いため、これらのアプローチでは技術的に困難をもたらす。
提案手法は2つのQ状態のみを使用するため、単純であり、最適化パラメータがはるかに少ないため、単純な報酬関数も持つ。
また,本手法は文献で見られる他の手法と比較して,画像処理に新しい手法を用いる。
提案手法の性能は,ImageNet, Cats and Dogs Dataset, Caltech-101 Datasetなどの人気データベース上でのResNet50, InceptionV3などの最近のアルゴリズムと比較される。
提案されたアプローチは、使用するすべてのデータセットで他のテクニックを上回っている。
関連論文リスト
- Best Practices for a Handwritten Text Recognition System [8.334691351242753]
近年,手書き文字認識が急速に進歩している。
小さな前処理素子が変更されても、性能の非自明な偏差を検出することができる。
この研究は、手書き文字認識システムのトレーニングと優れたパフォーマンスを提供するための、シンプルで効果的な経験的実践を強調している。
論文 参考訳(メタデータ) (2024-04-17T13:00:05Z) - Deep Active Ensemble Sampling For Image Classification [8.31483061185317]
アクティブラーニングフレームワークは、最も有益なデータポイントのラベル付けを積極的に要求することで、データアノテーションのコストを削減することを目的としている。
提案手法には、不確実性に基づく手法、幾何学的手法、不確実性に基づく手法と幾何学的手法の暗黙の組み合わせなどがある。
本稿では, サンプル選択戦略における効率的な探索・探索トレードオフを実現するために, 不確実性に基づくフレームワークと幾何学的フレームワークの両方の最近の進歩を革新的に統合する。
本フレームワークは,(1)正確な後続推定,(2)計算オーバーヘッドと高い精度のトレードオフの2つの利点を提供する。
論文 参考訳(メタデータ) (2022-10-11T20:20:20Z) - Meta-Learning Sparse Compression Networks [44.30642520752235]
近年のDeep Learningの研究は、座標空間から基礎となる連続信号への写像としてのデータ表現を再定義している。
Inlicit Neural Representation (INRs) に関する最近の研究は、アーキテクチャ探索に注意を払って、INRが確立された圧縮手法より優れていることを示した。
論文 参考訳(メタデータ) (2022-05-18T14:31:43Z) - Comparison Analysis of Traditional Machine Learning and Deep Learning
Techniques for Data and Image Classification [62.997667081978825]
本研究の目的は、コンピュータビジョン2次元オブジェクト分類タスクに使用される最も一般的な機械学習およびディープラーニング技術を分析し比較することである。
まず、視覚語モデルと深部畳み込みニューラルネットワーク(DCNN)の理論的背景を示す。
次に、Bag of Visual Wordsモデル、VGG16 CNN Architectureを実装します。
論文 参考訳(メタデータ) (2022-04-11T11:34:43Z) - Budget-aware Few-shot Learning via Graph Convolutional Network [56.41899553037247]
本稿では,いくつかの例から新しい視覚概念を学習することを目的とした,数ショット学習の課題に取り組む。
数ショット分類における一般的な問題設定は、データラベルの取得においてランダムサンプリング戦略を前提としている。
そこで我々は,新しい対象カテゴリーの学習を目的とした,予算に配慮した数発の学習問題を新たに導入する。
論文 参考訳(メタデータ) (2022-01-07T02:46:35Z) - Towards Interpretable Deep Metric Learning with Structural Matching [86.16700459215383]
より透過的な埋め込み学習のための深層解釈可能なメトリック学習(DIML)法を提案する。
本手法は,既製のバックボーンネットワークやメトリック学習手法に適用可能な,モデルに依存しない手法である。
我々は,CUB200-2011,Cars196,Stanford Online Productsの3つの大規模メトリクス学習ベンチマークで評価を行った。
論文 参考訳(メタデータ) (2021-08-12T17:59:09Z) - Image Restoration by Deep Projected GSURE [115.57142046076164]
Ill-posed inverse problem は、デブロアリングや超解像など、多くの画像処理アプリケーションに現れる。
本稿では,一般化されたSteinUnbiased Risk Estimator(GSURE)の「投影変換」とCNNによる潜在画像のパラメータ化を含む損失関数の最小化に基づく,新たな画像復元フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-04T08:52:46Z) - Lightweight Single-Image Super-Resolution Network with Attentive
Auxiliary Feature Learning [73.75457731689858]
本稿では,SISR の注意補助機能 (A$2$F) に基づく計算効率が高く正確なネットワークを構築した。
大規模データセットを用いた実験結果から,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-11-13T06:01:46Z) - Knowledge Graph Embedding with Atrous Convolution and Residual Learning [4.582412257655891]
本稿では, 単純だが効果的な畳み込みに基づく知識グラフ埋め込み法を提案する。
アトラスな畳み込みを用いることで、機能相互作用を効果的に増加させる。
元の情報が忘れられた問題と、勾配の問題が消え/露呈する問題に対処する。
論文 参考訳(メタデータ) (2020-10-23T00:57:23Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - Reinforcement Learning Based Handwritten Digit Recognition with
Two-State Q-Learning [1.8782750537161614]
本稿では,ディープラーニングと強化学習に基づくハイブリッドアプローチを提案する。
Q-Learningは2つのQ状態と4つのアクションで使用される。
提案手法は,AlexNet,CNN-Nearest Neighbor,CNNSupport Vector Machineなどの現代技術よりも優れている。
論文 参考訳(メタデータ) (2020-06-28T14:23:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。