論文の概要: Gaussian RAM: Lightweight Image Classification via Stochastic
Retina-Inspired Glimpse and Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2011.06190v1
- Date: Thu, 12 Nov 2020 04:27:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-26 06:40:46.741658
- Title: Gaussian RAM: Lightweight Image Classification via Stochastic
Retina-Inspired Glimpse and Reinforcement Learning
- Title(参考訳): ガウスRAM:確率的網膜誘発グランプと強化学習による軽量画像分類
- Authors: Dongseok Shim and H. Jin Kim
- Abstract要約: 大規模画像分類のための強化学習に基づく軽量深層ニューラルネットワークを提案する。
我々は,MNIST,Large CIFAR-10,Large CIFAR-100データセットを用いたモデルの評価を行った。
- 参考スコア(独自算出の注目度): 29.798579906253696
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Previous studies on image classification have mainly focused on the
performance of the networks, not on real-time operation or model compression.
We propose a Gaussian Deep Recurrent visual Attention Model (GDRAM)- a
reinforcement learning based lightweight deep neural network for large scale
image classification that outperforms the conventional CNN (Convolutional
Neural Network) which uses the entire image as input. Highly inspired by the
biological visual recognition process, our model mimics the stochastic location
of the retina with Gaussian distribution. We evaluate the model on Large
cluttered MNIST, Large CIFAR-10 and Large CIFAR-100 datasets which are resized
to 128 in both width and height.
- Abstract(参考訳): 画像分類に関するこれまでの研究は、リアルタイム操作やモデル圧縮ではなく、ネットワークの性能に重点を置いてきた。
本稿では,画像全体を入力として使用する従来のcnn (convolutional neural network) に匹敵する大規模画像分類のための,強化学習に基づく軽量深層ニューラルネットワークであるgaussian deep recurrent visual attention model (gdram)を提案する。
生体視覚認識プロセスに強い影響を受け,本モデルはガウス分布を伴う網膜の確率的位置を模倣する。
我々は,MNIST,Large CIFAR-10,Large CIFAR-100データセットを,幅・高さともに128に再検討した。
関連論文リスト
- Towards Scalable and Versatile Weight Space Learning [51.78426981947659]
本稿では,重み空間学習におけるSANEアプローチを紹介する。
ニューラルネットワーク重みのサブセットの逐次処理に向けて,超表現の概念を拡張した。
論文 参考訳(メタデータ) (2024-06-14T13:12:07Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - A Light-weight Deep Learning Model for Remote Sensing Image
Classification [70.66164876551674]
リモートセンシング画像分類(RSIC)のための高性能で軽量なディープラーニングモデルを提案する。
NWPU-RESISC45ベンチマークで広範な実験を行うことで、提案した教師学生モデルは最先端システムより優れている。
論文 参考訳(メタデータ) (2023-02-25T09:02:01Z) - JPEG Steganalysis Based on Steganographic Feature Enhancement and Graph
Attention Learning [15.652077779677091]
JPEGステガナリシスのための表現学習アルゴリズムを提案する。
グラフ注意学習モジュールは、畳み込みニューラルネットワークの局所的特徴学習によるグローバルな特徴損失を回避するように設計されている。
本発明の特徴強化モジュールは、畳み込み層の積み重ねがステガノグラフ情報を弱めるのを防止するために適用される。
論文 参考訳(メタデータ) (2023-02-05T01:42:19Z) - Traditional Classification Neural Networks are Good Generators: They are
Competitive with DDPMs and GANs [104.72108627191041]
従来のニューラルネットワーク分類器は、最先端の生成モデルに匹敵する高品質な画像を生成することができることを示す。
マスクをベースとした再構成モジュールを提案し, 意味的勾配を意識し, 可視画像の合成を行う。
また,本手法は,画像テキスト基盤モデルに関して,テキスト・画像生成にも適用可能であることを示す。
論文 参考訳(メタデータ) (2022-11-27T11:25:35Z) - DELAD: Deep Landweber-guided deconvolution with Hessian and sparse prior [0.22940141855172028]
本稿では,古典的反復法をディープラーニングアプリケーションに組み込んだ非盲検画像デコンボリューションモデルを提案する。
このアルゴリズムは、トレーニング可能な畳み込み層と統合され、復元された画像構造と詳細を強化する。
論文 参考訳(メタデータ) (2022-09-30T11:15:03Z) - PRANC: Pseudo RAndom Networks for Compacting deep models [22.793523211040682]
PRANCはディープモデルの大幅なコンパクト化を可能にする。
本研究では,PRANCを用いて画像分類モデルを構築し,関連する暗黙的ニューラルネットワークをコンパクト化することで画像の圧縮を行う。
論文 参考訳(メタデータ) (2022-06-16T22:03:35Z) - Robust Pollen Imagery Classification with Generative Modeling and Mixup
Training [0.0]
本論文では,花粉の航空画像分類を一般化できる,堅牢な深層学習フレームワークを提案する。
我々は,畳み込みニューラルネットワークを用いた花粉の粒度分類手法を開発し,ディープラーニングのベストプラクティスを組み合わせることで,より一般化する。
提案されたアプローチは、ICPR-2020 Pollen Grain Classification Challengeの最終ランキングで4位となった。
論文 参考訳(メタデータ) (2021-02-25T19:39:24Z) - Neural networks with late-phase weights [66.72777753269658]
学習後期に重みのサブセットを組み込むことで,SGDの解をさらに改善できることを示す。
学習の終わりに、重み空間における空間平均を取ることにより、1つのモデルを取得する。
論文 参考訳(メタデータ) (2020-07-25T13:23:37Z) - Model Fusion via Optimal Transport [64.13185244219353]
ニューラルネットワークのための階層モデル融合アルゴリズムを提案する。
これは、不均一な非i.d.データに基づいてトレーニングされたニューラルネットワーク間での"ワンショット"な知識伝達に成功していることを示す。
論文 参考訳(メタデータ) (2019-10-12T22:07:15Z) - Effects of Degradations on Deep Neural Network Architectures [18.79337509555511]
ディープ畳み込みニューラルネットワーク(CNN)は、大規模画像分類の最近の進歩に影響を与えている。
劣化信号(ノイズ)の存在下でのそのようなネットワークの挙動は、ほとんど探索されていない。
本稿では,最も一般的な6つの画像劣化モデルに基づいて,画像分類のための6つの深層アーキテクチャの性能解析を行った。
論文 参考訳(メタデータ) (2018-07-26T13:20:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。