論文の概要: Characterization and recognition of handwritten digits using Julia
- arxiv url: http://arxiv.org/abs/2102.11994v1
- Date: Wed, 24 Feb 2021 00:30:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-25 13:32:48.412703
- Title: Characterization and recognition of handwritten digits using Julia
- Title(参考訳): Julia を用いた手書き数字の特徴と認識
- Authors: M. A. Jishan, M. S. Alam, Afrida Islam, I. R. Mazumder, K. R. Mahmud
and A. K. Al Azad
- Abstract要約: 我々は,MNISTデータセットの桁を認識可能なハイブリッドニューラルネットワークモデルを実装した。
提案したニューラルモデルネットワークは、画像から特徴を抽出し、層内の特徴を層ごとに認識することができる。
また、MNISTデータセットの自動エンコーディングシステムと変分自動エンコーディングシステムを認識することもできる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic image and digit recognition is a computationally challenging task
for image processing and pattern recognition, requiring an adequate
appreciation of the syntactic and semantic importance of the image for the
identification ofthe handwritten digits. Image and Pattern Recognition has been
identified as one of the driving forces in the research areas because of its
shifting of different types of applications, such as safety frameworks,
clinical frameworks, diversion, and so on.In this study, for recognition, we
implemented a hybrid neural network model that is capable of recognizing the
digit of MNISTdataset and achieved a remarkable result. The proposed neural
model network can extract features from the image and recognize the features in
the layer by layer. To expand, it is so important for the neural network to
recognize how the proposed modelcan work in each layer, how it can generate
output, and so on. Besides, it also can recognize the auto-encoding system and
the variational auto-encoding system of the MNIST dataset. This study will
explore those issues that are discussed above, and the explanation for them,
and how this phenomenon can be overcome.
- Abstract(参考訳): 自動画像認識と数字認識は、画像処理とパターン認識において計算的に困難なタスクであり、手書き桁の識別に画像の構文的および意味的重要性を適切に評価する必要がある。
画像とパターンの認識は,安全性フレームワーク,臨床フレームワーク,ディバージョンなど,さまざまな種類の応用が変化していることから,研究分野の推進力のひとつとして認識されている。本研究は,mnistdatasetの桁を認識可能なハイブリッドニューラルネットワークモデルを実装し,顕著な結果を得た。
提案したニューラルモデルネットワークは、画像から特徴を抽出し、層内の特徴を層ごとに認識することができる。
拡張するには、提案されたモデルがどのように各層で動作し、どのように出力を生成できるかなどを認識することがニューラルネットワークにとって非常に重要です。
また、mnistデータセットのオートエンコーディングシステムと変分オートエンコーディングシステムを認識することもできる。
本研究は,上述の問題点とそれに対する説明,及びこの現象を克服する方法について検討する。
関連論文リスト
- Pre-processing and Compression: Understanding Hidden Representation Refinement Across Imaging Domains via Intrinsic Dimension [1.7495213911983414]
医用画像モデルは,ネットワークの早期に表現IDがピークとなることを示す。
また、このピーク表現IDと入力空間内のデータのIDとの強い相関関係も見出す。
論文 参考訳(メタデータ) (2024-08-15T18:54:31Z) - Research on Image Recognition Technology Based on Multimodal Deep Learning [24.259653149898167]
本稿では,ディープニューラルネットワークを用いた人間のマルチモーダル行動識別アルゴリズムについて検討する。
MSR3Dデータセットを用いて提案アルゴリズムの性能評価を行った。
論文 参考訳(メタデータ) (2024-05-06T01:05:21Z) - Alleviating Catastrophic Forgetting in Facial Expression Recognition with Emotion-Centered Models [49.3179290313959]
感情中心型生成的リプレイ (ECgr) は, 生成的対向ネットワークから合成画像を統合することで, この課題に対処する。
ECgrは、生成された画像の忠実性を保証するために品質保証アルゴリズムを組み込んでいる。
4つの多様な表情データセットに対する実験結果から,擬似リハーサル法により生成されたイメージを組み込むことで,ターゲットとするデータセットとソースデータセットのトレーニングが促進されることが示された。
論文 参考訳(メタデータ) (2024-04-18T15:28:34Z) - Joint Learning of Deep Texture and High-Frequency Features for
Computer-Generated Image Detection [24.098604827919203]
本稿では,CG画像検出のための深いテクスチャと高周波特徴を有する共同学習戦略を提案する。
セマンティックセグメンテーションマップを生成して、アフィン変換操作を誘導する。
原画像と原画像の高周波成分の組み合わせを、注意機構を備えたマルチブランチニューラルネットワークに供給する。
論文 参考訳(メタデータ) (2022-09-07T17:30:40Z) - Data-driven emergence of convolutional structure in neural networks [83.4920717252233]
識別タスクを解くニューラルネットワークが、入力から直接畳み込み構造を学習できることを示す。
データモデルを慎重に設計することにより、このパターンの出現は、入力の非ガウス的、高次局所構造によって引き起こされることを示す。
論文 参考訳(メタデータ) (2022-02-01T17:11:13Z) - Research on facial expression recognition based on Multimodal data
fusion and neural network [2.5431493111705943]
このアルゴリズムはマルチモーダルデータに基づいており、顔画像、画像の方向勾配のヒストグラム、顔のランドマークを入力とする。
実験結果から, マルチモーダルデータの相補性により, 精度, 堅牢性, 検出速度が大幅に向上したことがわかった。
論文 参考訳(メタデータ) (2021-09-26T23:45:40Z) - Joint Learning of Neural Transfer and Architecture Adaptation for Image
Recognition [77.95361323613147]
現在の最先端の視覚認識システムは、大規模データセット上でニューラルネットワークを事前トレーニングし、より小さなデータセットでネットワーク重みを微調整することに依存している。
本稿では,各ドメインタスクに適応したネットワークアーキテクチャの動的適応と,効率と効率の両面で重みの微調整の利点を実証する。
本手法は,ソースドメインタスクでスーパーネットトレーニングを自己教師付き学習に置き換え,下流タスクで線形評価を行うことにより,教師なしパラダイムに容易に一般化することができる。
論文 参考訳(メタデータ) (2021-03-31T08:15:17Z) - A 3D GAN for Improved Large-pose Facial Recognition [3.791440300377753]
深層畳み込みニューラルネットワークを用いた顔認識は、顔画像の大きなデータセットの可用性に依存している。
近年の研究では、アイデンティティからポーズを離す方法が不十分であることが示されている。
本研究では,GAN発生器に3次元モーフィラブルモデルを組み込むことにより,野生画像から非線形テクスチャモデルを学習する。
これにより、新しい合成IDの生成と、アイデンティティを損なうことなくポーズ、照明、表現の操作が可能になります。
論文 参考訳(メタデータ) (2020-12-18T22:41:15Z) - Continuous Emotion Recognition with Spatiotemporal Convolutional Neural
Networks [82.54695985117783]
In-theld でキャプチャした長いビデオシーケンスを用いて,持続的な感情認識のための最先端のディープラーニングアーキテクチャの適合性を検討する。
我々は,2D-CNNと長期記憶ユニットを組み合わせた畳み込みリカレントニューラルネットワークと,2D-CNNモデルの微調整時の重みを膨らませて構築した膨らませた3D-CNNモデルを開発した。
論文 参考訳(メタデータ) (2020-11-18T13:42:05Z) - Generative Hierarchical Features from Synthesizing Images [65.66756821069124]
画像合成の学習は、広範囲のアプリケーションにまたがって一般化可能な顕著な階層的な視覚的特徴をもたらす可能性があることを示す。
生成的階層的特徴(Generative Hierarchical Feature, GH-Feat)と呼ばれるエンコーダが生成する視覚的特徴は、生成的タスクと識別的タスクの両方に強い伝達性を有する。
論文 参考訳(メタデータ) (2020-07-20T18:04:14Z) - Continuous Emotion Recognition via Deep Convolutional Autoencoder and
Support Vector Regressor [70.2226417364135]
マシンはユーザの感情状態を高い精度で認識できることが不可欠である。
ディープニューラルネットワークは感情を認識する上で大きな成功を収めている。
表情認識に基づく連続的感情認識のための新しいモデルを提案する。
論文 参考訳(メタデータ) (2020-01-31T17:47:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。