Fugu-MT 論文翻訳(概要): Bangla Handwritten Digit Recognition and Generation

論文の概要: Bangla Handwritten Digit Recognition and Generation

arxiv url: http://arxiv.org/abs/2103.07905v1
Date: Sun, 14 Mar 2021 12:11:21 GMT
ステータス: 翻訳完了
システム内更新日: 2021-03-17 05:24:11.927716
Title: Bangla Handwritten Digit Recognition and Generation
Title（参考訳）: バングラ手書き文字認識と生成
Authors: Md Fahim Sikder
Abstract要約: バングラの手書き数字を生成するために、SGAN(Semi-supvised Generative Adversarial Network)が適用される。本稿では,bhandデータセット上で99.44%の検証精度を実現するアーキテクチャを実装した。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Handwritten digit or numeral recognition is one of the classical issues in the area of pattern recognition and has seen tremendous advancement because of the recent wide availability of computing resources. Plentiful works have already done on English, Arabic, Chinese, Japanese handwritten script. Some work on Bangla also have been done but there is space for development. From that angle, in this paper, an architecture has been implemented which achieved the validation accuracy of 99.44% on BHAND dataset and outperforms Alexnet and Inception V3 architecture. Beside digit recognition, digit generation is another field which has recently caught the attention of the researchers though not many works have been done in this field especially on Bangla. In this paper, a Semi-Supervised Generative Adversarial Network or SGAN has been applied to generate Bangla handwritten numerals and it successfully generated Bangla digits.
Abstract（参考訳）: 手書き数字や数値認識は、パターン認識の分野では古典的な問題の一つであり、近年のコンピュータリソースの幅広い可用性のために、大きな進歩を遂げています。英語、アラビア語、中国語、日本語手書きのスクリプトですでに豊富な作品が行われています。バングラでの作業もいくつか行われたが、開発の余地がある。そこで本論文では,BHANDデータセット上で99.44%の検証精度を達成し,AlexnetとInception V3アーキテクチャを上回ったアーキテクチャを実装した。数値認識以外にも、デジタル生成は研究者の注目を集めている分野でもあるが、特にバングラについての研究はあまり行われていない。本論文では,Bangla手書き数字を生成するためにSemi-supvised Generative Adversarial Network(SGAN)を適用し,Bangla桁の生成に成功した。

関連論文リスト

HandReader: Advanced Techniques for Efficient Fingerspelling Recognition [75.38606213726906]
本稿では,指先認識タスクに対処するために設計された3つのアーキテクチャ群であるHandReaderを紹介する。 HandReader$_RGB$は、様々な長さのビデオからRGBの機能を処理するために、Adaptive Shift-Temporal Module (TSAM) という小説を使っている。 HandReader$_KP$は、キーポイントをテンソルとして操作するTPE(Temporal Pose)上に構築されている。各HandReaderモデルは、それぞれ異なるアドバンテージを持ち、ChicagoFSWildとChicagoFSWild+データセットの最先端の結果を達成する。
論文参考訳（メタデータ） (2025-05-15T13:18:37Z)
GaussMark: A Practical Approach for Structural Watermarking of Language Models [61.84270985214254]
GaussMarkは、大規模な言語モデルを透かし出すためのシンプルで効率的で比較的堅牢なスキームである。 GaussMarkは信頼性が高く、効率的で、挿入、削除、置換、ラウンドトリップ翻訳などの汚職に対して比較的堅牢であることを示す。
論文参考訳（メタデータ） (2025-01-17T22:30:08Z)
Online Writer Retrieval with Chinese Handwritten Phrases: A Synergistic Temporal-Frequency Representation Learning Approach [53.189911918976655]
DOLPHINは,相乗的時間周波数解析による手書き表現の向上を目的とした新しい検索モデルである。 OLIWER(OLIWER)は,1,731人から670,000以上の中国語の字句を含む大規模オンライン作家検索データセットである。本研究は,手書き表現の質向上における点サンプリング周波数と圧力特性の重要性を強調した。
論文参考訳（メタデータ） (2024-12-16T11:19:22Z)
Bukva: Russian Sign Language Alphabet [75.42794328290088]
本稿では,ロシア手話(RSL)ダクティルとしても知られる,ロシア語の指先文字の認識について検討する。ダクティル (Dactyl) は手の動きが書かれた言語の個々の文字を表す手話の構成要素である。当社は、RSLダクチル認識のための、最初の本格的なオープンソースビデオデータセットであるBakvaを提供している。
論文参考訳（メタデータ） (2024-10-11T09:59:48Z)
Multichannel Attention Networks with Ensembled Transfer Learning to Recognize Bangla Handwritten Charecter [1.5236380958983642]
この研究では、アンサンブルトランスファーラーニングとマルチチャネルアテンションネットワークを備えた畳み込みニューラルネットワーク(CNN)を用いた。我々は、CAMTERdb 3.1.2データセットを用いて提案モデルを評価し、生データセットの92%、前処理データセットの98.00%の精度を達成した。
論文参考訳（メタデータ） (2024-08-20T15:51:01Z)
Deciphering Oracle Bone Language with Diffusion Models [70.69739681961558]
Oracle Bone Script (OBS) は約3,000年前の中国の上海王朝に由来する。本稿では,Oracle Bone Script Decipher(OBSD)の開発を通じて,画像生成技術を採用した新しいアプローチを提案する。 OBSDは、古代の言語のAI支援分析の新しいコースをグラフ化して、解読のための重要な手がかりを生成する。
論文参考訳（メタデータ） (2024-06-02T09:42:23Z)
BanglaNet: Bangla Handwritten Character Recognition using Ensembling of Convolutional Neural Network [0.0]
本稿では,複数の畳み込みニューラルネットワーク(CNN)のアンサンブルに基づく分類モデルを提案する。 Inception、ResNet、DenseNetといった最先端CNNモデルのアイデアに基づいた3つの異なるモデルが、拡張入力と非拡張入力の両方でトレーニングされている。 CMATERdb(英語版)、BanglaLekha-Isolated(英語版)、Ekush(英語版)の3つのベンチマークによる厳密な実験は、かなりの認識精度を示した。
論文参考訳（メタデータ） (2024-01-16T01:08:19Z)
NusaWrites: Constructing High-Quality Corpora for Underrepresented and Extremely Low-Resource Languages [54.808217147579036]
インドネシアの地方言語について事例研究を行う。データセット構築におけるオンラインスクラップ,人文翻訳,および母語話者による段落作成の有効性を比較した。本研究は,母語話者による段落作成によって生成されたデータセットが,語彙的多様性と文化的内容の点で優れた品質を示すことを示す。
論文参考訳（メタデータ） (2023-09-19T14:42:33Z)
Sampling and Ranking for Digital Ink Generation on a tight computational budget [69.15275423815461]
トレーニングされたデジタルインク生成モデルの出力品質を最大化する方法について検討する。我々は、デジタルインク領域におけるその種類に関する最初のアブレーション研究において、複数のサンプリングとランキング手法の効果を使用、比較する。
論文参考訳（メタデータ） (2023-06-02T09:55:15Z)
Efficient approach of using CNN based pretrained model in Bangla handwritten digit recognition [0.0]
手書き文字認識は、様々な産業において多くの応用に不可欠である。形状、サイズ、書体スタイルの多様性でベンガル文字を書くのが複雑であるため、研究者はSupervisedの機械学習アルゴリズムを使って精度を向上できなかった。 Inception-v3, EfficientNetB0を含むCNNベースの手書き文字認識モデルを提案する。
論文参考訳（メタデータ） (2022-09-19T15:58:53Z)
A Classical Approach to Handcrafted Feature Extraction Techniques for Bangla Handwritten Digit Recognition [0.0]
我々は、Bangla Handwritten Digitを認識するために、厳格な4つの分類器をベンチマークした。 NumtaDB、CMARTdb、Ekush、BDRWのデータセットにおけるHOG+SVM法の認識精度はそれぞれ93.32%、98.08%、95.68%、89.68%に達した。
論文参考訳（メタデータ） (2022-01-25T05:27:57Z)
Skeleton Based Sign Language Recognition Using Whole-body Keypoints [71.97020373520922]
手話は聴覚障害者や言語障害者のコミュニケーションに使用される。また,RGB-D法と組み合わせて最先端の性能を実現することで,Skeletonに基づく音声認識が普及しつつある。近年のボディポーズ推定用citejin 2020wholeの開発に触発されて,全身キーポイントと特徴に基づく手話認識を提案する。
論文参考訳（メタデータ） (2021-03-16T03:38:17Z)
A New Approach for Texture based Script Identification At Block Level using Quad Tree Decomposition [38.20489458130109]
マルチスクリプトシナリオが一般的であるインドのような国では、事前にスクリプトを特定することが義務付けられます。公式手書き文字11文字に対する方向エネルギーとエントロピー分布の抽出におけるガボルウェーブレットフィルタの重要性を示す。
論文参考訳（メタデータ） (2020-09-16T02:50:03Z)
Soft Gazetteers for Low-Resource Named Entity Recognition [78.00856159473393]
本稿では、英語知識ベースからユビキタスに利用可能な情報をニューラル名付きエンティティ認識モデルに組み込む「ソフトガゼッタ」を提案する。 4つの低リソース言語に対する実験により,F1得点の4点の平均的改善が示された。
論文参考訳（メタデータ） (2020-05-04T21:58:02Z)
MatriVasha: A Multipurpose Comprehensive Database for Bangla Handwritten Compound Characters [0.0]
MatrriVashaは、Banglaを認識でき、複数の複合文字を手書きするプロジェクトである。提案したデータセットは、現在までにバングラ複合文字の最も広範なデータセットである。
論文参考訳（メタデータ） (2020-04-29T06:38:12Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。