論文の概要: MatriVasha: A Multipurpose Comprehensive Database for Bangla Handwritten
Compound Characters
- arxiv url: http://arxiv.org/abs/2005.02155v2
- Date: Wed, 6 May 2020 07:59:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-08 13:06:55.371459
- Title: MatriVasha: A Multipurpose Comprehensive Database for Bangla Handwritten
Compound Characters
- Title(参考訳): MatriVasha: バングラ手書き複合文字のための多目的総合データベース
- Authors: Jannatul Ferdous, Suvrajit Karmaker, A K M Shahariar Azad Rabby, Syed
Akhter Hossain
- Abstract要約: MatrriVashaは、Banglaを認識でき、複数の複合文字を手書きするプロジェクトである。
提案したデータセットは、現在までにバングラ複合文字の最も広範なデータセットである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: At present, recognition of the Bangla handwriting compound character has been
an essential issue for many years. In recent years there have been
application-based researches in machine learning, and deep learning, which is
gained interest, and most notably is handwriting recognition because it has a
tremendous application such as Bangla OCR. MatrriVasha, the project which can
recognize Bangla, handwritten several compound characters. Currently, compound
character recognition is an important topic due to its variant application, and
helps to create old forms, and information digitization with reliability. But
unfortunately, there is a lack of a comprehensive dataset that can categorize
all types of Bangla compound characters. MatrriVasha is an attempt to align
compound character, and it's challenging because each person has a unique style
of writing shapes. After all, MatrriVasha has proposed a dataset that intends
to recognize Bangla 120(one hundred twenty) compound characters that consist of
2552(two thousand five hundred fifty-two) isolated handwritten characters
written unique writers which were collected from within Bangladesh. This
dataset faced problems in terms of the district, age, and gender-based written
related research because the samples were collected that includes a verity of
the district, age group, and the equal number of males, and females. As of now,
our proposed dataset is so far the most extensive dataset for Bangla compound
characters. It is intended to frame the acknowledgment technique for
handwritten Bangla compound character. In the future, this dataset will be made
publicly available to help to widen the research.
- Abstract(参考訳): 現在、バングラの筆跡複合文字の認識は長年にわたって重要な問題となっている。
近年、機械学習やディープラーニングにおけるアプリケーションベースの研究が注目されており、特にBangla OCRのような膨大な応用があるため、手書き認識が注目されている。
バングラを認識できるプロジェクトであるMatrriVashaは、いくつかの複合文字を手書きした。
現在、複合文字認識は、その変種的応用により重要なトピックであり、古い形式や信頼性のある情報のデジタル化を支援する。
しかし残念ながら、すべての種類のバングラ複合文字を分類できる包括的なデータセットが欠けている。
MatrriVashaは複合的なキャラクタを調整しようとする試みであり、それぞれが独自のスタイルの書体を持っているため、難しい。
結局のところ、matrrivashaはバングラデシュ国内で収集された2552(二千五百二)の孤立した手書き文字からなるバングラ120(百二十)の複合文字を認識しようとするデータセットを提案した。
このデータセットは、地区の有効性、年齢グループ、男女の同数を含む標本が収集されたため、地区、年齢、性別に基づく文書による研究の観点で問題に直面した。
現在、提案しているデータセットは、バングラ複合文字の最も広範なデータセットである。
手書きバングラ複合文字の認識技法の枠組化を目的としている。
将来的には、このデータセットを公開して、研究の拡大を支援する予定である。
関連論文リスト
- Bukva: Russian Sign Language Alphabet [75.42794328290088]
本稿では,ロシア手話(RSL)ダクティルとしても知られる,ロシア語の指先文字の認識について検討する。
ダクティル (Dactyl) は手の動きが書かれた言語の個々の文字を表す手話の構成要素である。
当社は、RSLダクチル認識のための、最初の本格的なオープンソースビデオデータセットであるBakvaを提供している。
論文 参考訳(メタデータ) (2024-10-11T09:59:48Z) - Tails Tell Tales: Chapter-Wide Manga Transcriptions with Character Names [53.24414727354768]
本論文は,マンガ全章の対話書き起こしを完全自動生成することを目的とする。
i) 言っていることを識別し、各ページのテキストを検出し、それらが本質的か非本質的かに分類する。
また、章を通して同じ文字が一貫した名前で呼ばれることも保証している。
論文 参考訳(メタデータ) (2024-08-01T05:47:04Z) - BanglaNet: Bangla Handwritten Character Recognition using Ensembling of
Convolutional Neural Network [0.0]
本稿では,複数の畳み込みニューラルネットワーク(CNN)のアンサンブルに基づく分類モデルを提案する。
Inception、ResNet、DenseNetといった最先端CNNモデルのアイデアに基づいた3つの異なるモデルが、拡張入力と非拡張入力の両方でトレーニングされている。
CMATERdb(英語版)、BanglaLekha-Isolated(英語版)、Ekush(英語版)の3つのベンチマークによる厳密な実験は、かなりの認識精度を示した。
論文 参考訳(メタデータ) (2024-01-16T01:08:19Z) - Hi Sheldon! Creating Deep Personalized Characters from TV Shows [52.8086853239762]
我々は,テレビ番組などのマルチモーダルデータからマルチモーダルなチャットパーソナライズされた文字を生成する,Deep Personalized Character Creation (DPCC) という新しいタスクを提案する。
単一または複数モードの入力(テキスト、オーディオ、ビデオ)が与えられた場合、DPCCの目標はマルチモードの応答(テキスト、オーディオ、ビデオ)を生成することである。
この課題を支援するために,TV番組から「ディープパーソナライズ・キャラクタ・データセット(DPCD)」という文字中心の多モーダル対話データセットをさらに収集する。
DPCDには10k発話と6時間音声/の文字特異的多モーダル対話データが含まれている。
論文 参考訳(メタデータ) (2023-04-09T00:39:43Z) - Comprehensive Benchmark Datasets for Amharic Scene Text Detection and
Recognition [56.048783994698425]
Ethiopic/Amharicスクリプトはアフリカ最古の書記システムの一つで、東アフリカで少なくとも23の言語に対応している。
アムハラ語の表記体系である Abugida は282音節、15句の句読点、20の数字を持つ。
HUST-ART, HUST-AST, ABE, Tana という,自然界におけるアムハラ文字の検出と認識のための総合的な公開データセットを提示した。
論文 参考訳(メタデータ) (2022-03-23T03:19:35Z) - Writer Recognition Using Off-line Handwritten Single Block Characters [59.17685450892182]
我々は、生年月日DoBの6桁の個人番号を使用する。
本稿では,方向測定を行う手作り特徴に基づく認識手法と,ResNet50モデルによる深い特徴に基づく認識手法について検討する。
その結果,DoBでは手書き情報に同一性関連情報が6桁程度存在することがわかった。
論文 参考訳(メタデータ) (2022-01-25T23:04:10Z) - Bangla Handwritten Digit Recognition and Generation [0.0]
バングラの手書き数字を生成するために、SGAN(Semi-supvised Generative Adversarial Network)が適用される。
本稿では,bhandデータセット上で99.44%の検証精度を実現するアーキテクチャを実装した。
論文 参考訳(メタデータ) (2021-03-14T12:11:21Z) - BanglaWriting: A multi-purpose offline Bangla handwriting dataset [0.0]
この記事では、個性が異なる260人の個人による1ページの筆跡を含む、バングラ手書きデータセットについて述べる。
このデータセットは合計21,234文字と450文字を含み、このページは32,470のユニークな単語を表現している。
このデータセットは、複雑な光学的文字認識、手書きの単語識別、手書きのバリエーション、および文字の単語生成に使用できる。
論文 参考訳(メタデータ) (2020-11-15T11:08:53Z) - Deep Learning for Text Style Transfer: A Survey [71.8870854396927]
テキストスタイル転送は、生成したテキストの特定の属性を制御することを目的として、自然言語生成において重要なタスクである。
2017年の最初のニューラルテキストスタイル転送作業以降,100以上の代表的な記事を対象とした,ニューラルテキストスタイル転送の研究の体系的な調査を行う。
タスクの定式化、既存のデータセットとサブタスク、評価、並列データと非並列データの存在下での豊富な方法論について論じる。
論文 参考訳(メタデータ) (2020-11-01T04:04:43Z) - HKR For Handwritten Kazakh & Russian Database [1.7499351967216341]
オフライン手書き文字認識のための新しいロシア語とカザフ語データベース(ロシア語の95%とカザフ語/文の5%)を提示する。
データベースはキリル文字で書かれており、同じ33文字を共有している。
ディープラーニングと機械学習を使うことで、手書き認識タスクの分野の研究者に役立てることができる。
論文 参考訳(メタデータ) (2020-07-07T15:57:41Z) - Spectral Graph-based Features for Recognition of Handwritten Characters:
A Case Study on Handwritten Devanagari Numerals [0.0]
本稿では,手書き文字を表現するために,頑健なグラフ表現とスペクトルグラフ埋め込みの概念を利用する手法を提案する。
提案手法の有効性の検証のために,インド統計研究所コルカタデータセットの標準手書き数値視覚パターン認識について広範な実験を行った。
論文 参考訳(メタデータ) (2020-07-07T08:40:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。