Fugu-MT 論文翻訳(概要): Classification of Non-native Handwritten Characters Using Convolutional Neural Network

論文の概要: Classification of Non-native Handwritten Characters Using Convolutional Neural Network

arxiv url: http://arxiv.org/abs/2406.04511v1
Date: Thu, 6 Jun 2024 21:08:07 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-10 17:57:38.809314
Title: Classification of Non-native Handwritten Characters Using Convolutional Neural Network
Title（参考訳）: 畳み込みニューラルネットワークを用いた非ネイティブ手書き文字の分類
Authors: F. A. Mamun, S. A. H. Chowdhury, J. E. Giti, H. Sarker,
Abstract要約: 非ネイティブユーザによる英語文字の分類は、カスタマイズされたCNNモデルを提案することによって行われる。我々はこのCNNを、手書きの独立した英語文字データセットと呼ばれる新しいデータセットでトレーニングする。 5つの畳み込み層と1つの隠蔽層を持つモデルでは、文字認識精度において最先端モデルよりも優れる。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The use of convolutional neural networks (CNNs) has accelerated the progress of handwritten character classification/recognition. Handwritten character recognition (HCR) has found applications in various domains, such as traffic signal detection, language translation, and document information extraction. However, the widespread use of existing HCR technology is yet to be seen as it does not provide reliable character recognition with outstanding accuracy. One of the reasons for unreliable HCR is that existing HCR methods do not take the handwriting styles of non-native writers into account. Hence, further improvement is needed to ensure the reliability and extensive deployment of character recognition technologies for critical tasks. In this work, the classification of English characters written by non-native users is performed by proposing a custom-tailored CNN model. We train this CNN with a new dataset called the handwritten isolated English character (HIEC) dataset. This dataset consists of 16,496 images collected from 260 persons. This paper also includes an ablation study of our CNN by adjusting hyperparameters to identify the best model for the HIEC dataset. The proposed model with five convolutional layers and one hidden layer outperforms state-of-the-art models in terms of character recognition accuracy and achieves an accuracy of $\mathbf{97.04}$%. Compared with the second-best model, the relative improvement of our model in terms of classification accuracy is $\mathbf{4.38}$%.
Abstract（参考訳）: 畳み込みニューラルネットワーク(CNN)の使用により、手書き文字分類/認識の進展が加速した。手書き文字認識(HCR)は、交通信号の検出、言語翻訳、文書情報の抽出など、様々な分野で応用されている。しかし、既存のHCR技術が広く使われていることは、信頼性の高い文字認識を優れた精度で提供していないため、まだ見受けられていない。信頼できないHCRの理由の1つは、既存のHCRメソッドが非ネイティブな作者の手書きスタイルを考慮に入れていないことである。したがって、重要なタスクに対する文字認識技術の信頼性と広範な展開を保証するために、さらなる改善が必要である。本研究では,非ネイティブユーザによる英語文字の分類について,カスタマイズされたCNNモデルを提案する。我々はこのCNNを、HIECデータセットと呼ばれる新しいデータセットでトレーニングする。このデータセットは、260人から集められた16,496枚の画像で構成されている。本稿では、HIECデータセットの最適モデルを特定するために、ハイパーパラメータを調整することで、我々のCNNのアブレーション研究についても述べる。提案モデルでは5つの畳み込み層と1つの隠蔽層が文字認識精度で最先端モデルより優れ、$\mathbf{97.04}$%の精度が得られる。第2のモデルと比較して、分類精度の点で、我々のモデルの相対的な改善は$\mathbf{4.38}$%である。

関連論文リスト

Knowledge-Informed Neural Network for Complex-Valued SAR Image Recognition [51.03674130115878]
本稿では,新しい「圧縮集約圧縮」アーキテクチャ上に構築された軽量なフレームワークであるKnowledge-Informed Neural Network(KINN)を紹介する。 KINNはパラメータ効率の認識における最先端を確立し、データスカースとアウト・オブ・ディストリビューションのシナリオにおいて例外的な一般化を提供する。
論文参考訳（メタデータ） (2025-10-23T07:12:26Z)
Human Texts Are Outliers: Detecting LLM-generated Texts via Out-of-distribution Detection [71.59834293521074]
我々は,人間によるテキストと機械によるテキストを区別する枠組みを開発した。提案手法は,DeepFakeデータセット上で98.3%のAUROCとAUPRを8.9%のFPR95で達成する。コード、事前トレーニングされたウェイト、デモがリリースされる。
論文参考訳（メタデータ） (2025-10-07T08:14:45Z)
Preserving Privacy Without Compromising Accuracy: Machine Unlearning for Handwritten Text Recognition [12.022436561452766]
忘れられる権利のような規制は、完全なリトレーニングなしで機密性のあるトレースを削除するモデルを必要とする。マルチヘッドトランスHTRモデルのための2段階のアンラーニングフレームワークを提案する。また,書き手IDの均一な分布に従うことを強制するメソッドであるWriter-ID Confusion(WIC)も提案する。
論文参考訳（メタデータ） (2025-04-11T15:21:12Z)
Handwritten Digit Recognition: An Ensemble-Based Approach for Superior Performance [9.174021241188143]
本稿では,CNN(Convolutional Neural Networks)と従来の機械学習技術を組み合わせて,認識精度と堅牢性を向上させるアンサンブルに基づくアプローチを提案する。我々は,70,000個の手書き桁画像からなるMNISTデータセットを用いて本手法の評価を行った。特徴抽出にCNNを,分類にSVM(Support Vector Machines)を併用したハイブリッドモデルは,99.30%の精度を実現する。
論文参考訳（メタデータ） (2025-03-08T07:09:49Z)
Detecting Document-level Paraphrased Machine Generated Content: Mimicking Human Writing Style and Involving Discourse Features [57.34477506004105]
機械生成コンテンツは、学術プラジャリズムや誤報の拡散といった課題を提起する。これらの課題を克服するために、新しい方法論とデータセットを導入します。人間の筆記スタイルをエミュレートするエンコーダデコーダモデルであるMhBARTを提案する。また,PDTB前処理による談話解析を統合し,構造的特徴を符号化するモデルであるDTransformerを提案する。
論文参考訳（メタデータ） (2024-12-17T08:47:41Z)
Online Writer Retrieval with Chinese Handwritten Phrases: A Synergistic Temporal-Frequency Representation Learning Approach [53.189911918976655]
DOLPHINは,相乗的時間周波数解析による手書き表現の向上を目的とした新しい検索モデルである。 OLIWER(OLIWER)は,1,731人から670,000以上の中国語の字句を含む大規模オンライン作家検索データセットである。本研究は,手書き表現の質向上における点サンプリング周波数と圧力特性の重要性を強調した。
論文参考訳（メタデータ） (2024-12-16T11:19:22Z)
Fast Context-Biasing for CTC and Transducer ASR models with CTC-based Word Spotter [57.64003871384959]
この研究は、CTCベースのWord Spotterでコンテキストバイアスを高速化するための新しいアプローチを示す。提案手法は,CTCログ確率をコンパクトなコンテキストグラフと比較し,潜在的なコンテキストバイアス候補を検出する。その結果、FスコアとWERの同時改善により、文脈バイアス認識の大幅な高速化が示された。
論文参考訳（メタデータ） (2024-06-11T09:37:52Z)
Data Generation for Post-OCR correction of Cyrillic handwriting [41.94295877935867]
本稿では,B'ezier曲線に基づく合成手書き生成エンジンの開発と応用に焦点を当てる。このようなエンジンは、任意の量で非常にリアルな手書きテキストを生成し、それを利用して実質的なデータセットを作成する。本データセットに手書きテキスト認識(HTR)モデルを適用し,OCRエラーを識別し,POCモデルトレーニングの基礎となる。
論文参考訳（メタデータ） (2023-11-27T15:01:26Z)
Offline Detection of Misspelled Handwritten Words by Convolving Recognition Model Features with Text Labels [0.0]
テキストに対して手書き画像を比較する作業を紹介する。我々のモデルの分類ヘッドは、最先端の生成逆数ネットワークを用いて生成された合成データに基づいて訓練されている。このような大規模なパフォーマンス向上は、ヒューマン・イン・ザ・ループの自動化を利用したアプリケーションの生産性を大幅に向上させる可能性がある。
論文参考訳（メタデータ） (2023-09-18T21:13:42Z)
Towards General Visual-Linguistic Face Forgery Detection [95.73987327101143]
ディープフェイクは現実的な顔操作であり、セキュリティ、プライバシー、信頼に深刻な脅威をもたらす可能性がある。既存の方法は、このタスクを、デジタルラベルまたはマスク信号を使用して検出モデルをトレーニングするバイナリ分類として扱う。本稿では, 微粒な文レベルのプロンプトをアノテーションとして用いた, VLFFD (Visual-Linguistic Face Forgery Detection) という新しいパラダイムを提案する。
論文参考訳（メタデータ） (2023-07-31T10:22:33Z)
Uncovering the Handwritten Text in the Margins: End-to-end Handwritten Text Detection and Recognition [0.840835093659811]
本研究は,手書きペラリアの自動検出と認識のためのエンドツーエンドフレームワークを提案する。データ拡張と転送学習を使用して、トレーニングデータの不足を克服する。このフレームワークの有効性はスウェーデンのウプサラ大学図書館で発見された初期の書籍コレクションのデータから実証的に評価されている。
論文参考訳（メタデータ） (2023-03-10T14:00:53Z)
CSCD-NS: a Chinese Spelling Check Dataset for Native Speakers [62.61866477815883]
CSCD-NSは中国初のネイティブ話者向けスペルチェックデータセットである。 CSCD-NSはスケールが10倍大きく、誤差分布が異なる。本稿では,入力過程をシミュレーションする新しい手法を提案する。
論文参考訳（メタデータ） (2022-11-16T09:25:42Z)
Continuous Offline Handwriting Recognition using Deep Learning Models [0.0]
手書き文字認識は、自動文書画像解析の分野に大きな関心を持つオープンな問題である。我々は,畳み込みニューラルネットワーク(CNN)とシーケンス・ツー・シーケンス(seq2seq)という,2種類のディープラーニングアーキテクチャの統合に基づく新しい認識モデルを提案する。提案した新たなモデルでは,他の確立された方法論と競合する結果が得られる。
論文参考訳（メタデータ） (2021-12-26T07:31:03Z)
Lexically Aware Semi-Supervised Learning for OCR Post-Correction [90.54336622024299]
世界中の多くの言語における既存の言語データの多くは、非デジタル化された書籍や文書に閉じ込められている。従来の研究は、あまり良くない言語を認識するためのニューラル・ポスト・コレクション法の有用性を実証してきた。そこで本研究では,生画像を利用した半教師付き学習手法を提案する。
論文参考訳（メタデータ） (2021-11-04T04:39:02Z)
HCR-Net: A deep learning based script independent handwritten character recognition network [5.8067395321424975]
手書き文字認識(HCR)は、数十年の研究にもかかわらず、困難なパターン認識問題である。我々は、HCR研究のためのスクリプト独立型ディープラーニングネットワーク、HCR-Netを提案し、この分野の新たな研究方向性を定めている。
論文参考訳（メタデータ） (2021-08-15T05:48:07Z)
On Addressing Practical Challenges for RNN-Transduce [72.72132048437751]
オーディオデータを収集することなく、よく訓練されたRNN-Tモデルを新しいドメインに適応します。復号時に計算された複数の特徴を利用して単語レベルの信頼度を求める。提案手法では,平均で50ms以下の単語のタイミング差が得られる。
論文参考訳（メタデータ） (2021-04-27T23:31:43Z)
PGNet: Real-time Arbitrarily-Shaped Text Spotting with Point Gathering Network [54.03560668182197]
任意形状のテキストをリアルタイムで読み取るための,完全畳み込み点収集ネットワーク(PGNet)を提案する。 PG-CTCデコーダを用いて2次元空間から高レベル文字分類ベクトルを収集し,NMSやRoI操作を使わずにテキストシンボルに復号する。実験により,提案手法は競争精度が向上し,走行速度が著しく向上することが確認された。
論文参考訳（メタデータ） (2021-04-12T13:27:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。