論文の概要: Improving Accuracy and Explainability of Online Handwriting Recognition
- arxiv url: http://arxiv.org/abs/2209.09102v1
- Date: Wed, 14 Sep 2022 21:28:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-25 17:12:57.100602
- Title: Improving Accuracy and Explainability of Online Handwriting Recognition
- Title(参考訳): オンライン手書き認識の精度と説明性の向上
- Authors: Hilda Azimi, Steven Chang, Jonathan Gold, Koray Karabina
- Abstract要約: 我々は,OnHW-charsデータセット上で手書き認識モデルを開発し,先行モデルの精度を向上させる。
私たちの結果は公開リポジトリを通じて検証可能で再現可能です。
- 参考スコア(独自算出の注目度): 0.9176056742068814
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Handwriting recognition technology allows recognizing a written text from a
given data. The recognition task can target letters, symbols, or words, and the
input data can be a digital image or recorded by various sensors. A wide range
of applications from signature verification to electronic document processing
can be realized by implementing efficient and accurate handwriting recognition
algorithms. Over the years, there has been an increasing interest in
experimenting with different types of technology to collect handwriting data,
create datasets, and develop algorithms to recognize characters and symbols.
More recently, the OnHW-chars dataset has been published that contains
multivariate time series data of the English alphabet collected using a
ballpoint pen fitted with sensors. The authors of OnHW-chars also provided some
baseline results through their machine learning (ML) and deep learning (DL)
classifiers.
In this paper, we develop handwriting recognition models on the OnHW-chars
dataset and improve the accuracy of previous models. More specifically, our ML
models provide $11.3\%$-$23.56\%$ improvements over the previous ML models, and
our optimized DL models with ensemble learning provide $3.08\%$-$7.01\%$
improvements over the previous DL models. In addition to our accuracy
improvements over the spectrum, we aim to provide some level of explainability
for our models to provide more logic behind chosen methods and why the models
make sense for the data type in the dataset. Our results are verifiable and
reproducible via the provided public repository.
- Abstract(参考訳): 手書き認識技術により、所定のデータからテキストを認識できる。
認識タスクは文字、シンボル、単語をターゲットとすることができ、入力データはデジタル画像または各種センサによって記録される。
効率良く正確な手書き認識アルゴリズムを実装することにより、署名検証から電子文書処理まで幅広い応用を実現することができる。
長年にわたり、手書きデータの収集、データセットの作成、文字やシンボルを認識するアルゴリズムの開発など、さまざまなタイプのテクノロジーを実験することへの関心が高まっている。
onhw-charsデータセットは、センサーを装着したボールペンを使って収集された英語アルファベットの多変量時系列データを含む。
OnHW-charsの作者は、機械学習(ML)とディープラーニング(DL)分類器を通じて、いくつかのベースライン結果も提供した。
本論文では,OnHW-charsデータセット上で手書き認識モデルを開発し,先行モデルの精度を向上する。
具体的には、私たちのMLモデルは、以前のMLモデルよりも11.3\%$-23.56\%$改善を提供し、アンサンブル学習を備えた最適化されたDLモデルは、以前のDLモデルよりも3.08\%$-7.01\%改善を提供します。
スペクトルに対する精度の向上に加えて、選択したメソッドの背後にあるロジックと、なぜモデルがデータセットのデータタイプに意味を持つのかを、モデルに対してある程度の説明可能性を提供することを目標としています。
私たちの結果は公開リポジトリを通じて検証可能で再現可能です。
関連論文リスト
- On Pre-training of Multimodal Language Models Customized for Chart Understanding [83.99377088129282]
本稿では,MLLMのチャート理解を改善するために必要な学習過程について考察する。
詳細なチャート理解に適したMLLMであるCHOPINLLMを紹介する。
論文 参考訳(メタデータ) (2024-07-19T17:58:36Z) - T2S-GPT: Dynamic Vector Quantization for Autoregressive Sign Language Production from Text [59.57676466961787]
本稿では,手話における情報密度に基づいて符号化長を調整できる新しい動的ベクトル量子化(DVA-VAE)モデルを提案する。
PHOENIX14Tデータセットを用いて実験を行い,提案手法の有効性を示した。
我々は,486時間の手話ビデオ,音声,文字起こしテキストを含むドイツ語手話データセットPHOENIX-Newsを提案する。
論文 参考訳(メタデータ) (2024-06-11T10:06:53Z) - Improving Classification Performance With Human Feedback: Label a few,
we label the rest [2.7386128680964408]
本稿では,連続フィードバックループがモデルをどのように洗練し,精度,リコール,精度を向上させるかを理解することに焦点を当てる。
このアプローチをFinancial Phrasebank, Banking, Craigslist, Trec, Amazon Reviewsのデータセットでベンチマークし、ラベル付き例をいくつか挙げただけで、ゼロショットの大規模言語モデルの精度を上回ります。
論文 参考訳(メタデータ) (2024-01-17T19:13:05Z) - Improving the Generation Quality of Watermarked Large Language Models
via Word Importance Scoring [81.62249424226084]
トークンレベルの透かしは、トークン確率分布を変更して生成されたテキストに透かしを挿入する。
この透かしアルゴリズムは、生成中のロジットを変化させ、劣化したテキストの品質につながる可能性がある。
We propose to improve the quality of texts generated by a watermarked language model by Watermarking with Importance Scoring (WIS)。
論文 参考訳(メタデータ) (2023-11-16T08:36:00Z) - Self-Supervised Representation Learning for Online Handwriting Text
Classification [0.8594140167290099]
本稿では,日本語と中国語の個人によるオンライン筆跡から情報表現を抽出するための事前学習の前提として,新しいストロークマスキング(POSM)を提案する。
抽出した表現の質を評価するために,本質的評価法と外生的評価法の両方を用いる。
事前訓練されたモデルは、作家の識別、性別分類、手書きの分類といったタスクにおいて、最先端の結果を達成するために微調整される。
論文 参考訳(メタデータ) (2023-10-10T14:07:49Z) - Offline Detection of Misspelled Handwritten Words by Convolving
Recognition Model Features with Text Labels [0.0]
テキストに対して手書き画像を比較する作業を紹介する。
我々のモデルの分類ヘッドは、最先端の生成逆数ネットワークを用いて生成された合成データに基づいて訓練されている。
このような大規模なパフォーマンス向上は、ヒューマン・イン・ザ・ループの自動化を利用したアプリケーションの生産性を大幅に向上させる可能性がある。
論文 参考訳(メタデータ) (2023-09-18T21:13:42Z) - Sampling and Ranking for Digital Ink Generation on a tight computational
budget [69.15275423815461]
トレーニングされたデジタルインク生成モデルの出力品質を最大化する方法について検討する。
我々は、デジタルインク領域におけるその種類に関する最初のアブレーション研究において、複数のサンプリングとランキング手法の効果を使用、比較する。
論文 参考訳(メタデータ) (2023-06-02T09:55:15Z) - Continuous Offline Handwriting Recognition using Deep Learning Models [0.0]
手書き文字認識は、自動文書画像解析の分野に大きな関心を持つオープンな問題である。
我々は,畳み込みニューラルネットワーク(CNN)とシーケンス・ツー・シーケンス(seq2seq)という,2種類のディープラーニングアーキテクチャの統合に基づく新しい認識モデルを提案する。
提案した新たなモデルでは,他の確立された方法論と競合する結果が得られる。
論文 参考訳(メタデータ) (2021-12-26T07:31:03Z) - Lexically Aware Semi-Supervised Learning for OCR Post-Correction [90.54336622024299]
世界中の多くの言語における既存の言語データの多くは、非デジタル化された書籍や文書に閉じ込められている。
従来の研究は、あまり良くない言語を認識するためのニューラル・ポスト・コレクション法の有用性を実証してきた。
そこで本研究では,生画像を利用した半教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2021-11-04T04:39:02Z) - VidLanKD: Improving Language Understanding via Video-Distilled Knowledge
Transfer [76.3906723777229]
言語理解を改善するためのビデオ言語知識蒸留法VidLanKDを提案する。
我々は、ビデオテキストデータセット上でマルチモーダル教師モデルを訓練し、その知識をテキストデータセットを用いて学生言語モデルに伝達する。
我々の実験では、VidLanKDはテキストのみの言語モデルや発声モデルよりも一貫した改善を実現している。
論文 参考訳(メタデータ) (2021-07-06T15:41:32Z) - Handwritten Digit Recognition using Machine and Deep Learning Algorithms [0.0]
我々は,MNISTデータセットを用いて,Support Vector Machines (SVM), Multi-Layer Perceptron (MLP), Convolution Neural Network (CNN)モデルを用いて手書き桁認識を行った。
我々の主な目的は、上述したモデルの精度と実行時間を比較して、桁認識に最適なモデルを得ることである。
論文 参考訳(メタデータ) (2021-06-23T18:23:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。