論文の概要: Benchmarking Online Sequence-to-Sequence and Character-based Handwriting
Recognition from IMU-Enhanced Pens
- arxiv url: http://arxiv.org/abs/2202.07036v1
- Date: Mon, 14 Feb 2022 20:55:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-16 15:01:58.600186
- Title: Benchmarking Online Sequence-to-Sequence and Character-based Handwriting
Recognition from IMU-Enhanced Pens
- Title(参考訳): IMU強化ペンによるオンラインシーケンスと文字による手書き文字認識のベンチマーク
- Authors: Felix Ott and David R\"ugamer and Lucas Heublein and Tim Hamann and
Jens Barth and Bernd Bischl and Christopher Mutschler
- Abstract要約: 本稿では,リアルタイムシーケンス・ツー・シーケンス学習と単一文字認識のためのデータとベンチマークモデルを提案する。
データは、センサーによって強化されたボールペン、加速度計、磁力計、100Hzの力センサーによって記録される。
著者に依存したタスクの両方に対する方程式や単語を含む様々なデータセットを提案する。
- 参考スコア(独自算出の注目度): 2.840092825973023
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Handwriting is one of the most frequently occurring patterns in everyday life
and with it come challenging applications such as handwriting recognition
(HWR), writer identification, and signature verification. In contrast to
offline HWR that only uses spatial information (i.e., images), online HWR
(OnHWR) uses richer spatio-temporal information (i.e., trajectory data or
inertial data). While there exist many offline HWR datasets, there is only
little data available for the development of OnHWR methods as it requires
hardware-integrated pens. This paper presents data and benchmark models for
real-time sequence-to-sequence (seq2seq) learning and single character-based
recognition. Our data is recorded by a sensor-enhanced ballpoint pen, yielding
sensor data streams from triaxial accelerometers, a gyroscope, a magnetometer
and a force sensor at 100Hz. We propose a variety of datasets including
equations and words for both the writer-dependent and writer-independent tasks.
We provide an evaluation benchmark for seq2seq and single character-based HWR
using recurrent and temporal convolutional networks and Transformers combined
with a connectionist temporal classification (CTC) loss and cross entropy
losses. Our methods do not resort to language or lexicon models.
- Abstract(参考訳): 手書き文字は日常生活において最も頻繁に発生するパターンの1つであり、手書き文字認識(HWR)、書き手識別、署名検証といった課題がある。
空間情報のみを使用するオフラインHWRとは対照的に、オンラインHWR(OnHWR)はよりリッチな時空間情報(トラジェクトリデータまたは慣性データ)を使用する。
多くのオフラインHWRデータセットが存在するが、ハードウェア統合ペンを必要とするため、OnHWRメソッドの開発に必要なデータはほとんどない。
本稿では,sequence-to-sequence (seq2seq) 学習と単一文字認識のためのデータとベンチマークモデルを提案する。
我々のデータは、センサーによって強化されたボールペンによって記録され、3軸加速度計、ジャイロスコープ、磁力計、100Hzの力センサーからセンサデータストリームが生成される。
本稿では,ライタ依存タスクとライタ非依存タスクの両方に対して,方程式や単語を含む多種多様なデータセットを提案する。
繰り返し畳み込みネットワークとトランスフォーマを用いたseq2seqおよびsingle character-based hwrの評価ベンチマークと、接続型時間分類(ctc)損失とクロスエントロピー損失を組み合わせた評価ベンチマークを提供する。
我々の手法は言語モデルや語彙モデルに頼らない。
関連論文リスト
- General Detection-based Text Line Recognition [15.761142324480165]
我々は、テキスト行認識に対する一般的な検出に基づくアプローチを、印刷(OCR)や手書き(HTR)として導入する。
我々の手法は、自己回帰復号に依存する最先端のHTR手法とは全く異なるパラダイムに基づいている。
我々は、CASIA v2データセット上での中国語スクリプト認識と、BorgおよびCopialeデータセット上での暗号認識の最先端性能を改善した。
論文 参考訳(メタデータ) (2024-09-25T17:05:55Z) - FastMAC: Stochastic Spectral Sampling of Correspondence Graph [55.75524096647733]
本稿では,対応グラフの領域にグラフ信号処理を導入する最初の研究について述べる。
我々は、対応グラフ上の一般化次数信号を利用し、高周波成分を保存するサンプリング戦略を追求する。
アプリケーションとして,FastMACと呼ばれる,リアルタイムな高速な3D登録アルゴリズムを構築した。
論文 参考訳(メタデータ) (2024-03-13T17:59:56Z) - Offline Detection of Misspelled Handwritten Words by Convolving
Recognition Model Features with Text Labels [0.0]
テキストに対して手書き画像を比較する作業を紹介する。
我々のモデルの分類ヘッドは、最先端の生成逆数ネットワークを用いて生成された合成データに基づいて訓練されている。
このような大規模なパフォーマンス向上は、ヒューマン・イン・ザ・ループの自動化を利用したアプリケーションの生産性を大幅に向上させる可能性がある。
論文 参考訳(メタデータ) (2023-09-18T21:13:42Z) - Context Perception Parallel Decoder for Scene Text Recognition [52.620841341333524]
シーンテキスト認識手法は高い精度と高速な推論速度を達成するのに苦労している。
本稿では、STRにおけるARデコーディングの実証的研究を行い、ARデコーダが言語文脈をモデル化するだけでなく、視覚的文脈知覚のガイダンスも提供することを明らかにする。
我々は一連のCPPDモデルを構築し、提案したモジュールを既存のSTRデコーダにプラグインする。英語と中国語のベンチマーク実験により、CPPDモデルはARベースモデルよりも約8倍高速に動作し、高い競争精度を達成できることを示した。
論文 参考訳(メタデータ) (2023-07-23T09:04:13Z) - End-to-End Page-Level Assessment of Handwritten Text Recognition [69.55992406968495]
HTRシステムは、文書のエンドツーエンドのページレベルの書き起こしに直面している。
標準メトリクスは、現れる可能性のある不整合を考慮していない。
本稿では、転写精度とROの良さを別々に検討する2つの評価法を提案する。
論文 参考訳(メタデータ) (2023-01-14T15:43:07Z) - When Counting Meets HMER: Counting-Aware Network for Handwritten
Mathematical Expression Recognition [57.51793420986745]
我々は、手書き数式認識(HMER)のための非従来型ネットワークであるCounting-Aware Network(CAN)を提案する。
シンボルレベルの位置アノテーションを使わずに各シンボルクラスの数を予測できる弱教師付きカウントモジュールを設計する。
HMERのベンチマークデータセットの実験により、エンコーダ・デコーダモデルの予測誤差を修正するために、共同最適化とカウント結果の両方が有用であることが検証された。
論文 参考訳(メタデータ) (2022-07-23T08:39:32Z) - Auxiliary Cross-Modal Representation Learning with Triplet Loss
Functions for Online Handwriting Recognition [3.071136270246468]
クロスモーダル表現学習は、与えられたタスクのパフォーマンスを改善するために、2つ以上のモダリティ間の共有埋め込みを学ぶ。
シングルラベルとシークエンス・ツー・シーケンスの分類タスクに対して,ダイナミック・マージンを持つトリプルト・ロスを示す。
提案実験は, 分類精度の向上, 収束の高速化, クロスモーダル表現の改善による一般化性の向上を示す。
論文 参考訳(メタデータ) (2022-02-16T07:09:04Z) - Letter-level Online Writer Identification [86.13203975836556]
我々は文字レベルのオンラインライタIDという新たな問題に焦点をあてる。
主な課題は、しばしば異なるスタイルで手紙を書くことである。
我々はこの問題をオンライン書記スタイルのばらつき(Var-O-Styles)と呼ぶ。
論文 参考訳(メタデータ) (2021-12-06T07:21:53Z) - Digitizing Handwriting with a Sensor Pen: A Writer-Independent
Recognizer [0.2580765958706854]
本稿では,センサ付ペンを用いて,平紙に書かれた文字を認識できる文字非依存システムを提案する。
ペンは、ユーザーが印加した線形加速度、角速度、磁場、力を提供し、通常の紙に書きながらセンサーのアナログ信号を時間データに変換するディジタイザとして機能する。
本稿では,文字分類のための畳み込みニューラルネットワークモデルの結果を述べるとともに,本手法が実用的であり,文字に依存しない文字認識において有望な結果が得られることを示す。
論文 参考訳(メタデータ) (2021-07-08T09:25:59Z) - Towards an IMU-based Pen Online Handwriting Recognizer [2.6707647984082357]
慣性測定単位(IMU)に基づく音声認識のためのオンライン手書き認識システムを提案する。
これは、加速度、角速度、およびBluetooth経由で流れる磁力を提供するセンサー付きペンによって得られる。
本モデルは畳み込み型LSTMネットワークと双方向型LSTMネットワークを組み合わせることで,コネクショナリストの時間的分類損失をトレーニングする。
論文 参考訳(メタデータ) (2021-05-26T09:47:19Z) - Rethinking Text Line Recognition Models [57.47147190119394]
2つのデコーダファミリー(コネクショニスト時間分類と変換器)と3つのエンコーダモジュール(双方向LSTM、自己認識、GRCL)を考える。
広く使用されているシーンと手書きテキストの公開データセットの精度とパフォーマンスを比較します。
より一般的なTransformerベースのモデルとは異なり、このアーキテクチャは任意の長さの入力を処理できる。
論文 参考訳(メタデータ) (2021-04-15T21:43:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。