論文の概要: Complex Handwriting Trajectory Recovery: Evaluation Metrics and
Algorithm
- arxiv url: http://arxiv.org/abs/2210.15879v1
- Date: Fri, 28 Oct 2022 03:57:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-31 15:12:12.794802
- Title: Complex Handwriting Trajectory Recovery: Evaluation Metrics and
Algorithm
- Title(参考訳): 複雑な手書き軌跡の復元:評価指標とアルゴリズム
- Authors: Zhounan Chen, Daihui Yang, Jinglin Liang, Xinwu Liu, Yuyi Wang,
Zhenghua Peng, Shuangping Huang
- Abstract要約: そこで我々は,様々なストローク幅の影響を排除したアダプティブ・コンベンション(AIoU)と,トラジェクティブ・ポイントアライメント問題を解決する長さ非依存動的時間ワープ(LDTW)という2つの新しい指標を考案した。
次に、複雑なグリフと長い軌跡を持つ文字に対して、PEN-Net(Parsing-and-tracing ENcoder-decoder Network)と呼ばれる新しい手書き軌道復元モデルを提案する。
実験の結果,AIoU と LDTW の2つの新しい指標は,手書き軌道復元の精度を真に評価できることがわかった。
- 参考スコア(独自算出の注目度): 10.642342653937794
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many important tasks such as forensic signature verification, calligraphy
synthesis, etc, rely on handwriting trajectory recovery of which, however, even
an appropriate evaluation metric is still missing. Indeed, existing metrics
only focus on the writing orders but overlook the fidelity of glyphs. Taking
both facets into account, we come up with two new metrics, the adaptive
intersection on union (AIoU) which eliminates the influence of various stroke
widths, and the length-independent dynamic time warping (LDTW) which solves the
trajectory-point alignment problem. After that, we then propose a novel
handwriting trajectory recovery model named Parsing-and-tracing ENcoder-decoder
Network (PEN-Net), in particular for characters with both complex glyph and
long trajectory, which was believed very challenging. In the PEN-Net, a
carefully designed double-stream parsing encoder parses the glyph structure,
and a global tracing decoder overcomes the memory difficulty of long trajectory
prediction. Our experiments demonstrate that the two new metrics AIoU and LDTW
together can truly assess the quality of handwriting trajectory recovery and
the proposed PEN-Net exhibits satisfactory performance in various complex-glyph
languages including Chinese, Japanese and Indic.
- Abstract(参考訳): 鑑定署名の検証や書跡合成などの重要な作業の多くは、手書きの軌跡の回復に依存しているが、適切な評価基準さえも不足している。
実際、既存のメトリクスは書き込み順序のみにフォーカスするが、グリフの忠実さを見落としている。
両面を考慮に入れ、様々なストローク幅の影響を排除したアダプティブ・コンベンション(AIoU)と、軌道点アライメント問題を解決する長さ非依存動的時間ワープ(LDTW)の2つの新しい指標を考案した。
その後、特に複雑なグリフと長い軌跡を持つ文字に対して、パース・アンド・トレーシング・エンコーダ・デコーダ・ネットワーク(pen-net)と呼ばれる新しい手書き軌跡復元モデルを提案する。
PEN-Netでは、慎重に設計された二重ストリーム解析エンコーダがグリフ構造を解析し、グローバルトレースデコーダは長い軌跡予測のメモリ困難を克服する。
実験の結果,AIoU と LDTW の2つの新しい指標は,手書きの軌道復元の精度を真に評価でき,提案した PEN-Net は,中国語,日本語,Indic など多種多様な複合言語で良好な性能を示すことがわかった。
関連論文リスト
- Writing Order Recovery in Complex and Long Static Handwriting [4.0078827278053835]
我々は,薄型静的軌跡の秩序回復を推定する新しいシステムを提案する。
我々は、ペンダウンの開始点を知ることが、回復した筆記の質にどのように影響するかを評価する。
論文 参考訳(メタデータ) (2024-06-05T12:23:17Z) - End-to-End Page-Level Assessment of Handwritten Text Recognition [69.55992406968495]
HTRシステムは、文書のエンドツーエンドのページレベルの書き起こしに直面している。
標準メトリクスは、現れる可能性のある不整合を考慮していない。
本稿では、転写精度とROの良さを別々に検討する2つの評価法を提案する。
論文 参考訳(メタデータ) (2023-01-14T15:43:07Z) - SURDS: Self-Supervised Attention-guided Reconstruction and Dual Triplet
Loss for Writer Independent Offline Signature Verification [16.499360910037904]
オフライン署名検証(英: Offline Signature Verification、OSV)は、法学、商業、法学の様々な分野における基本的な生体計測の課題である。
著者に依存しないOSVにおける自己教師付き表現学習とメートル法学習を活用する2段階のディープラーニングフレームワークを提案する。
提案したフレームワークは2つのオフライン署名データセットで評価され、様々な最先端の手法と比較されている。
論文 参考訳(メタデータ) (2022-01-25T07:26:55Z) - Letter-level Online Writer Identification [86.13203975836556]
我々は文字レベルのオンラインライタIDという新たな問題に焦点をあてる。
主な課題は、しばしば異なるスタイルで手紙を書くことである。
我々はこの問題をオンライン書記スタイルのばらつき(Var-O-Styles)と呼ぶ。
論文 参考訳(メタデータ) (2021-12-06T07:21:53Z) - CDistNet: Perceiving Multi-Domain Character Distance for Robust Text
Recognition [87.3894423816705]
本稿では,MDCDP (Multi-Domain Character Distance Perception) と呼ばれる新しいモジュールを提案する。
MDCDPは位置埋め込みを使用して、クロスアテンションメカニズムに従って視覚的特徴と意味的特徴の両方を問合せする。
我々は、複数のMDCDPを積み重ねたCDistNetを開発し、徐々に正確な距離モデリングをガイドする。
論文 参考訳(メタデータ) (2021-11-22T06:27:29Z) - Towards an IMU-based Pen Online Handwriting Recognizer [2.6707647984082357]
慣性測定単位(IMU)に基づく音声認識のためのオンライン手書き認識システムを提案する。
これは、加速度、角速度、およびBluetooth経由で流れる磁力を提供するセンサー付きペンによって得られる。
本モデルは畳み込み型LSTMネットワークと双方向型LSTMネットワークを組み合わせることで,コネクショナリストの時間的分類損失をトレーニングする。
論文 参考訳(メタデータ) (2021-05-26T09:47:19Z) - ABCNet v2: Adaptive Bezier-Curve Network for Real-time End-to-end Text
Spotting [108.93803186429017]
エンドツーエンドのテキストスポッティングは、統一されたフレームワークで検出と認識を統合することを目指している。
本稿では、Adaptive Bezier Curve Network v2 (ABCNet v2) を提示することで、エンドツーエンドテキストスポッティングに取り組む。
1) 任意の形状のテキストをパラメータ化されたベジアー曲線で適応的に適合させ, セグメンテーション法と比較すると, 構造的な出力だけでなく, 制御可能な表現も提供できる。
様々なバイリンガル(英語と中国語)ベンチマークデータセットで実施された総合的な実験は、ABCNet v2が現状を達成することを実証している。
論文 参考訳(メタデータ) (2021-05-08T07:46:55Z) - Rethinking Text Line Recognition Models [57.47147190119394]
2つのデコーダファミリー(コネクショニスト時間分類と変換器)と3つのエンコーダモジュール(双方向LSTM、自己認識、GRCL)を考える。
広く使用されているシーンと手書きテキストの公開データセットの精度とパフォーマンスを比較します。
より一般的なTransformerベースのモデルとは異なり、このアーキテクチャは任意の長さの入力を処理できる。
論文 参考訳(メタデータ) (2021-04-15T21:43:13Z) - PGNet: Real-time Arbitrarily-Shaped Text Spotting with Point Gathering
Network [54.03560668182197]
任意形状のテキストをリアルタイムで読み取るための,完全畳み込み点収集ネットワーク(PGNet)を提案する。
PG-CTCデコーダを用いて2次元空間から高レベル文字分類ベクトルを収集し,NMSやRoI操作を使わずにテキストシンボルに復号する。
実験により,提案手法は競争精度が向上し,走行速度が著しく向上することが確認された。
論文 参考訳(メタデータ) (2021-04-12T13:27:34Z) - DeepWriteSYN: On-Line Handwriting Synthesis via Deep Short-Term
Representations [14.498981800711302]
DeepWriteSYNは、新しいオンライン手書き方式である。
与えられた人口や被写体内の自然な変動に対応する、与えられた手書き構造の現実的な手書き変化を生成することができる。
論文 参考訳(メタデータ) (2020-09-14T10:17:55Z) - Online trajectory recovery from offline handwritten Japanese kanji
characters [7.057916977441261]
本稿では,大規模なオンライン手書きデータベースを用いて,回復作業を解決するディープニューラルネットワークに基づく手法を提案する。
提案手法の性能を視覚的検証と手書き文字認識の両方を用いて評価する。
論文 参考訳(メタデータ) (2020-09-09T13:05:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。