論文の概要: Interpretable Distance Metric Learning for Handwritten Chinese Character
Recognition
- arxiv url: http://arxiv.org/abs/2103.09714v1
- Date: Wed, 17 Mar 2021 15:17:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-18 13:09:41.966315
- Title: Interpretable Distance Metric Learning for Handwritten Chinese Character
Recognition
- Title(参考訳): 手書き文字認識のための解釈可能な距離距離学習
- Authors: Boxiang Dong, Aparna S. Varde, Danilo Stevanovic, Jiayin Wang, Liang
Zhao
- Abstract要約: 手書き漢字認識のための解釈可能な距離距離距離学習手法を提案する。
ベンチマークデータセットにおける実験結果は,提案手法の効率,正確性,解釈性に優れることを示す。
- 参考スコア(独自算出の注目度): 8.233701182710035
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Handwriting recognition is of crucial importance to both Human Computer
Interaction (HCI) and paperwork digitization. In the general field of Optical
Character Recognition (OCR), handwritten Chinese character recognition faces
tremendous challenges due to the enormously large character sets and the
amazing diversity of writing styles. Learning an appropriate distance metric to
measure the difference between data inputs is the foundation of accurate
handwritten character recognition. Existing distance metric learning approaches
either produce unacceptable error rates, or provide little interpretability in
the results. In this paper, we propose an interpretable distance metric
learning approach for handwritten Chinese character recognition. The learned
metric is a linear combination of intelligible base metrics, and thus provides
meaningful insights to ordinary users. Our experimental results on a benchmark
dataset demonstrate the superior efficiency, accuracy and interpretability of
our proposed approach.
- Abstract(参考訳): 筆跡認識はヒューマン・コンピュータ・インタラクション(HCI)と文書のデジタル化において重要である。
オプティカルキャラクタ認識(OCR)の一般分野において、手書き文字認識は、非常に大きな文字セットと驚くほど多様な文字スタイルのために、大きな課題に直面している。
データ入力間の差を測定するための適切な距離メトリックの学習は、正確な手書き文字認識の基礎である。
既存の距離メトリック学習アプローチは、許容できないエラー率を生成するか、結果にほとんど解釈できない。
本稿では,手書き漢字認識のための解釈可能な距離距離メトリック学習手法を提案する。
学習されたメトリックは、理解可能なベースメトリクスの線形組み合わせであり、普通のユーザに有意義な洞察を提供する。
ベンチマークデータセットにおける実験結果は,提案手法の効率,正確性,解釈性に優れることを示す。
関連論文リスト
- Self-Supervised Representation Learning with Spatial-Temporal Consistency for Sign Language Recognition [96.62264528407863]
本研究では,空間的時間的整合性を通じてリッチな文脈を探索する自己教師付きコントラスト学習フレームワークを提案する。
動きと関節のモーダル性の相補性に着想を得て,手話モデルに一階動作情報を導入する。
提案手法は,4つの公開ベンチマークの広範な実験により評価され,新しい最先端性能と顕著なマージンを実現している。
論文 参考訳(メタデータ) (2024-06-15T04:50:19Z) - Machine Translation Meta Evaluation through Translation Accuracy
Challenge Sets [92.38654521870444]
ACESは146の言語ペアにまたがる対照的な課題セットです。
このデータセットは、メトリクスが68の翻訳精度の誤差を識別できるかどうかを調べることを目的としている。
我々は、WMT2022および2023のメトリクス共有タスクに提出された50のメトリクスに対して、ACESをベンチマークすることで、大規模な研究を行う。
論文 参考訳(メタデータ) (2024-01-29T17:17:42Z) - Multiscale Feature Learning Using Co-Tuplet Loss for Offline Handwritten Signature Verification [0.0]
我々は,MultiScale Signature Feature Learning Network (MS-SigNet)を紹介した。
MS-SigNetは、複数の空間スケールからグローバルと地域両方の署名機能を学び、特徴の識別を強化する。
また、この言語のための堅牢なシステム開発を支援するため、大規模な中国語署名データセットであるHanSigも提示する。
論文 参考訳(メタデータ) (2023-08-01T10:14:43Z) - A Dataset of Inertial Measurement Units for Handwritten English
Alphabets [16.74710649245842]
本稿では,手書き英語のアルファベット認識のためのデータセット収集手法を提案する。
IMUは手書きによる動的な動きパターンを捉えるために使われ、アルファベットをより正確に認識することができる。
論文 参考訳(メタデータ) (2023-07-05T17:54:36Z) - End-to-End Page-Level Assessment of Handwritten Text Recognition [69.55992406968495]
HTRシステムは、文書のエンドツーエンドのページレベルの書き起こしに直面している。
標準メトリクスは、現れる可能性のある不整合を考慮していない。
本稿では、転写精度とROの良さを別々に検討する2つの評価法を提案する。
論文 参考訳(メタデータ) (2023-01-14T15:43:07Z) - Reading and Writing: Discriminative and Generative Modeling for
Self-Supervised Text Recognition [101.60244147302197]
テキスト画像の識別と生成を学習するために,コントラスト学習とマスク付き画像モデリングを導入する。
本手法は,不規則なシーンテキスト認識データセットにおいて,従来の自己教師付きテキスト認識手法を10.2%~20.2%向上させる。
提案したテキスト認識器は,11のベンチマークで平均5.3%の精度で従来のテキスト認識手法を上回り,モデルサイズが類似している。
論文 参考訳(メタデータ) (2022-07-01T03:50:26Z) - Transparent Human Evaluation for Image Captioning [70.03979566548823]
画像キャプションモデルのためのルーリックに基づく人間評価プロトコルを開発した。
人為的キャプションは機械的キャプションよりも著しく高品質であることを示す。
この研究は、画像キャプションのためのより透明な評価プロトコルを促進することを願っている。
論文 参考訳(メタデータ) (2021-11-17T07:09:59Z) - Towards an IMU-based Pen Online Handwriting Recognizer [2.6707647984082357]
慣性測定単位(IMU)に基づく音声認識のためのオンライン手書き認識システムを提案する。
これは、加速度、角速度、およびBluetooth経由で流れる磁力を提供するセンサー付きペンによって得られる。
本モデルは畳み込み型LSTMネットワークと双方向型LSTMネットワークを組み合わせることで,コネクショナリストの時間的分類損失をトレーニングする。
論文 参考訳(メタデータ) (2021-05-26T09:47:19Z) - Skeleton Based Sign Language Recognition Using Whole-body Keypoints [71.97020373520922]
手話は聴覚障害者や言語障害者のコミュニケーションに使用される。
また,RGB-D法と組み合わせて最先端の性能を実現することで,Skeletonに基づく音声認識が普及しつつある。
近年のボディポーズ推定用citejin 2020wholeの開発に触発されて,全身キーポイントと特徴に基づく手話認識を提案する。
論文 参考訳(メタデータ) (2021-03-16T03:38:17Z) - Spectral Graph-based Features for Recognition of Handwritten Characters:
A Case Study on Handwritten Devanagari Numerals [0.0]
本稿では,手書き文字を表現するために,頑健なグラフ表現とスペクトルグラフ埋め込みの概念を利用する手法を提案する。
提案手法の有効性の検証のために,インド統計研究所コルカタデータセットの標準手書き数値視覚パターン認識について広範な実験を行った。
論文 参考訳(メタデータ) (2020-07-07T08:40:08Z) - Neural Computing for Online Arabic Handwriting Character Recognition
using Hard Stroke Features Mining [0.0]
オンラインアラビア文字認識における書字ストローク特徴の垂直方向と水平方向から所望の臨界点を検出する方法を提案する。
バックプロパゲーション学習アルゴリズムと修正シグモイド関数に基づくアクティベーション関数を備えた多層パーセプトロンを用いて、文字の分類のためにこれらのトークンから最小の特徴セットを抽出する。
提案手法は,文字認識技術に匹敵する98.6%の平均精度を実現する。
論文 参考訳(メタデータ) (2020-05-02T23:17:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。