論文の概要: Inkorrect: Online Handwriting Spelling Correction
- arxiv url: http://arxiv.org/abs/2202.13794v1
- Date: Mon, 28 Feb 2022 13:39:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-01 16:46:31.532605
- Title: Inkorrect: Online Handwriting Spelling Correction
- Title(参考訳): inkorrect: オンライン手書きスペル修正
- Authors: Andrii Maksai, Henry Rowley, Jesse Berent and Claudiu Musat
- Abstract要約: Inkorrectは、オンライン手書き(Digital Ink)スペル訂正のためのデータおよびラベル効率のアプローチである。
本研究では,既存の自動評価指標が完全には捉えられず,スペル補正の品質に対する人間の認識と相関しないことを示す。
- 参考スコア(独自算出の注目度): 10.506584969668792
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We introduce Inkorrect, a data- and label-efficient approach for online
handwriting (Digital Ink) spelling correction - DISC. Unlike previous work, the
proposed method does not require multiple samples from the same writer, or
access to character level segmentation. We show that existing automatic
evaluation metrics do not fully capture and are not correlated with the human
perception of the quality of the spelling correction, and propose new ones that
correlate with human perception. We additionally surface an interesting
phenomenon: a trade-off between the similarity and recognizability of the
spell-corrected inks. We further create a family of models corresponding to
different points on the Pareto frontier between those two axes. We show that
Inkorrect's Pareto frontier dominates the points that correspond to prior work.
- Abstract(参考訳): Inkorrectは、オンライン手書き(デジタルインク)スペル訂正のためのデータおよびラベル効率のよいアプローチである。
従来の作業とは異なり、提案手法では同一のライタからの複数のサンプルや文字レベルのセグメンテーションへのアクセスは不要である。
既存の自動評価指標は, 完全には捉えられず, 綴り補正の質の人間の知覚と相関しないことを示すとともに, 人間の知覚と相関する新たな指標を提案する。
さらに,スペル補正したインクの類似性と認識可能性とのトレードオフという,興味深い現象が浮かび上がっている。
さらに,これら2つの軸間のパレートフロンティアの異なる点に対応するモデル群を作成する。
InkorrectのParetoフロンティアが先行作業に対応する点を支配していることを示す。
関連論文リスト
- Cobra Effect in Reference-Free Image Captioning Metrics [58.438648377314436]
視覚言語事前学習モデル(VLM)を活用した参照フリー手法の普及が出現している。
本稿では,基準自由度に欠陥があるかどうかを考察する。
GPT-4Vは生成した文を評価するための評価ツールであり,提案手法がSOTA(State-of-the-art)の性能を達成することを示す。
論文 参考訳(メタデータ) (2024-02-18T12:36:23Z) - InkSight: Offline-to-Online Handwriting Conversion by Learning to Read
and Write [7.827729986700937]
InkSightは、物理的なメモ取り者が自分の仕事(オフラインの筆跡)をデジタルのインク(オンラインの筆跡)に変換するのを助ける
当社のアプローチでは、事前の読み書きと組み合わせて、大量のペアのサンプルがない場合にモデルをトレーニングすることが可能です。
人間の評価では,HierTextデータセット上で得られたサンプルの87%が,入力画像の有効なトレースとして検討されている。
論文 参考訳(メタデータ) (2024-02-08T16:41:41Z) - Is it an i or an l: Test-time Adaptation of Text Line Recognition Models [9.149602257966917]
テスト期間中にテキスト行認識モデルを適用する問題について紹介する。
本稿では,光学モデルの更新に言語モデルからのフィードバックを利用する反復的自己学習手法を提案する。
実験の結果,提案手法は文字誤り率を最大8%向上させることができた。
論文 参考訳(メタデータ) (2023-08-29T05:44:00Z) - Chinese Spelling Correction as Rephrasing Language Model [63.65217759957206]
文中のスペル誤りを検知し,訂正することを目的とした中国語スペル補正(CSC)について検討する。
現在の最先端の手法は、CSCをシーケンスタギングタスクと文対上の細いBERTベースのモデルとみなしている。
本稿では,文字から文字へのタグ付けではなく,追加のスロットを埋め込むことで文全体を言い換える言語モデル(ReLM)を提案する。
論文 参考訳(メタデータ) (2023-08-17T06:04:28Z) - Towards Unsupervised Recognition of Token-level Semantic Differences in
Related Documents [61.63208012250885]
意味的差異をトークンレベルの回帰タスクとして認識する。
マスク付き言語モデルに依存する3つの教師なしアプローチについて検討する。
その結果,単語アライメントと文レベルのコントラスト学習に基づくアプローチは,ゴールドラベルと強い相関関係があることが示唆された。
論文 参考訳(メタデータ) (2023-05-22T17:58:04Z) - Representation Learning for Tablet and Paper Domain Adaptation in Favor
of Online Handwriting Recognition [3.071136270246468]
機械学習モデルのパフォーマンスは、当初トレーニングされたデータと似ているが異なるドメインのデータに適用された時に低下する。
本稿では,タブレットと紙データ間のオンライン手書き文字認識(OnHW)の学習を促進するために,教師付きドメイン適応(DA)アプローチを提案する。
論文 参考訳(メタデータ) (2023-01-16T07:48:37Z) - End-to-End Page-Level Assessment of Handwritten Text Recognition [69.55992406968495]
HTRシステムは、文書のエンドツーエンドのページレベルの書き起こしに直面している。
標準メトリクスは、現れる可能性のある不整合を考慮していない。
本稿では、転写精度とROの良さを別々に検討する2つの評価法を提案する。
論文 参考訳(メタデータ) (2023-01-14T15:43:07Z) - PART: Pre-trained Authorship Representation Transformer [64.78260098263489]
文書を書く著者は、語彙、レジストリ、句読点、ミススペル、絵文字の使用など、テキスト内での識別情報をインプリントする。
以前の作品では、手作りのフィーチャや分類タスクを使用して著者モデルをトレーニングし、ドメイン外の著者に対するパフォーマンスの低下につながった。
セマンティクスの代わりにtextbfauthorship の埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - Neural Graph Matching for Modification Similarity Applied to Electronic
Document Comparison [0.0]
文書比較は法律や金融業界で一般的な課題である。
本稿では,文書比較に応用した新しいニューラルグラフマッチング手法を提案する。
論文 参考訳(メタデータ) (2022-04-12T02:37:54Z) - Cross-domain Speech Recognition with Unsupervised Character-level
Distribution Matching [60.8427677151492]
2つの領域における各文字間の微粒化適応を行うための文字レベルの分布マッチング手法であるCMatchを提案する。
Libri-Adaptデータセットを用いた実験の結果,提案手法はクロスデバイスとクロス環境の両方で14.39%,16.50%の単語誤り率(WER)を低減できることがわかった。
論文 参考訳(メタデータ) (2021-04-15T14:36:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。