論文の概要: A Few-shot Learning Approach for Historical Ciphered Manuscript
Recognition
- arxiv url: http://arxiv.org/abs/2009.12577v1
- Date: Sat, 26 Sep 2020 11:49:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-14 09:04:18.570434
- Title: A Few-shot Learning Approach for Historical Ciphered Manuscript
Recognition
- Title(参考訳): 歴史暗号写本認識のための数発学習手法
- Authors: Mohamed Ali Souibgui and Alicia Forn\'es and Yousri Kessentini and
Crina Tudor
- Abstract要約: 少数ショットオブジェクト検出に基づく手書き音声認識のための新しい手法を提案する。
合成データのトレーニングにより,提案アーキテクチャは未知のアルファベットで手書きの暗号を認識可能であることを示す。
- 参考スコア(独自算出の注目度): 3.0682439731292592
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Encoded (or ciphered) manuscripts are a special type of historical documents
that contain encrypted text. The automatic recognition of this kind of
documents is challenging because: 1) the cipher alphabet changes from one
document to another, 2) there is a lack of annotated corpus for training and 3)
touching symbols make the symbol segmentation difficult and complex. To
overcome these difficulties, we propose a novel method for handwritten ciphers
recognition based on few-shot object detection. Our method first detects all
symbols of a given alphabet in a line image, and then a decoding step maps the
symbol similarity scores to the final sequence of transcribed symbols. By
training on synthetic data, we show that the proposed architecture is able to
recognize handwritten ciphers with unseen alphabets. In addition, if few
labeled pages with the same alphabet are used for fine tuning, our method
surpasses existing unsupervised and supervised HTR methods for ciphers
recognition.
- Abstract(参考訳): エンコードされた(または暗号化された)写本は、暗号化されたテキストを含む特別な歴史文書である。
この種の文書の自動認識は、次のように困難である。
1) 暗号アルファベットは,ある文書から別の文書へ変化する。
2) 訓練のための注釈付きコーパスが欠如している。
3) 触覚記号はシンボルのセグメンテーションを難しく複雑にする。
そこで本研究では,この難しさを克服するために,手書きの音声認識手法を提案する。
提案手法はまず,行画像中の任意のアルファベットの記号をまず検出し,復号ステップで記号類似性のスコアを書き起こされた記号の最終的なシーケンスにマッピングする。
合成データのトレーニングにより,提案アーキテクチャは未知のアルファベットで手書きの暗号を認識可能であることを示す。
さらに,同じアルファベットのラベル付きページを微調整に使用する場合,暗号認識のための既存の教師なし・教師なしhtr法を上回っている。
関連論文リスト
- HierCode: A Lightweight Hierarchical Codebook for Zero-shot Chinese Text Recognition [47.86479271322264]
我々は,漢字の自然的階層性を利用した,新規で軽量なコードブックであるHierCodeを提案する。
HierCodeは階層的なバイナリツリーエンコーディングとプロトタイプ学習を活用して、各文字に特徴的な情報表現を生成するマルチホットエンコーディング戦略を採用している。
このアプローチは、共有ラジカルと構造を利用してOOV文字のゼロショット認識を促進するだけでなく、視覚的特徴と類似性を計算することでラインレベルの認識タスクも優れている。
論文 参考訳(メタデータ) (2024-03-20T17:20:48Z) - SeqXGPT: Sentence-Level AI-Generated Text Detection [62.3792779440284]
大規模言語モデル(LLM)を用いた文書の合成による文レベル検出の課題について紹介する。
次に,文レベルのAIGT検出機能として,ホワイトボックスLEMのログ確率リストを利用した textbfSequence textbfX (Check) textbfGPT を提案する。
論文 参考訳(メタデータ) (2023-10-13T07:18:53Z) - CipherSniffer: Classifying Cipher Types [0.0]
我々は復号化タスクを分類問題とする。
まず、転置、置換、テキストの反転、単語の反転、文のシフト、暗号化されていないテキストのデータセットを作成します。
論文 参考訳(メタデータ) (2023-06-13T20:18:24Z) - MaskOCR: Text Recognition with Masked Encoder-Decoder Pretraining [68.05105411320842]
本稿では,従来のエンコーダ・デコーダ認識フレームワークにおいて,視覚と言語を事前学習するための新しいアプローチであるMaskOCRを提案する。
マスク付き画像モデリング手法を用いて、未ラベルのテキスト画像の集合を用いて特徴エンコーダを事前学習する。
テキストデータを合成されたテキスト画像に変換し、視覚と言語のデータモダリティを統一し、シーケンスデコーダの言語モデリング能力を向上する。
論文 参考訳(メタデータ) (2022-06-01T08:27:19Z) - Segmenting Numerical Substitution Ciphers [27.05304607253758]
歴史的置換暗号の解読は難しい問題である。
Byte Pair を用いてそれらの暗号を分割する最初の自動手法を提案する。
また、格子と事前学習言語モデルを用いて、既存のキーで非決定論的暗号を解く方法を提案する。
論文 参考訳(メタデータ) (2022-05-25T06:45:59Z) - Label Semantics for Few Shot Named Entity Recognition [68.01364012546402]
名前付きエンティティ認識におけるショットラーニングの問題について検討する。
我々は,ラベル名中の意味情報を,モデルに付加的な信号を与え,よりリッチな事前情報を与える手段として活用する。
本モデルは,第1エンコーダによって計算された名前付きエンティティの表現と,第2エンコーダによって計算されたラベル表現とを一致させることを学習する。
論文 参考訳(メタデータ) (2022-03-16T23:21:05Z) - Few Shots Is All You Need: A Progressive Few Shot Learning Approach for
Low Resource Handwriting Recognition [1.7491858164568674]
本稿では,人的労働力のアノテーション処理を大幅に削減する,数ショットの学習に基づく手書き文字認識手法を提案する。
我々のモデルは、テキストライン画像中の与えられたアルファベットのすべてのシンボルを検出し、デコードステップは、シンボル類似性のスコアを転写されたシンボルの最終シーケンスにマッピングする。
このリトレーニングには,数千の手書き記号と境界ボックスのアノテーションが必要であるため,教師なしのプログレッシブ・ラーニング・アプローチによる人的作業を回避することを提案する。
論文 参考訳(メタデータ) (2021-07-21T13:18:21Z) - I2C2W: Image-to-Character-to-Word Transformers for Accurate Scene Text
Recognition [68.95544645458882]
本稿では,シーンの様々なノイズに対して正確かつ耐性のある新しいシーンテキスト認識装置I2C2Wについて述べる。
i2c2wはイメージ・ツー・キャラクタモジュール(i2c)と文字・ワードモジュール(c2w)から構成される。
論文 参考訳(メタデータ) (2021-05-18T09:20:58Z) - One-shot Compositional Data Generation for Low Resource Handwritten Text
Recognition [10.473427493876422]
低リソース手書きテキスト認識は、わずかな注釈付きデータと非常に限られた言語情報のために難しい問題です。
本稿では,ベイズプログラム学習に基づくデータ生成手法を用いてこの問題に対処する。
大量の注釈付き画像を必要とする従来型の手法とは対照的に,各記号のサンプルを1つだけ,所望のアルファベットから生成することが可能である。
論文 参考訳(メタデータ) (2021-05-11T18:53:01Z) - Can Sequence-to-Sequence Models Crack Substitution Ciphers? [15.898270650875158]
最先端の解読法は、ビームサーチとニューラルネットワークモデルを用いて、与えられた暗号に対する候補仮説を評価する。
提案手法は明示的な言語識別を伴わずにテキストを解読でき,雑音に対して頑健であることを示す。
論文 参考訳(メタデータ) (2020-12-30T17:16:33Z) - TextScanner: Reading Characters in Order for Robust Scene Text
Recognition [60.04267660533966]
TextScannerはシーンテキスト認識の代替手法である。
文字クラス、位置、順序に対する画素単位のマルチチャネルセグメンテーションマップを生成する。
また、コンテキストモデリングにRNNを採用し、文字の位置とクラスを並列で予測する。
論文 参考訳(メタデータ) (2019-12-28T07:52:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。