論文の概要: Contrastive Masked Autoencoders for Character-Level Open-Set Writer Identification
- arxiv url: http://arxiv.org/abs/2501.11895v1
- Date: Tue, 21 Jan 2025 05:15:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-22 14:24:24.180213
- Title: Contrastive Masked Autoencoders for Character-Level Open-Set Writer Identification
- Title(参考訳): 文字レベルオープンセット文字識別のためのコントラストマスク付きオートエンコーダ
- Authors: Xiaowei Jiang, Wenhao Ma, Yiqun Duan, Thomas Do, Chin-Teng Lin,
- Abstract要約: 本稿では,文字レベルのオープンセット文字識別のためのCMAE(Contrastive Masked Auto-Encoders)を提案する。
我々は,Masked Auto-Encoders (MAE) とContrastive Learning (CL) を同時に組み合わせて,逐次情報を収集し,多様な手書きスタイルを区別する。
我々のモデルはCASIAオンライン手書きデータセットの最先端の結果を達成し、89.7%の精度で到達した。
- 参考スコア(独自算出の注目度): 25.996617568144675
- License:
- Abstract: In the realm of digital forensics and document authentication, writer identification plays a crucial role in determining the authors of documents based on handwriting styles. The primary challenge in writer-id is the "open-set scenario", where the goal is accurately recognizing writers unseen during the model training. To overcome this challenge, representation learning is the key. This method can capture unique handwriting features, enabling it to recognize styles not previously encountered during training. Building on this concept, this paper introduces the Contrastive Masked Auto-Encoders (CMAE) for Character-level Open-Set Writer Identification. We merge Masked Auto-Encoders (MAE) with Contrastive Learning (CL) to simultaneously and respectively capture sequential information and distinguish diverse handwriting styles. Demonstrating its effectiveness, our model achieves state-of-the-art (SOTA) results on the CASIA online handwriting dataset, reaching an impressive precision rate of 89.7%. Our study advances universal writer-id with a sophisticated representation learning approach, contributing substantially to the ever-evolving landscape of digital handwriting analysis, and catering to the demands of an increasingly interconnected world.
- Abstract(参考訳): デジタル法医学と文書認証の分野では、手書きスタイルに基づいた文書作成者を決定する上で、著者識別が重要な役割を担っている。
ライター・イドの最大の課題は「オープン・セット・シナリオ」であり、モデル・トレーニング中に見つからない作家を正確に認識することである。
この課題を克服するためには、表現学習が鍵となる。
この方法では、独自の手書き文字の特徴をキャプチャし、トレーニング中にこれまで遭遇していなかったスタイルを認識できる。
この概念に基づいて,文字レベルのオープンセット文字識別のためのコントラストマスク付き自動エンコーダ(CMAE)を提案する。
我々は,Masked Auto-Encoders (MAE) とContrastive Learning (CL) を同時に組み合わせて,逐次情報を収集し,多様な手書きスタイルを区別する。
提案手法の有効性を実証し,CASIAオンライン手書きデータセットのSOTA(State-of-the-art)結果が89.7%の精度で得られた。
本研究は、デジタル手書き解析の進化する風景に大きく貢献し、ますます相互接続する世界の要求に対処する、洗練された表現学習アプローチでユニバーサルライターIDを進化させる。
関連論文リスト
- Representing Online Handwriting for Recognition in Large Vision-Language
Models [8.344510330567495]
本稿では,テキストとして,画像として,時間順のストローク列を含む新しいデジタルインク(オンライン手書き)のトークン化表現を提案する。
この表現は、最先端のオンライン筆跡認識器に匹敵する結果が得られることを示す。
論文 参考訳(メタデータ) (2024-02-23T13:11:10Z) - Class-Aware Mask-Guided Feature Refinement for Scene Text Recognition [56.968108142307976]
CAM(Class-Aware Mask-Guided Feature refinement)と呼ばれる新しい手法を提案する。
本手法では,背景およびテキストスタイルのノイズを抑制するために,標準クラス対応グリフマスクを導入している。
標準マスク特徴とテキスト特徴とのアライメントを強化することにより、モジュールはより効果的な融合を保証する。
論文 参考訳(メタデータ) (2024-02-21T09:22:45Z) - The Chosen One: Consistent Characters in Text-to-Image Diffusion Models [71.15152184631951]
そこで本研究では,テキストプロンプトのみを入力として,一貫した文字生成を完全自動化する手法を提案する。
本手法は, 基本手法と比較して, 即時アライメントと同一性整合性のバランスが良くなる。
論文 参考訳(メタデータ) (2023-11-16T18:59:51Z) - On Task-personalized Multimodal Few-shot Learning for Visually-rich
Document Entity Retrieval [59.25292920967197]
VDER(Few-shot document entity search)は、NLPアプリケーションにおいて重要なトピックである。
FewVEXは、エンティティレベルの少数ショットVDERの分野における将来の研究を促進するための、新しいデータセットである。
本稿では,タスクパーソナライズを効果的に実現することを中心に,タスク認識型メタラーニングベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-01T17:51:43Z) - Recognizing Handwriting Styles in a Historical Scanned Document Using
Unsupervised Fuzzy Clustering [0.0]
特異な手書きスタイルは、文字サイズ、ストローク幅、ループ、ダクト、スラットアングル、カーシブリグチュアなど、いくつかの要素のブレンドで異なってくることがある。
隠れマルコフモデル、サポートベクターマシン、半教師付きリカレントニューラルネットワークによるラベル付きデータの研究は、中程度から高い成功を収めている。
本研究では, ファジィソフトクラスタリングと線形主成分分析を併用して, 歴史写本の手動変化を検知することに成功した。
論文 参考訳(メタデータ) (2022-10-30T09:07:51Z) - PART: Pre-trained Authorship Representation Transformer [64.78260098263489]
文書を書く著者は、語彙、レジストリ、句読点、ミススペル、絵文字の使用など、テキスト内での識別情報をインプリントする。
以前の作品では、手作りのフィーチャや分類タスクを使用して著者モデルをトレーニングし、ドメイン外の著者に対するパフォーマンスの低下につながった。
セマンティクスの代わりにtextbfauthorship の埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - Letter-level Online Writer Identification [86.13203975836556]
我々は文字レベルのオンラインライタIDという新たな問題に焦点をあてる。
主な課題は、しばしば異なるスタイルで手紙を書くことである。
我々はこの問題をオンライン書記スタイルのばらつき(Var-O-Styles)と呼ぶ。
論文 参考訳(メタデータ) (2021-12-06T07:21:53Z) - Exploiting Multi-Scale Fusion, Spatial Attention and Patch Interaction
Techniques for Text-Independent Writer Identification [15.010153819096056]
本稿では,3つの異なる深層学習手法 – 空間的注意機構,マルチスケール特徴融合,パッチベースCNN – を提案する。
提案手法は,3つの公開データセット上で,ワードレベルおよびページレベルの書き手識別手法において,最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2021-11-20T14:41:36Z) - Handwriting Recognition with Novelty [0.0]
手書き文書では、ノベルティは書き手、文字属性、属性の書き方、文書全体の外観を変えることができる。
本稿では,手書き認識の領域をノベルティで定式化し,ベースラインエージェントを記述し,ベンチマークデータを用いた評価プロトコルを導入し,最先端の設定実験を提供する。
論文 参考訳(メタデータ) (2021-05-13T23:01:07Z) - Separating Content from Style Using Adversarial Learning for Recognizing
Text in the Wild [103.51604161298512]
画像中の複数の文字の生成と認識のための逆学習フレームワークを提案する。
我々のフレームワークは、新しい最先端の認識精度を達成するために、最近の認識手法に統合することができる。
論文 参考訳(メタデータ) (2020-01-13T12:41:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。