論文の概要: Letter-level Online Writer Identification
- arxiv url: http://arxiv.org/abs/2112.02824v1
- Date: Mon, 6 Dec 2021 07:21:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-07 16:29:34.436677
- Title: Letter-level Online Writer Identification
- Title(参考訳): 文字レベルオンライン作者識別
- Authors: Zelin Chen, Hong-Xing Yu, Ancong Wu and Wei-Shi Zheng
- Abstract要約: 我々は文字レベルのオンラインライタIDという新たな問題に焦点をあてる。
主な課題は、しばしば異なるスタイルで手紙を書くことである。
我々はこの問題をオンライン書記スタイルのばらつき(Var-O-Styles)と呼ぶ。
- 参考スコア(独自算出の注目度): 86.13203975836556
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Writer identification (writer-id), an important field in biometrics, aims to
identify a writer by their handwriting. Identification in existing writer-id
studies requires a complete document or text, limiting the scalability and
flexibility of writer-id in realistic applications. To make the application of
writer-id more practical (e.g., on mobile devices), we focus on a novel
problem, letter-level online writer-id, which requires only a few trajectories
of written letters as identification cues. Unlike text-\ document-based
writer-id which has rich context for identification, there are much fewer clues
to recognize an author from only a few single letters. A main challenge is that
a person often writes a letter in different styles from time to time. We refer
to this problem as the variance of online writing styles (Var-O-Styles). We
address the Var-O-Styles in a capture-normalize-aggregate fashion: Firstly, we
extract different features of a letter trajectory by a carefully designed
multi-branch encoder, in an attempt to capture different online writing styles.
Then we convert all these style features to a reference style feature domain by
a novel normalization layer. Finally, we aggregate the normalized features by a
hierarchical attention pooling (HAP), which fuses all the input letters with
multiple writing styles into a compact feature vector. In addition, we also
contribute a large-scale LEtter-level online wRiter IDentification dataset
(LERID) for evaluation. Extensive comparative experiments demonstrate the
effectiveness of the proposed framework.
- Abstract(参考訳): バイオメトリックスにおける重要な分野であるライター識別(ライターID)は,手書きによる作者の識別を目的としている。
既存の writer-id 研究における識別には完全なドキュメントやテキストが必要であり、現実的なアプリケーションでは writer-id のスケーラビリティと柔軟性が制限される。
writer-idをより実用的なものにするために(例えばモバイルデバイス上で)、文字レベルのオンライン writer-id という新しい問題に焦点を当てている。
文書ベースのライタIDは、識別のためのリッチなコンテキストを持つが、わずか数文字で著者を識別する手掛かりははるかに少ない。
主な課題は、人が時々異なるスタイルで手紙を書くことである。
この問題をオンラインライティングスタイル(var-oスタイル)の分散と呼ぶ。
本稿では,Var-O-Stylesをキャプチャ・正規化・集約方式で扱う。 まず,慎重に設計されたマルチブランチエンコーダを用いて,異なるオンライン書き込みスタイルをキャプチャするために,文字軌跡の異なる特徴を抽出する。
そして、これら全てのスタイル特徴を新しい正規化層によって参照スタイル特徴領域に変換する。
最後に、正規化された特徴を階層型アテンションプーリング(HAP)により集約し、入力文字を複数の書き込みスタイルで融合してコンパクトな特徴ベクトルとする。
さらに,評価のために,大規模なLEtterレベルのオンラインwRiter識別データセット(LERID)も提供します。
広範な比較実験により,提案手法の有効性が示された。
関連論文リスト
- Capturing Style in Author and Document Representation [4.323709559692927]
著者と文書の埋め込みをスタイリスティックな制約で学習する新しいアーキテクチャを提案する。
本稿では,Gutenbergプロジェクトから抽出した文芸コーパス,Blog Authorship,IMDb62の3つのデータセットについて評価を行った。
論文 参考訳(メタデータ) (2024-07-18T10:01:09Z) - Decoding the End-to-end Writing Trajectory in Scholarly Manuscripts [7.294418916091011]
そこで本研究では,意図,著作者行動,および記述データの情報タイプに応じて,学術的な記述行動の分類を行う新しい分類法を提案する。
学術論文の分類学は,認知書記理論に動機付けられ,一般的な書記の流れを辿るために,分類のレベルが3つ含まれている。
ManuScriptは、書道の直線性と非直線性を捉えることによって、学術的な書道の完全な図面を提供する。
論文 参考訳(メタデータ) (2023-03-31T20:33:03Z) - Towards Writing Style Adaptation in Handwriting Recognition [0.0]
著者のアイデンティティを付加的な入力として捉えるために,著者に依存したパラメータを持つモデルについて検討する。
本稿では,学習した分割の埋め込みを前提とした適応型インスタンス正規化層であるWriter Style Block (WSB)を提案する。
著者に依存したシナリオでは,本手法はWSBのないベースラインよりも優れており,新たなライターへの埋め込みを推定することが可能であることを示す。
論文 参考訳(メタデータ) (2023-02-13T12:36:17Z) - Measuring Annotator Agreement Generally across Complex Structured,
Multi-object, and Free-text Annotation Tasks [79.24863171717972]
品質保証のための重要な指標は、IAA(Inter-annotator Agreement)である。
単純な分類的および順序的なラベリングタスクには対策があるが、より複雑なラベリングタスクを考える作業はほとんどない。
クリッペンドルフのαは、より単純なラベリングタスクでよく用いられるが、より広い適用性を持つ距離ベースの定式化を持つ。
論文 参考訳(メタデータ) (2022-12-15T20:12:48Z) - PART: Pre-trained Authorship Representation Transformer [64.78260098263489]
文書を書く著者は、語彙、レジストリ、句読点、ミススペル、絵文字の使用など、テキスト内での識別情報をインプリントする。
以前の作品では、手作りのフィーチャや分類タスクを使用して著者モデルをトレーニングし、ドメイン外の著者に対するパフォーマンスの低下につながった。
セマンティクスの代わりにtextbfauthorship の埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - CDistNet: Perceiving Multi-Domain Character Distance for Robust Text
Recognition [87.3894423816705]
本稿では,MDCDP (Multi-Domain Character Distance Perception) と呼ばれる新しいモジュールを提案する。
MDCDPは位置埋め込みを使用して、クロスアテンションメカニズムに従って視覚的特徴と意味的特徴の両方を問合せする。
我々は、複数のMDCDPを積み重ねたCDistNetを開発し、徐々に正確な距離モデリングをガイドする。
論文 参考訳(メタデータ) (2021-11-22T06:27:29Z) - Exploiting Multi-Scale Fusion, Spatial Attention and Patch Interaction
Techniques for Text-Independent Writer Identification [15.010153819096056]
本稿では,3つの異なる深層学習手法 – 空間的注意機構,マルチスケール特徴融合,パッチベースCNN – を提案する。
提案手法は,3つの公開データセット上で,ワードレベルおよびページレベルの書き手識別手法において,最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2021-11-20T14:41:36Z) - Rethinking Text Line Recognition Models [57.47147190119394]
2つのデコーダファミリー(コネクショニスト時間分類と変換器)と3つのエンコーダモジュール(双方向LSTM、自己認識、GRCL)を考える。
広く使用されているシーンと手書きテキストの公開データセットの精度とパフォーマンスを比較します。
より一般的なTransformerベースのモデルとは異なり、このアーキテクチャは任意の長さの入力を処理できる。
論文 参考訳(メタデータ) (2021-04-15T21:43:13Z) - DeepStyle: User Style Embedding for Authorship Attribution of Short
Texts [57.503904346336384]
オーサシップアトリビューション(AA)は、多くのアプリケーションで重要で広く研究されている研究トピックです。
近年の研究では、深層学習がAAタスクの精度を大幅に向上させることが示されている。
本稿では,ユーザの健全な書き込みスタイルの表現を学習する新しい埋め込み型フレームワークであるDeepStyleを提案する。
論文 参考訳(メタデータ) (2021-03-14T15:56:37Z) - DRAG: Director-Generator Language Modelling Framework for Non-Parallel
Author Stylized Rewriting [9.275464023441227]
書き直しは、入力テキストを特定の著者のスタイルで書き直す作業である。
著者のスタイルでコンテンツの書き直しを行うためのディレクター・ジェネレータフレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-28T06:52:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。