論文の概要: Writer Retrieval and Writer Identification in Greek Papyri
- arxiv url: http://arxiv.org/abs/2212.07664v1
- Date: Thu, 15 Dec 2022 08:42:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 17:00:09.512161
- Title: Writer Retrieval and Writer Identification in Greek Papyri
- Title(参考訳): ギリシア・パピリにおける作家検索と作家識別
- Authors: Vincent Christlein, Isabelle Marthot-Santaniello, Martin Mayr,
Anguelos Nicolaou, Mathias Seuret
- Abstract要約: 著者識別は、既知の著者の分類であり、著者検索は、画像のデータセットにおける画像の類似性によって、著者を見つけようとする。
自動書き手識別・検索手法はすでに多くの歴史的文書タイプに対して有望な結果を提供しているが,繊維構造や重度アーティファクトのため,パピリデータは非常に困難である。
そこで本研究では,パピリ文字における書き手識別の改善に,優れたバイナライゼーションが重要であることを示す。
- 参考スコア(独自算出の注目度): 4.44566870214758
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The analysis of digitized historical manuscripts is typically addressed by
paleographic experts. Writer identification refers to the classification of
known writers while writer retrieval seeks to find the writer by means of image
similarity in a dataset of images. While automatic writer
identification/retrieval methods already provide promising results for many
historical document types, papyri data is very challenging due to the fiber
structures and severe artifacts. Thus, an important step for an improved writer
identification is the preprocessing and feature sampling process. We
investigate several methods and show that a good binarization is key to an
improved writer identification in papyri writings. We focus mainly on writer
retrieval using unsupervised feature methods based on traditional or
self-supervised-based methods. It is, however, also comparable to the state of
the art supervised deep learning-based method in the case of writer
classification/re-identification.
- Abstract(参考訳): デジタル化された歴史写本の分析は通常、古文書の専門家によって取り扱われる。
作家の識別は既知の作家の分類を参照し、作家の検索は画像のデータセットにおける画像の類似性によって作家を見つけようとする。
自動書き手識別・検索手法はすでに多くの歴史的文書タイプに対して有望な結果を提供しているが,繊維構造や重度アーティファクトのため,パピリデータは非常に困難である。
したがって、ライター識別の改善のための重要なステップは、前処理と特徴サンプリングプロセスである。
そこで本研究では,パピリ文字における書き手識別の改善に優れたバイナライゼーションが重要であることを示す。
本研究は,従来的・自己監督的手法に基づく教師なし特徴手法を用いた著者検索に主眼を置いている。
しかし、著者分類/再同定の場合、ディープラーニングベースの手法を監督する技術の現状に匹敵するものである。
関連論文リスト
- Efficiently Leveraging Linguistic Priors for Scene Text Spotting [63.22351047545888]
本稿では,大規模テキストコーパスから言語知識を活用する手法を提案する。
シーンテキストデータセットとよく一致したテキスト分布を生成し、ドメイン内の微調整の必要性を取り除く。
実験結果から,本手法は認識精度を向上するだけでなく,単語のより正確な局所化を可能にすることが示された。
論文 参考訳(メタデータ) (2024-02-27T01:57:09Z) - Enhancing Representation Generalization in Authorship Identification [9.148691357200216]
著者の身元確認は、出自が公表されていないテキストの著者の身元を確認する。
現代の著作者識別法は、著作者スタイルの識別に有効であることが証明されている。
著者識別におけるスタイリスティックな表現の一般化の促進という課題に対処する。
論文 参考訳(メタデータ) (2023-09-30T17:11:00Z) - PART: Pre-trained Authorship Representation Transformer [64.78260098263489]
文書を書く著者は、語彙、レジストリ、句読点、ミススペル、絵文字の使用など、テキスト内での識別情報をインプリントする。
以前の作品では、手作りのフィーチャや分類タスクを使用して著者モデルをトレーニングし、ドメイン外の著者に対するパフォーマンスの低下につながった。
セマンティクスの代わりにtextbfauthorship の埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - Open Set Classification of Untranscribed Handwritten Documents [56.0167902098419]
重要な写本の膨大な量のデジタルページイメージが世界中のアーカイブに保存されている。
ドキュメントのクラスや型付け'はおそらくメタデータに含まれる最も重要なタグです。
技術的問題は文書の自動分類の1つであり、それぞれが書き起こされていない手書きのテキスト画像からなる。
論文 参考訳(メタデータ) (2022-06-20T20:43:50Z) - Digital Editions as Distant Supervision for Layout Analysis of Printed
Books [76.29918490722902]
本稿では,この意味的マークアップを,レイアウト解析モデルのトレーニングと評価のための遠隔監視として利用する手法について述べる。
DTA(Deutsches Textarchiv)の50万ページにわたるモデルアーキテクチャの実験では、これらの領域レベルの評価手法と画素レベルのメトリクスとワードレベルのメトリクスとの高い相関性を見出した。
自己学習による精度向上の可能性と、DTAで訓練されたモデルが他の歴史書に一般化できる可能性について論じる。
論文 参考訳(メタデータ) (2021-12-23T16:51:53Z) - Letter-level Online Writer Identification [86.13203975836556]
我々は文字レベルのオンラインライタIDという新たな問題に焦点をあてる。
主な課題は、しばしば異なるスタイルで手紙を書くことである。
我々はこの問題をオンライン書記スタイルのばらつき(Var-O-Styles)と呼ぶ。
論文 参考訳(メタデータ) (2021-12-06T07:21:53Z) - Exploiting Multi-Scale Fusion, Spatial Attention and Patch Interaction
Techniques for Text-Independent Writer Identification [15.010153819096056]
本稿では,3つの異なる深層学習手法 – 空間的注意機構,マルチスケール特徴融合,パッチベースCNN – を提案する。
提案手法は,3つの公開データセット上で,ワードレベルおよびページレベルの書き手識別手法において,最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2021-11-20T14:41:36Z) - Handwriting Classification for the Analysis of Art-Historical Documents [6.918282834668529]
We focus on the analysis of handwriting in scanned document from the art-historic Archive of the WPI。
視覚構造に基づいて抽出されたテキストの断片をラベル付けする手書き分類モデルを提案する。
論文 参考訳(メタデータ) (2020-11-04T13:06:46Z) - Neural Deepfake Detection with Factual Structure of Text [78.30080218908849]
テキストのディープフェイク検出のためのグラフベースモデルを提案する。
我々のアプローチは、ある文書の事実構造をエンティティグラフとして表現する。
本モデルでは,機械生成テキストと人文テキストの事実構造の違いを識別することができる。
論文 参考訳(メタデータ) (2020-10-15T02:35:31Z) - Single-sample writers -- "Document Filter" and their impacts on writer
identification [7.459089186033613]
文書フィルタ」プロトコルは、前処理技術として使用されるはずである。
ドキュメントフィルタ"プロトコルは、ライター自身から機能をキャプチャするように設計されている。
文書フィルター」プロトコルを用いて得られた認識率は81.80%から50.37%に低下した。
論文 参考訳(メタデータ) (2020-05-18T02:02:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。