論文の概要: Character Detection using YOLO for Writer Identification in multiple Medieval books
- arxiv url: http://arxiv.org/abs/2601.04834v1
- Date: Thu, 08 Jan 2026 11:11:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 17:01:53.176567
- Title: Character Detection using YOLO for Writer Identification in multiple Medieval books
- Title(参考訳): 複数の中世書物における文字識別のためのYOLOを用いた文字検出
- Authors: Alessandra Scotto di Freca, Tiziana D Alessandro, Francesco Fontanella, Filippo Sarria, Claudio De Stefano,
- Abstract要約: 文書の執筆時期を推定し、中世の写本に寄与した個々の筆跡を特定することで、書跡や書体の発展をたどることができる。
筆者らはこれまで、各著者を特徴付ける特定の文字や略語を特定することに焦点を当てたアプローチを提案してきた。
テンプレートマッチング手法を用いて、各ページの「a」文字と畳み込みニューラルネットワーク(CNN)の出現を検知し、各インスタンスを正しいスクライブに属性付けした。
- 参考スコア(独自算出の注目度): 37.5324866770459
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Paleography is the study of ancient and historical handwriting, its key objectives include the dating of manuscripts and understanding the evolution of writing. Estimating when a document was written and tracing the development of scripts and writing styles can be aided by identifying the individual scribes who contributed to a medieval manuscript. Although digital technologies have made significant progress in this field, the general problem remains unsolved and continues to pose open challenges. ... We previously proposed an approach focused on identifying specific letters or abbreviations that characterize each writer. In that study, we considered the letter "a", as it was widely present on all pages of text and highly distinctive, according to the suggestions of expert paleographers. We used template matching techniques to detect the occurrences of the character "a" on each page and the convolutional neural network (CNN) to attribute each instance to the correct scribe. Moving from the interesting results achieved from this previous system and being aware of the limitations of the template matching technique, which requires an appropriate threshold to work, we decided to experiment in the same framework with the use of the YOLO object detection model to identify the scribe who contributed to the writing of different medieval books. We considered the fifth version of YOLO to implement the YOLO object detection model, which completely substituted the template matching and CNN used in the previous work. The experimental results demonstrate that YOLO effectively extracts a greater number of letters considered, leading to a more accurate second-stage classification. Furthermore, the YOLO confidence score provides a foundation for developing a system that applies a rejection threshold, enabling reliable writer identification even in unseen manuscripts.
- Abstract(参考訳): 古写本学は古代・歴史的筆跡の研究であり、その主な目的は写本の年代付けと書跡の進化の理解である。
文書の執筆時期を推定し、中世の写本に寄与した個々の筆跡を特定することで、書跡や書体の発展をたどることができる。
デジタル技術はこの分野で大きな進歩を遂げてきたが、一般的な問題は未解決のままであり、オープンな課題を呈し続けている。
はぁ...。
筆者らはこれまで、各著者を特徴付ける特定の文字や略語を特定することに焦点を当てたアプローチを提案してきた。
本研究は,「a」という文字を,専門家の古生物学者による示唆によれば,全文に広く存在し,非常に独特な文字として捉えたものである。
テンプレートマッチング手法を用いて、各ページの「a」文字と畳み込みニューラルネットワーク(CNN)の出現を検知し、各インスタンスを正しいスクライブに属性付けした。
従来のシステムから得られた興味深い結果から,作業に適切なしきい値を必要とするテンプレートマッチング手法の限界を認識した上で,YOLOオブジェクト検出モデルを用いて,さまざまな中世書の執筆に寄与した書記者を特定することで,同じフレームワークで実験を行うことを決定した。
我々は,YOLOの5番目のバージョンを,従来のテンプレートマッチングとCNNを完全に置き換えたYOLOオブジェクト検出モデルの実装として検討した。
実験の結果, YOLOは検討された文字を効果的に抽出し, より正確な第2段階分類を行うことができた。
さらに、YOLO信頼スコアは、未確認の原稿であっても信頼性の高い著者識別が可能な拒絶しきい値を適用したシステムを開発するための基盤を提供する。
関連論文リスト
- Human Texts Are Outliers: Detecting LLM-generated Texts via Out-of-distribution Detection [71.59834293521074]
我々は,人間によるテキストと機械によるテキストを区別する枠組みを開発した。
提案手法は,DeepFakeデータセット上で98.3%のAUROCとAUPRを8.9%のFPR95で達成する。
コード、事前トレーニングされたウェイト、デモがリリースされる。
論文 参考訳(メタデータ) (2025-10-07T08:14:45Z) - PLATTER: A Page-Level Handwritten Text Recognition System for Indic Scripts [20.394597266150534]
我々はPage-Level hAndwriTTen TExt Recognition(PLATTER)のエンドツーエンドフレームワークを提案する。
第2に,言語に依存しないHTDモデルの性能測定にPLATTERを用いることを実証する。
最後に、厳密にキュレートされたページレベルのインデックス手書きOCRデータセットである、手書きのIndic Scripts (CHIPS) のコーパスをリリースする。
論文 参考訳(メタデータ) (2025-02-10T05:50:26Z) - Contrastive Masked Autoencoders for Character-Level Open-Set Writer Identification [25.996617568144675]
本稿では,文字レベルのオープンセット文字識別のためのCMAE(Contrastive Masked Auto-Encoders)を提案する。
我々は,Masked Auto-Encoders (MAE) とContrastive Learning (CL) を同時に組み合わせて,逐次情報を収集し,多様な手書きスタイルを区別する。
我々のモデルはCASIAオンライン手書きデータセットの最先端の結果を達成し、89.7%の精度で到達した。
論文 参考訳(メタデータ) (2025-01-21T05:15:10Z) - Online Writer Retrieval with Chinese Handwritten Phrases: A Synergistic Temporal-Frequency Representation Learning Approach [53.189911918976655]
DOLPHINは,相乗的時間周波数解析による手書き表現の向上を目的とした新しい検索モデルである。
OLIWER(OLIWER)は,1,731人から670,000以上の中国語の字句を含む大規模オンライン作家検索データセットである。
本研究は,手書き表現の質向上における点サンプリング周波数と圧力特性の重要性を強調した。
論文 参考訳(メタデータ) (2024-12-16T11:19:22Z) - A Bayesian Approach to Harnessing the Power of LLMs in Authorship Attribution [57.309390098903]
著者の属性は、文書の起源または著者を特定することを目的としている。
大きな言語モデル(LLM)とその深い推論能力と長距離テキストアソシエーションを維持する能力は、有望な代替手段を提供する。
IMDbおよびブログデータセットを用いた結果, 著者10名を対象に, 著者1名に対して, 85%の精度が得られた。
論文 参考訳(メタデータ) (2024-10-29T04:14:23Z) - Writer Retrieval and Writer Identification in Greek Papyri [4.44566870214758]
著者識別は、既知の著者の分類であり、著者検索は、画像のデータセットにおける画像の類似性によって、著者を見つけようとする。
自動書き手識別・検索手法はすでに多くの歴史的文書タイプに対して有望な結果を提供しているが,繊維構造や重度アーティファクトのため,パピリデータは非常に困難である。
そこで本研究では,パピリ文字における書き手識別の改善に,優れたバイナライゼーションが重要であることを示す。
論文 参考訳(メタデータ) (2022-12-15T08:42:25Z) - Cloning Ideology and Style using Deep Learning [0.0]
研究は、特定の著者のイデオロギーとスタイルに基づくテキスト生成と、過去に同じ著者が書いたものではないトピックに関するテキスト生成に焦点を当てている。
Bi-LSTMモデルを用いて文字レベルでの予測を行う。
事前学習モデルを用いて、著者のコーパスと矛盾する真実の文を識別し、言語モデルを傾斜させる。
論文 参考訳(メタデータ) (2022-10-25T11:37:19Z) - PART: Pre-trained Authorship Representation Transformer [52.623051272843426]
文書を書く著者は、自分のテキストに識別情報を印字する。
以前の作品では、手作りの機能や分類タスクを使って著者モデルを訓練していた。
セマンティクスの代わりにテキストの埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - Letter-level Online Writer Identification [86.13203975836556]
我々は文字レベルのオンラインライタIDという新たな問題に焦点をあてる。
主な課題は、しばしば異なるスタイルで手紙を書くことである。
我々はこの問題をオンライン書記スタイルのばらつき(Var-O-Styles)と呼ぶ。
論文 参考訳(メタデータ) (2021-12-06T07:21:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。