論文の概要: Assessing the impact of Binarization for Writer Identification in Greek Papyrus
- arxiv url: http://arxiv.org/abs/2506.15852v1
- Date: Wed, 18 Jun 2025 20:00:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:04.840134
- Title: Assessing the impact of Binarization for Writer Identification in Greek Papyrus
- Title(参考訳): ギリシャ・パピルスにおける文字識別における二分法の影響評価
- Authors: Dominic Akt, Marco Peer, Florian Kleber,
- Abstract要約: ライター識別パイプラインにおける一般的な前処理ステップはイメージバイナライゼーションである。
背景は、しばしば一様ではなく、断片化され、可視光ファイバー構造で変色している。
従来のバイナライズ手法と最先端のディープラーニング(DL)モデルを比較し,バイナライズ品質がその後の作家識別性能に与える影響を評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper tackles the task of writer identification for Greek papyri. A common preprocessing step in writer identification pipelines is image binarization, which prevents the model from learning background features. This is challenging in historical documents, in our case Greek papyri, as background is often non-uniform, fragmented, and discolored with visible fiber structures. We compare traditional binarization methods to state-of-the-art Deep Learning (DL) models, evaluating the impact of binarization quality on subsequent writer identification performance. DL models are trained with and without a custom data augmentation technique, as well as different model selection criteria are applied. The performance of these binarization methods, is then systematically evaluated on the DIBCO 2019 dataset. The impact of binarization on writer identification is subsequently evaluated using a state-of-the-art approach for writer identification. The results of this analysis highlight the influence of data augmentation for DL methods. Furthermore, findings indicate a strong correlation between binarization effectiveness on papyri documents of DIBCO 2019 and downstream writer identification performance.
- Abstract(参考訳): 本稿では,ギリシア語パピルス文字識別の課題に取り組む。
ライター識別パイプラインにおける一般的な前処理ステップはイメージバイナライゼーションである。
背景は、しばしば一様ではなく、断片化され、可視光ファイバー構造で変色している。
従来のバイナライズ手法と最先端のディープラーニング(DL)モデルを比較し,バイナライズ品質がその後の作家識別性能に与える影響を評価する。
DLモデルはカスタムデータ拡張技術で訓練され、異なるモデル選択基準が適用される。
これらの二項化手法のパフォーマンスは、DIBCO 2019データセットで体系的に評価される。
その後,著者識別に対するバイナライゼーションの効果を,作家識別のための最先端アプローチを用いて評価した。
本分析の結果は,DL法におけるデータ拡張の影響を浮き彫りにした。
さらに,DIBCO 2019のパピルス文書におけるバイナライゼーションの有効性と,下流の作家識別性能との間には強い相関があることが示唆された。
関連論文リスト
- Contextual Document Embeddings [77.22328616983417]
本稿では,コンテキスト化された文書埋め込みのための2つの補完手法を提案する。
第一に、文書近傍を明示的にバッチ内コンテキスト損失に組み込む別のコントラスト学習目標である。
第二に、隣接する文書情報をエンコードされた表現に明示的にエンコードする新しいコンテキストアーキテクチャ。
論文 参考訳(メタデータ) (2024-10-03T14:33:34Z) - Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - A Fair Evaluation of Various Deep Learning-Based Document Image
Binarization Approaches [5.393847875065119]
文書画像のバイナリ化は、文書解析の分野における重要な前処理ステップである。
深層学習技術は、文脈に依存した特徴を学習することで、画像のバイナライズされたバージョンを生成することができる。
本研究は,同じ評価プロトコル下での異なる深層学習手法の評価に焦点をあてる。
論文 参考訳(メタデータ) (2024-01-22T10:42:51Z) - DECDM: Document Enhancement using Cycle-Consistent Diffusion Models [3.3813766129849845]
近年の拡散モデルに触発された文書レベルの画像変換手法であるDECDMを提案する。
本手法は,ソース(ノイズ入力)とターゲット(クリーン出力)モデルを独立にトレーニングすることで,ペアトレーニングの限界を克服する。
また、翻訳中の文字・グリフ保存を改善するための単純なデータ拡張戦略も導入する。
論文 参考訳(メタデータ) (2023-11-16T07:16:02Z) - Feature Mixing for Writer Retrieval and Identification on Papyri
Fragments [0.7614628596146599]
本稿では,パピルスの書き手検索と識別のためのディープラーニングに基づくアプローチを提案する。
本稿では,残骨と特徴混合ステージを組み合わせ,検索性能を向上させるニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-06-22T14:55:01Z) - Writer Retrieval and Writer Identification in Greek Papyri [4.44566870214758]
著者識別は、既知の著者の分類であり、著者検索は、画像のデータセットにおける画像の類似性によって、著者を見つけようとする。
自動書き手識別・検索手法はすでに多くの歴史的文書タイプに対して有望な結果を提供しているが,繊維構造や重度アーティファクトのため,パピリデータは非常に困難である。
そこで本研究では,パピリ文字における書き手識別の改善に,優れたバイナライゼーションが重要であることを示す。
論文 参考訳(メタデータ) (2022-12-15T08:42:25Z) - PART: Pre-trained Authorship Representation Transformer [52.623051272843426]
文書を書く著者は、自分のテキストに識別情報を印字する。
以前の作品では、手作りの機能や分類タスクを使って著者モデルを訓練していた。
セマンティクスの代わりにテキストの埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - Two-stage generative adversarial networks for document image
binarization with color noise and background removal [7.639067237772286]
本稿では,2段階のカラー文書画像強調・バイナライゼーション手法を提案する。
第1段階では、4つの色非依存の敵ネットワークを訓練し、入力画像から色前景情報を抽出する。
第2段階では、大域的・局所的な特徴を持つ2つの独立した敵対的ネットワークが、可変サイズの文書の画像バイナライズのために訓練されている。
論文 参考訳(メタデータ) (2020-10-20T07:51:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。