論文の概要: Cross-codex Learning for Reliable Scribe Identification in Medieval
Manuscripts
- arxiv url: http://arxiv.org/abs/2312.04296v1
- Date: Thu, 7 Dec 2023 13:40:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-08 14:55:37.680176
- Title: Cross-codex Learning for Reliable Scribe Identification in Medieval
Manuscripts
- Title(参考訳): 中世写本における信頼度評価のためのクロスコーデックス学習
- Authors: Julius Wei{\ss}mann, Markus Seidl, Anya Dietrich, Martin Haltrich
- Abstract要約: CNNベースのテキスト非依存のオフライン購読識別のためのクロスコーデックストレーニングデータの重要性を示す。
私たちは、信頼性の高いネットワークアーキテクチャを定義するために、複雑なデータに基づいて異なるニューラルネットワークをトレーニングし、時間と精度の違いを検証しました。
大規模なオープンソースデータセットであるCodex Claustroneoburgensisデータベース(CCl-DB)に結果を提示します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Historic scribe identification is a substantial task for obtaining
information about the past. Uniform script styles, such as the Carolingian
minuscule, make it a difficult task for classification to focus on meaningful
features. Therefore, we demonstrate in this paper the importance of cross-codex
training data for CNN based text-independent off-line scribe identification, to
overcome codex dependent overfitting. We report three main findings: First, we
found that preprocessing with masked grayscale images instead of RGB images
clearly increased the F1-score of the classification results. Second, we
trained different neural networks on our complex data, validating time and
accuracy differences in order to define the most reliable network architecture.
With AlexNet, the network with the best trade-off between F1-score and time, we
achieved for individual classes F1-scores of up to 0,96 on line level and up to
1.0 on page level in classification. Third, we could replicate the finding that
the CNN output can be further improved by implementing a reject option, giving
more stable results. We present the results on our large scale open source
dataset -- the Codex Claustroneoburgensis database (CCl-DB) -- containing a
significant number of writings from different scribes in several codices. We
demonstrate for the first time on a dataset with such a variety of codices that
paleographic decisions can be reproduced automatically and precisely with CNNs.
This gives manifold new and fast possibilities for paleographers to gain
insights into unlabeled material, but also to develop further hypotheses.
- Abstract(参考訳): 歴史書の識別は過去の情報を得るための重要なタスクである。
カロリング小文字のような統一的なスクリプトスタイルは、意味のある特徴に焦点を合わせるのが難しいタスクである。
そこで本論文では,cnnに基づくテキスト非依存の文節文字識別におけるクロスコーデックス学習データの重要性を実証する。
まず,RGB画像の代わりにマスク付きグレースケール画像を用いた前処理により,分類結果のF1スコアが明らかに増加した。
第2に、信頼性の高いネットワークアーキテクチャを定義するために、複雑なデータに基づいて異なるニューラルネットワークをトレーニングし、時間と精度の違いを検証する。
f1-scoreとtimeの最良のトレードオフを持つネットワークであるalexnetでは、個々のクラスf1-scoreがラインレベルでは0,96、ページレベルでは1.0になった。
第3に、リジェクションオプションを実装することで、CNN出力がさらに改善され、より安定した結果が得られます。
私たちは、大規模なオープンソースデータセットであるCodex Claustroneoburgensisデータベース(CCl-DB)に、いくつかのコーディックで異なるスクリプティングからの大量の書き込みを含む結果を提示します。
我々は,cnnを用いて,古図決定を自動的かつ正確に再現できるような,多種多様なコーディックを持つデータセット上で,初めて実証する。
これにより、古生物学者が未ラベルの材料についての洞察を得るだけでなく、さらなる仮説を発展させることが可能となる。
関連論文リスト
- Fuzzy Convolution Neural Networks for Tabular Data Classification [0.0]
畳み込みニューラルネットワーク(CNN)は、様々な領域における顕著な性能のために、多くの注目を集めている。
本稿では,表データに適したファジィ畳み込みニューラルネットワーク(FCNN)を提案する。
論文 参考訳(メタデータ) (2024-06-04T20:33:35Z) - Analyzing Vietnamese Legal Questions Using Deep Neural Networks with
Biaffine Classifiers [3.116035935327534]
我々は深層ニューラルネットワークを用いてベトナムの法的問題から重要な情報を抽出することを提案する。
自然言語で法的疑問が与えられた場合、その疑問に答えるために必要な情報を含む全てのセグメントを抽出することが目的である。
論文 参考訳(メタデータ) (2023-04-27T18:19:24Z) - A semantic hierarchical graph neural network for text classification [1.439766998338892]
本稿では,単語レベル,文レベル,文書レベルから対応する情報をそれぞれ抽出する階層型グラフニューラルネットワーク(HieGNN)を提案する。
いくつかのベンチマークデータセットの実験結果は、いくつかのベースライン手法と比較して、より良い、または類似した結果が得られる。
論文 参考訳(メタデータ) (2022-09-15T03:59:31Z) - Improving Model Training via Self-learned Label Representations [5.969349640156469]
より洗練されたラベル表現は、通常のワンホット符号化よりも分類に適していることが示される。
分類タスクの学習中にラベル表現を同時に学習する適応ラベル付き学習(LwAL)アルゴリズムを提案する。
我々のアルゴリズムは無視可能な追加パラメータを導入し、計算オーバーヘッドを最小限に抑える。
論文 参考訳(メタデータ) (2022-09-09T21:10:43Z) - Avoiding Overfitting: A Survey on Regularization Methods for
Convolutional Neural Networks [0.0]
畳み込みニューラルネットワーク(CNN)により、画像処理タスクが大幅に改善されている。
トレーニングにおける重要な要素は、ネットワークの正規化であり、構造が過度に適合することを防ぐ。
この研究は、過去数年間に開発されたいくつかの正規化手法を分析し、異なるCNNモデルの大幅な改善を示す。
論文 参考訳(メタデータ) (2022-01-10T11:54:06Z) - CvS: Classification via Segmentation For Small Datasets [52.821178654631254]
本稿では,分類ラベルをセグメントマップの予測から導出する小型データセットのコスト効率の高い分類器であるCvSを提案する。
我々は,CvSが従来の手法よりもはるかに高い分類結果が得られることを示す多種多様な問題に対して,本フレームワークの有効性を評価する。
論文 参考訳(メタデータ) (2021-10-29T18:41:15Z) - Calibrating Class Activation Maps for Long-Tailed Visual Recognition [60.77124328049557]
本稿では,CNNの長期分布からネットワーク学習を改善するための2つの効果的な修正を提案する。
まず,ネットワーク分類器の学習と予測を改善するために,CAMC (Class Activation Map) モジュールを提案する。
第2に,長期化問題における表現学習における正規化分類器の利用について検討する。
論文 参考訳(メタデータ) (2021-08-29T05:45:03Z) - HAT: Hierarchical Aggregation Transformers for Person Re-identification [87.02828084991062]
我々は,CNNとトランスフォーマーの両方の利点を,高性能な画像ベース人物Re-IDに適用する。
作業は、画像ベースのRe-IDのためのCNNとTransformerの両方の利点を初めて活用する。
論文 参考訳(メタデータ) (2021-07-13T09:34:54Z) - Fusion of CNNs and statistical indicators to improve image
classification [65.51757376525798]
畳み込みネットワークは過去10年間、コンピュータビジョンの分野を支配してきた。
この傾向を長引かせる主要な戦略は、ネットワーク規模の拡大によるものだ。
我々は、異種情報ソースを追加することは、より大きなネットワークを構築するよりもCNNにとって費用対効果が高いと仮定している。
論文 参考訳(メタデータ) (2020-12-20T23:24:31Z) - A Systematic Evaluation: Fine-Grained CNN vs. Traditional CNN
Classifiers [54.996358399108566]
本稿では,大規模分類データセット上でトップノーチ結果を示すランドマーク一般的なCNN分類器の性能について検討する。
最先端のきめ細かい分類器と比較する。
実験において, 粒度の細かい分類器がベースラインを高められるかどうかを判定するために, 6つのデータセットについて広範囲に評価する。
論文 参考訳(メタデータ) (2020-03-24T23:49:14Z) - 3D medical image segmentation with labeled and unlabeled data using
autoencoders at the example of liver segmentation in CT images [58.720142291102135]
本研究では、畳み込みニューラルネットワークによるセグメンテーションを改善するために、オートエンコーダ抽出機能の可能性を検討する。
コンボリューション・オートエンコーダを用いてラベルのないデータから特徴を抽出し,CT画像における3次元肝セグメンテーションの目標タスクを実行するために,マルチスケールの完全畳み込みCNNを用いた。
論文 参考訳(メタデータ) (2020-03-17T20:20:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。