論文の概要: Importance of Textlines in Historical Document Classification
- arxiv url: http://arxiv.org/abs/2201.09575v1
- Date: Mon, 24 Jan 2022 10:37:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-25 16:20:02.063440
- Title: Importance of Textlines in Historical Document Classification
- Title(参考訳): 歴史的文書分類におけるテキストの重要性
- Authors: Martin Ki\v{s}\v{s}, Jan Koh\'ut, Karel Bene\v{s}, Michal Hradi\v{s}
- Abstract要約: 本稿では, ブルノ工科大学 ICDAR 2021 歴史文書分類コンペティションシステムについて述べる。
解決されたタスクには、スクリプトとフォントの分類、文書の発端のローカライゼーション、日付付けが含まれる。
我々は,既存のページレイアウト解析エンジンを利用して,パッチレベルとラインレベルのアプローチを組み合わせた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper describes a system prepared at Brno University of Technology for
ICDAR 2021 Competition on Historical Document Classification, experiments
leading to its design, and the main findings. The solved tasks include script
and font classification, document origin localization, and dating. We combined
patch-level and line-level approaches, where the line-level system utilizes an
existing, publicly available page layout analysis engine. In both systems,
neural networks provide local predictions which are combined into page-level
decisions, and the results of both systems are fused using linear or log-linear
interpolation. We propose loss functions suitable for weakly supervised
classification problem where multiple possible labels are provided, and we
propose loss functions suitable for interval regression in the dating task. The
line-level system significantly improves results in script and font
classification and in the dating task. The full system achieved 98.48 %, 88.84
%, and 79.69 % accuracy in the font, script, and location classification tasks
respectively. In the dating task, our system achieved a mean absolute error of
21.91 years.
- Abstract(参考訳): 本稿では,brno技術大学(icdar 2021)の歴史的文書分類に関するコンペティション,その設計につながる実験,および主な知見について述べる。
解決されたタスクには、スクリプトとフォントの分類、ドキュメントの起源のローカライズ、デートが含まれる。
我々は,既存のページレイアウト解析エンジンを利用して,パッチレベルとラインレベルのアプローチを組み合わせた。
どちらのシステムでも、ニューラルネットワークはページレベルの決定に結合した局所的な予測を提供し、両システムの結果は線形あるいは対数線形補間を用いて融合される。
本稿では,複数のラベルを付与する弱教師付き分類問題に適した損失関数を提案し,デートタスクにおける間隔回帰に適した損失関数を提案する。
行レベルのシステムは、スクリプトとフォントの分類とデートタスクの結果を大幅に改善する。
全システムはそれぞれ98.48 %、88.84 %、79.69 %の精度を達成した。
デート作業では, 平均絶対誤差は21.91年であった。
関連論文リスト
- GatedLexiconNet: A Comprehensive End-to-End Handwritten Paragraph Text Recognition System [3.9527064697847005]
内部線分割と畳み込み層に基づくエンコーダを組み込んだエンドツーエンドの段落認識システムを提案する。
本研究は、IAMでは2.27%、RIMESでは0.9%、READ-16では2.13%、READ-2016データセットでは5.73%の文字誤り率を報告した。
論文 参考訳(メタデータ) (2024-04-22T10:19:16Z) - Towards More Robust NLP System Evaluation: Handling Missing Scores in
Benchmarks [9.404931130084803]
本稿は,NLP研究における既存の問題として,タスク中にシステムスコアが欠落している場合のベンチマークを定式化する。
既存のベンチマークよりも桁違いに大きい1億3100万以上のスコアを含む拡張ベンチマークを導入する。
論文 参考訳(メタデータ) (2023-05-17T15:20:31Z) - Tuning Traditional Language Processing Approaches for Pashto Text
Classification [0.0]
本研究の目的は,Pashto自動テキスト分類システムの構築である。
本研究は、統計的およびニューラルネットワーク機械学習技術の両方を含む複数のモデルを比較する。
本研究では,分類アルゴリズムとTFIDF特徴抽出法を用いて,平均試験精度94%を得た。
論文 参考訳(メタデータ) (2023-05-04T22:57:45Z) - Like a Good Nearest Neighbor: Practical Content Moderation and Text
Classification [66.02091763340094]
LaGoNN(Good Nearest Neighbor)は、学習可能なパラメータを導入することなく、隣人の情報で入力テキストを変更するSetFitの変更である。
LaGoNNは望ましくないコンテンツやテキスト分類のフラグ付けに有効であり、SetFitのパフォーマンスを改善する。
論文 参考訳(メタデータ) (2023-02-17T15:43:29Z) - Hybrid Rule-Neural Coreference Resolution System based on Actor-Critic
Learning [53.73316523766183]
コアレゾリューションシステムは2つの主要なタスクに取り組む必要がある。
ひとつのタスクは、潜在的な言及のすべてを検出することであり、もう1つは、可能な言及ごとに前者のリンクを学習することである。
本稿では,アクター・クリティカル・ラーニングに基づく複合ルール・ニューラル・コア参照解決システムを提案する。
論文 参考訳(メタデータ) (2022-12-20T08:55:47Z) - Large-Scale Sequential Learning for Recommender and Engineering Systems [91.3755431537592]
本稿では,現在の状況に適応してパーソナライズされたランキングを提供する自動アルゴリズムの設計に焦点を当てる。
前者はSAROSと呼ばれる新しいアルゴリズムを提案し,インタラクションの順序を学習するためのフィードバックの種類を考慮に入れている。
提案手法は, 電力網の故障検出に対する初期アプローチと比較して, 統計的に有意な結果を示す。
論文 参考訳(メタデータ) (2022-05-13T21:09:41Z) - Re-Examining System-Level Correlations of Automatic Summarization
Evaluation Metrics [64.81682222169113]
システムレベルの相関により, 要約品質の人的判断を再現する自動要約評価指標を確実に定量化する。
システムレベルの相関の定義が、実際にシステムを評価するためにメトリクスがどのように使われているかと矛盾する2つの方法を特定する。
論文 参考訳(メタデータ) (2022-04-21T15:52:14Z) - An Attention Ensemble Approach for Efficient Text Classification of
Indian Languages [0.0]
本稿では,インド・デヴァナガリ文字を母語とするマラーティー語における短文文書の細かな技術領域識別について述べる。
畳み込みニューラルネットワークが生成する中間文表現と双方向の長期記憶とを合体させ,効率的なテキスト分類を実現するcnn-bilstm注意アンサンブルモデルを提案する。
実験結果から,提案モデルが与えられたタスクにおける各種ベースライン機械学習および深層学習モデルより優れ,89.57%,f1スコア0.8875の検証精度が得られた。
論文 参考訳(メタデータ) (2021-02-20T07:31:38Z) - Rank over Class: The Untapped Potential of Ranking in Natural Language
Processing [8.637110868126546]
我々は、現在分類を用いて対処されている多くのタスクが、実際には分類モールドに切り替わっていると論じる。
本稿では,一対のテキストシーケンスの表現を生成するトランスフォーマーネットワークからなる新しいエンドツーエンドランキング手法を提案する。
重く歪んだ感情分析データセットの実験では、ランキング結果を分類ラベルに変換すると、最先端のテキスト分類よりも約22%改善する。
論文 参考訳(メタデータ) (2020-09-10T22:18:57Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z) - Generalized Focal Loss: Learning Qualified and Distributed Bounding
Boxes for Dense Object Detection [85.53263670166304]
一段検出器は基本的に、物体検出を密度の高い分類と位置化として定式化する。
1段検出器の最近の傾向は、局所化の質を推定するために個別の予測分岐を導入することである。
本稿では, 上記の3つの基本要素, 品質推定, 分類, ローカライゼーションについて述べる。
論文 参考訳(メタデータ) (2020-06-08T07:24:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。