Fugu-MT 論文翻訳(概要): Digital Peter: Dataset, Competition and Handwriting Recognition Methods

論文の概要: Digital Peter: Dataset, Competition and Handwriting Recognition Methods

arxiv url: http://arxiv.org/abs/2103.09354v1
Date: Tue, 16 Mar 2021 22:37:22 GMT
ステータス: 翻訳完了
システム内更新日: 2021-03-18 23:06:23.358071
Title: Digital Peter: Dataset, Competition and Handwriting Recognition Methods
Title（参考訳）: Digital Peter: データセット,コンペティション,手書き認識方法
Authors: Mark Potanin, Denis Dimitrov, Alex Shonenkov, Vladimir Bataev, Denis Karachev and Maxim Novopoltsev
Abstract要約: 本稿では,ピーター・ザ・グレートの原稿の新しいデータセットについて述べる。 994の画像と歴史的文書の行に対応するテキストファイルで構成されています。
参考スコア（独自算出の注目度）: 0.685068326729525
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper presents a new dataset of Peter the Great's manuscripts and describes a segmentation procedure that converts initial images of documents into the lines. The new dataset may be useful for researchers to train handwriting text recognition models as a benchmark for comparing different models. It consists of 9 694 images and text files corresponding to lines in historical documents. The open machine learning competition Digital Peter was held based on the considered dataset. The baseline solution for this competition as well as more advanced methods on handwritten text recognition are described in the article. Full dataset and all code are publicly available.
Abstract（参考訳）: 本稿では,peter the great's manuscriptsの新しいデータセットを提示し,文書の初期画像を行に変換するセグメンテーション手順について述べる。新しいデータセットは、異なるモデルを比較するベンチマークとして手書き文字認識モデルを訓練する研究者にとって有用かもしれない。歴史文書の行に対応する9つの694の画像とテキストファイルで構成されている。オープン機械学習コンペティションDigital Peterは、検討されたデータセットに基づいて開催された。このコンペのベースライン・ソリューションや、手書きのテキスト認識に関するより高度な方法がこの記事に記載されている。完全なデータセットとすべてのコードが公開されている。

関連論文リスト

Application of deep learning approaches for medieval historical documents transcription [0.0]
本稿では,9世紀から11世紀の手書きラテン文字文書からテキスト情報を抽出する深層学習手法を提案する。このアプローチは中世の文書に固有の性質を考慮に入れている。実装はGitHubリポジトリで公開されている。
論文参考訳（メタデータ） (2025-12-21T19:43:30Z)
MSTAR: Box-free Multi-query Scene Text Retrieval with Attention Recycling [58.251621637466904]
Muti-query Scene Text Search with Attention recycling (MSTAR) は、シーンテキスト検索のためのボックスフリーアプローチである。プログレッシブ・ビジョンの埋め込みを取り入れ、テキストのマルチグラデーション表現を動的にキャプチャする。 7つの公開データセットとMQTRデータセットにまたがって,我々の手法の優位性を実証した。
論文参考訳（メタデータ） (2025-06-12T11:54:13Z)
Detecting Document-level Paraphrased Machine Generated Content: Mimicking Human Writing Style and Involving Discourse Features [57.34477506004105]
機械生成コンテンツは、学術プラジャリズムや誤報の拡散といった課題を提起する。これらの課題を克服するために、新しい方法論とデータセットを導入します。人間の筆記スタイルをエミュレートするエンコーダデコーダモデルであるMhBARTを提案する。また,PDTB前処理による談話解析を統合し,構造的特徴を符号化するモデルであるDTransformerを提案する。
論文参考訳（メタデータ） (2024-12-17T08:47:41Z)
Contextual Document Embeddings [77.22328616983417]
本稿では,コンテキスト化された文書埋め込みのための2つの補完手法を提案する。第一に、文書近傍を明示的にバッチ内コンテキスト損失に組み込む別のコントラスト学習目標である。第二に、隣接する文書情報をエンコードされた表現に明示的にエンコードする新しいコンテキストアーキテクチャ。
論文参考訳（メタデータ） (2024-10-03T14:33:34Z)
Muharaf: Manuscripts of Handwritten Arabic Dataset for Cursive Text Recognition [5.28595286827031]
Manuscripts of Hand written Arabic(Muharaf)データセットは、1,600以上の歴史的な手書きページイメージからなる機械学習データセットである。このデータセットは、手書きのテキスト認識において、最先端の技術を前進させるためにコンパイルされた。
論文参考訳（メタデータ） (2024-06-13T23:40:34Z)
A Novel Dataset for Non-Destructive Inspection of Handwritten Documents [0.0]
法医学的手書き検査は、原稿の著者を適切に定義または仮説化するために手書きの文書を調べることを目的としている。 2つのサブセットからなる新しい挑戦的データセットを提案する。第1は古典的なペンと紙で書かれた21の文書で、後者は後にデジタル化され、タブレットなどの一般的なデバイスで直接取得される。提案したデータセットの予備的な結果は、第1サブセットで90%の分類精度が得られることを示している。
論文参考訳（メタデータ） (2024-01-09T09:25:58Z)
Prompt me a Dataset: An investigation of text-image prompting for historical image dataset creation using foundation models [0.9065034043031668]
基礎モデルを用いた歴史資料からの画像抽出のためのパイプラインを提案する。我々は,テキスト画像のプロンプトと,それらが複雑度の異なる人文科学データセットに与える影響を評価する。
論文参考訳（メタデータ） (2023-09-04T15:37:03Z)
Handwritten and Printed Text Segmentation: A Signature Case Study [0.0]
我々は手書きテキストセグメンテーションの課題に対処するための新しいアプローチを開発する。我々の目的は、クラス全体からテキストを復元することであり、特に重なり合う部分のセグメンテーション性能を向上させることである。私たちの最高の設定は、以前の2つの異なるデータセットで17.9%、IoUスコアで7.3%のパフォーマンスを上回っています。
論文参考訳（メタデータ） (2023-07-15T21:49:22Z)
PART: Pre-trained Authorship Representation Transformer [64.78260098263489]
文書を書く著者は、語彙、レジストリ、句読点、ミススペル、絵文字の使用など、テキスト内での識別情報をインプリントする。以前の作品では、手作りのフィーチャや分類タスクを使用して著者モデルをトレーニングし、ドメイン外の著者に対するパフォーマンスの低下につながった。セマンティクスの代わりにtextbfauthorship の埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文参考訳（メタデータ） (2022-09-30T11:08:39Z)
Pattern Spotting and Image Retrieval in Historical Documents using Deep Hashing [60.67014034968582]
本稿では,歴史文書のデジタルコレクションにおける画像検索とパターンスポッティングのためのディープラーニング手法を提案する。ディープラーニングモデルは、実数値またはバイナリコード表現を提供する2つの異なるバリエーションを考慮して、特徴抽出に使用される。また,提案手法により検索時間を最大200倍に短縮し,関連する作業と比較してストレージコストを最大6,000倍に削減する。
論文参考訳（メタデータ） (2022-08-04T01:39:37Z)
Open Set Classification of Untranscribed Handwritten Documents [56.0167902098419]
重要な写本の膨大な量のデジタルページイメージが世界中のアーカイブに保存されている。ドキュメントのクラスや型付け'はおそらくメタデータに含まれる最も重要なタグです。技術的問題は文書の自動分類の1つであり、それぞれが書き起こされていない手書きのテキスト画像からなる。
論文参考訳（メタデータ） (2022-06-20T20:43:50Z)
Digital Editions as Distant Supervision for Layout Analysis of Printed Books [76.29918490722902]
本稿では,この意味的マークアップを,レイアウト解析モデルのトレーニングと評価のための遠隔監視として利用する手法について述べる。 DTA(Deutsches Textarchiv)の50万ページにわたるモデルアーキテクチャの実験では、これらの領域レベルの評価手法と画素レベルのメトリクスとワードレベルのメトリクスとの高い相関性を見出した。自己学習による精度向上の可能性と、DTAで訓練されたモデルが他の歴史書に一般化できる可能性について論じる。
論文参考訳（メタデータ） (2021-12-23T16:51:53Z)
Handwriting Classification for the Analysis of Art-Historical Documents [6.918282834668529]
We focus on the analysis of handwriting in scanned document from the art-historic Archive of the WPI。視覚構造に基づいて抽出されたテキストの断片をラベル付けする手書き分類モデルを提案する。
論文参考訳（メタデータ） (2020-11-04T13:06:46Z)
Learning to Select Bi-Aspect Information for Document-Scale Text Content Manipulation [50.01708049531156]
我々は、テキストスタイルの転送とは逆の文書スケールのテキストコンテンツ操作という、新しい実践的なタスクに焦点を当てる。詳細は、入力は構造化されたレコードと、別のレコードセットを記述するための参照テキストのセットである。出力は、ソースレコードセットの部分的内容と参照の書き込みスタイルを正確に記述した要約である。
論文参考訳（メタデータ） (2020-02-24T12:52:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。