論文の概要: Self-supervised Deep Reconstruction of Mixed Strip-shredded Text
Documents
- arxiv url: http://arxiv.org/abs/2007.00779v1
- Date: Wed, 1 Jul 2020 21:48:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 23:19:54.651160
- Title: Self-supervised Deep Reconstruction of Mixed Strip-shredded Text
Documents
- Title(参考訳): 複合テキスト文書の自己教師あり深層再構築
- Authors: Thiago M. Paix\~ao, Rodrigo F. Berriel, Maria C. S. Boeres, Alessandro
L. Koerich, Claudine Badue, Alberto F. de Souza, Thiago Oliveira-Santos
- Abstract要約: 本研究は,従来の1ページ再構成の深層学習手法を,より現実的で複雑なシナリオに拡張する。
本手法では, 整合性評価を2クラス(無効または無効)パターン認識問題としてモデル化する。
提案手法は複雑なシナリオにおいて競合する手法よりも優れ、90%以上の精度で精度が向上する。
- 参考スコア(独自算出の注目度): 63.41717168981103
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The reconstruction of shredded documents consists of coherently arranging
fragments of paper (shreds) to recover the original document(s). A great
challenge in computational reconstruction is to properly evaluate the
compatibility between the shreds. While traditional pixel-based approaches are
not robust to real shredding, more sophisticated solutions compromise
significantly time performance. The solution presented in this work extends our
previous deep learning method for single-page reconstruction to a more
realistic/complex scenario: the reconstruction of several mixed shredded
documents at once. In our approach, the compatibility evaluation is modeled as
a two-class (valid or invalid) pattern recognition problem. The model is
trained in a self-supervised manner on samples extracted from
simulated-shredded documents, which obviates manual annotation. Experimental
results on three datasets -- including a new collection of 100 strip-shredded
documents produced for this work -- have shown that the proposed method
outperforms the competing ones on complex scenarios, achieving accuracy
superior to 90%.
- Abstract(参考訳): シュレッダード文書の復元は、元の文書を復元するために紙(シュレッダー)の断片をコヒーレントに並べて構成する。
計算再構成における大きな課題は、シャード間の互換性を適切に評価することである。
従来のピクセルベースのアプローチは実際の縮小には耐えられないが、より洗練されたソリューションは時間パフォーマンスを損なう。
本研究で提示した解法は,従来より現実的かつ複雑なシナリオである複数のシュレッダード文書を一度に再構築する深層学習法を拡張したものである。
本手法では,適合性評価を2クラス(無効または無効)パターン認識問題としてモデル化する。
モデルは、手動アノテーションを省略するシミュレートされた文書から抽出されたサンプルに対して、自己教師ありで訓練される。
この研究のために作成された100のストリップシェードドキュメントを含む3つのデータセットの実験結果は、提案手法が複雑なシナリオで競合する文書よりも優れており、90%以上の精度を達成していることを示している。
関連論文リスト
- DocMAE: Document Image Rectification via Self-supervised Representation
Learning [144.44748607192147]
文書画像修正のための新しい自己教師型フレームワークDocMAEを提案する。
まず、背景を除いた文書画像のランダムなパッチをマスクし、欠落したピクセルを再構成する。
このような自己教師型学習手法により、ネットワークは変形文書の本質的な構造を学習することが奨励される。
論文 参考訳(メタデータ) (2023-04-20T14:27:15Z) - Geometric Rectification of Creased Document Images based on Isometric
Mapping [0.0]
歪んだ文書の画像の幾何学的補正は、文書のデジタル化と光学文字認識(OCR)における幅広い応用を見出す
本稿では,3次元文書モデルと平面における平滑化を表現するために,計算等尺写像モデルを用いた文書画像補正の一般的な枠組みを提案する。
提案手法の有効性と性能を実証し,本手法との比較を行った。
論文 参考訳(メタデータ) (2022-12-16T09:33:31Z) - HandFlow: Quantifying View-Dependent 3D Ambiguity in Two-Hand
Reconstruction with Normalizing Flow [73.7895717883622]
条件付き正規化フローフレームワークにおける可塑性再構成の分布を明示的にモデル化する。
この課題に対して,明示的な曖昧さモデリングが適していることを示す。
論文 参考訳(メタデータ) (2022-10-04T15:42:22Z) - CODER: An efficient framework for improving retrieval through
COntextualized Document Embedding Reranking [11.635294568328625]
本稿では,最小計算コストで広範囲の検索モデルの性能を向上させるためのフレームワークを提案する。
ベース密度検索法により抽出された事前計算された文書表現を利用する。
実行時に第一段階のメソッドの上に無視可能な計算オーバーヘッドを発生させ、最先端の高密度検索手法と簡単に組み合わせられるようにする。
論文 参考訳(メタデータ) (2021-12-16T10:25:26Z) - Multi-Fact Correction in Abstractive Text Summarization [98.27031108197944]
Span-Factは、質問応答モデルから学んだ知識を活用して、スパン選択によるシステム生成サマリーの補正を行う2つの事実補正モデルのスイートである。
我々のモデルは、ソースコードのセマンティック一貫性を確保するために、反復的または自動回帰的にエンティティを置き換えるために、シングルまたはマルチマスキング戦略を採用している。
実験の結果,自動測定と人的評価の両面において,要約品質を犠牲にすることなく,システム生成要約の事実整合性を大幅に向上させることができた。
論文 参考訳(メタデータ) (2020-10-06T02:51:02Z) - A Divide-and-Conquer Approach to the Summarization of Long Documents [4.863209463405628]
本稿では,長い文書のニューラル・サマライゼーションのための分割・畳み込み手法を提案する。
本手法は文書の談話構造を利用して,文の類似性を利用して問題をより小さな要約問題に分割する。
本稿では,シーケンス・ツー・シーケンスのRNNやトランスフォーマーなど,様々な要約モデルと組み合わせることで,要約性能の向上が期待できることを示す。
論文 参考訳(メタデータ) (2020-04-13T20:38:49Z) - Pre-training for Abstractive Document Summarization by Reinstating
Source Text [105.77348528847337]
本稿では,Seq2Seqに基づく非ラベルテキストによる抽象要約モデルの事前学習を可能にする3つの事前学習目標を提案する。
2つのベンチマーク要約データセットの実験では、3つの目的がすべてベースラインでパフォーマンスを向上させることが示されている。
論文 参考訳(メタデータ) (2020-04-04T05:06:26Z) - Fast(er) Reconstruction of Shredded Text Documents via Self-Supervised
Deep Asymmetric Metric Learning [62.34197797857823]
細断文書の自動復元における中心的な問題は、細断文書の相互互換性評価である。
本研究は,推定回数を線形にスケールするペアワイド互換性を測るスケーラブルな深層学習手法を提案する。
提案手法は,505個のシュレッダーを持つテストインスタンスに対して,22倍の高速化を実現した最先端技術に匹敵する精度を有する。
論文 参考訳(メタデータ) (2020-03-23T03:22:06Z) - Text Extraction and Restoration of Old Handwritten Documents [3.514869837986596]
本稿では,ニューラルネットワークを用いた古くなった手書き文書の復元手法について述べる。
26の遺産画像の小規模データセットを導入する。
実験により,本システムによる手書き文書画像の高精度な劣化が確認できた。
論文 参考訳(メタデータ) (2020-01-23T05:42:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。