論文の概要: Comparison of scanned administrative document images
- arxiv url: http://arxiv.org/abs/2001.10785v1
- Date: Wed, 29 Jan 2020 12:51:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-05 21:21:07.645597
- Title: Comparison of scanned administrative document images
- Title(参考訳): 行政文書のスキャン画像の比較
- Authors: Elena Andreeva, Vladimir V. Arlazarov, Oleg Slavin, Aleksey Mishev
- Abstract要約: 文書画像比較法は,テキスト特徴点の記述子である単語の複数種類の画像比較を組み合わせて提案する。
その結果、同一文書のバージョンである2つの画像の相違点の精度と信頼性が示された。
- 参考スコア(独自算出の注目度): 0.9558392439655015
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work the methods of comparison of digitized copies of administrative
documents were considered. This problem arises, for example, when comparing two
copies of documents signed by two parties in order to find possible
modifications made by one party, in the banking sector at the conclusion of
contracts in paper form. The proposed method of document image comparison is
based on a combination of several ways of image comparison of words that are
descriptors of text feature points. Testing was conducted on public Payslip
Dataset (French). The results showed the high quality and the reliability of
finding differences in two images that are versions of the same document.
- Abstract(参考訳): 本研究では,行政文書のデジタル化複写の比較手法を検討した。
この問題は、例えば、2つの当事者が署名した文書の2つのコピーを比較して、1つの当事者による変更の可能性を見出す場合、紙幣による契約の締結時に銀行部門で発生する。
文書画像比較法は,テキスト特徴点の記述子である単語の複数の画像比較法を組み合わせて提案する。
公衆のペイスリップデータセット(フランス語)でテストが行われた。
その結果、同一文書のバージョンである2つの画像において、高い品質と信頼性が得られた。
関連論文リスト
- Contextual Document Embeddings [77.22328616983417]
本稿では,コンテキスト化された文書埋め込みのための2つの補完手法を提案する。
第一に、文書近傍を明示的にバッチ内コンテキスト損失に組み込む別のコントラスト学習目標である。
第二に、隣接する文書情報をエンコードされた表現に明示的にエンコードする新しいコンテキストアーキテクチャ。
論文 参考訳(メタデータ) (2024-10-03T14:33:34Z) - Learning Diverse Document Representations with Deep Query Interactions
for Dense Retrieval [79.37614949970013]
そこで本研究では,問合せの深い文書表現を学習する高密度検索モデルを提案する。
本モデルでは,各文書に生成した擬似クエリをエンコードして,クエリインフォームド・マルチビュー文書表現を得る。
論文 参考訳(メタデータ) (2022-08-08T16:00:55Z) - Pattern Spotting and Image Retrieval in Historical Documents using Deep
Hashing [60.67014034968582]
本稿では,歴史文書のデジタルコレクションにおける画像検索とパターンスポッティングのためのディープラーニング手法を提案する。
ディープラーニングモデルは、実数値またはバイナリコード表現を提供する2つの異なるバリエーションを考慮して、特徴抽出に使用される。
また,提案手法により検索時間を最大200倍に短縮し,関連する作業と比較してストレージコストを最大6,000倍に削減する。
論文 参考訳(メタデータ) (2022-08-04T01:39:37Z) - Two-stream Hierarchical Similarity Reasoning for Image-text Matching [66.43071159630006]
文脈情報を自動的に抽出する階層的類似性推論モジュールを提案する。
従来のアプローチでは、シングルストリームの類似性アライメントを学習することしか検討されていなかった。
イメージ・ツー・テキスト・レベルの類似性計算とテキスト・ツー・テキスト・レベルの類似性計算に画像・テキストマッチングを分解する2ストリームアーキテクチャを開発した。
論文 参考訳(メタデータ) (2022-03-10T12:56:10Z) - Image Collation: Matching illustrations in manuscripts [76.21388548732284]
図形照合の課題と,大規模な注釈付き公開データセットを導入して,ソリューションの評価を行う。
本研究は,本課題における美術類似度測定の実態を分析し,簡単な場合では成功したが,大規模な写本に苦慮していることを示す。
サイクル一貫性の対応を利用して,大幅な性能向上が期待できることを示す。
論文 参考訳(メタデータ) (2021-08-18T12:12:14Z) - A Comparison of Approaches to Document-level Machine Translation [34.2276281264886]
本稿では,文書レベルの現象評価スイートに対して選択したアプローチを体系的に比較する。
我々は,単言語文書レベルでのバック翻訳に基づく単純な手法が,より精巧な代替手段として機能することを見出した。
論文 参考訳(メタデータ) (2021-01-26T19:21:09Z) - Aspect-based Document Similarity for Research Papers [4.661692753666685]
文書分類タスクのペア化によってアスペクト情報との類似性を拡張する。
研究論文のアスペクトベースの文書類似性を評価する。
以上の結果から,SciBERTは最高の演奏システムであることがわかった。
論文 参考訳(メタデータ) (2020-10-13T13:51:21Z) - Methods for Computing Legal Document Similarity: A Comparative Study [9.007583099505954]
同様の法的文書を見つけることは、法律情報検索分野において重要かつ困難な課題である。
本稿では,文献間の類似度を測定する方法として,先行引用ネットワークの分析と,テキスト内容の類似度測定に基づく類似度の測定の2つの方法を提案する。
これまでに検討されていない2つの新しい類似性計算手法(テキストベースとネットワーク埋め込みに基づくもの)について検討する。
論文 参考訳(メタデータ) (2020-04-26T08:26:04Z) - Fast(er) Reconstruction of Shredded Text Documents via Self-Supervised
Deep Asymmetric Metric Learning [62.34197797857823]
細断文書の自動復元における中心的な問題は、細断文書の相互互換性評価である。
本研究は,推定回数を線形にスケールするペアワイド互換性を測るスケーラブルな深層学習手法を提案する。
提案手法は,505個のシュレッダーを持つテストインスタンスに対して,22倍の高速化を実現した最先端技術に匹敵する精度を有する。
論文 参考訳(メタデータ) (2020-03-23T03:22:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。