論文の概要: Innovative Methods for Non-Destructive Inspection of Handwritten
Documents
- arxiv url: http://arxiv.org/abs/2310.11217v1
- Date: Tue, 17 Oct 2023 12:45:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-18 16:00:01.855424
- Title: Innovative Methods for Non-Destructive Inspection of Handwritten
Documents
- Title(参考訳): 手書き文書の非破壊検査のための革新的方法
- Authors: Eleonora Breci (1), Luca Guarnera (1), Sebastiano Battiato (1) ((1)
University of Catania)
- Abstract要約: 本稿では,画像処理と深層学習技術を用いて,本文の本質的な尺度を抽出・解析できるフレームワークを提案する。
また,124人による紙やデジタルデバイスに書かれた362個の手書き原稿からなる,新しい,挑戦的なデータセットも提案した。
実験により,異なる執筆媒体の著者を客観的に決定できる手法が得られた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Handwritten document analysis is an area of forensic science, with the goal
of establishing authorship of documents through examination of inherent
characteristics. Law enforcement agencies use standard protocols based on
manual processing of handwritten documents. This method is time-consuming, is
often subjective in its evaluation, and is not replicable. To overcome these
limitations, in this paper we present a framework capable of extracting and
analyzing intrinsic measures of manuscript documents related to text line
heights, space between words, and character sizes using image processing and
deep learning techniques. The final feature vector for each document involved
consists of the mean and standard deviation for every type of measure
collected. By quantifying the Euclidean distance between the feature vectors of
the documents to be compared, authorship can be discerned. We also proposed a
new and challenging dataset consisting of 362 handwritten manuscripts written
on paper and digital devices by 124 different people. Our study pioneered the
comparison between traditionally handwritten documents and those produced with
digital tools (e.g., tablets). Experimental results demonstrate the ability of
our method to objectively determine authorship in different writing media,
outperforming the state of the art.
- Abstract(参考訳): 手書き文書分析は法医学の一分野であり、本質的特徴の検証を通じて文書の著者シップを確立することを目的としている。
法執行機関は手書き文書のマニュアル処理に基づく標準プロトコルを使用する。
この方法は時間がかかり、しばしばその評価に主観的であり、複製可能ではない。
この制約を克服するために,本稿では,テキスト行の高さ,単語間空間,文字サイズに関する本質的尺度を画像処理と深層学習手法を用いて抽出・分析できる枠組みを提案する。
各文書の最終的な特徴ベクトルは、収集された各種類の測度の平均偏差と標準偏差からなる。
比較対象文書の特徴ベクトル間のユークリッド距離を定量化することにより、著者シップを識別することができる。
また,124人による紙やデジタルデバイスに書かれた362個の手書き原稿からなる,新しい,挑戦的なデータセットも提案した。
本研究は,従来の手書き文書とデジタルツール(タブレットなど)を用いた文書との比較を開拓した。
実験により, 異なる筆記媒体において著者を客観的に決定する手法が, 芸術の状態を上回っていることを示す。
関連論文リスト
- Contextual Document Embeddings [77.22328616983417]
本稿では,コンテキスト化された文書埋め込みのための2つの補完手法を提案する。
第一に、文書近傍を明示的にバッチ内コンテキスト損失に組み込む別のコントラスト学習目標である。
第二に、隣接する文書情報をエンコードされた表現に明示的にエンコードする新しいコンテキストアーキテクチャ。
論文 参考訳(メタデータ) (2024-10-03T14:33:34Z) - A Novel Dataset for Non-Destructive Inspection of Handwritten Documents [0.0]
法医学的手書き検査は、原稿の著者を適切に定義または仮説化するために手書きの文書を調べることを目的としている。
2つのサブセットからなる新しい挑戦的データセットを提案する。第1は古典的なペンと紙で書かれた21の文書で、後者は後にデジタル化され、タブレットなどの一般的なデバイスで直接取得される。
提案したデータセットの予備的な結果は、第1サブセットで90%の分類精度が得られることを示している。
論文 参考訳(メタデータ) (2024-01-09T09:25:58Z) - PART: Pre-trained Authorship Representation Transformer [64.78260098263489]
文書を書く著者は、語彙、レジストリ、句読点、ミススペル、絵文字の使用など、テキスト内での識別情報をインプリントする。
以前の作品では、手作りのフィーチャや分類タスクを使用して著者モデルをトレーニングし、ドメイン外の著者に対するパフォーマンスの低下につながった。
セマンティクスの代わりにtextbfauthorship の埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - Open Set Classification of Untranscribed Handwritten Documents [56.0167902098419]
重要な写本の膨大な量のデジタルページイメージが世界中のアーカイブに保存されている。
ドキュメントのクラスや型付け'はおそらくメタデータに含まれる最も重要なタグです。
技術的問題は文書の自動分類の1つであり、それぞれが書き起こされていない手書きのテキスト画像からなる。
論文 参考訳(メタデータ) (2022-06-20T20:43:50Z) - Specialized Document Embeddings for Aspect-based Similarity of Research
Papers [4.661692753666685]
アスペクトベースの類似性は、アスペクト固有の埋め込み空間における古典的ベクトル類似性問題として扱う。
文書は単一の汎用的な埋め込みではなく、複数の専門的な埋め込みとして表現する。
当社のアプローチは、暗黙の偏見から生じる潜在的なリスクを明確化することで軽減します。
論文 参考訳(メタデータ) (2022-03-28T07:35:26Z) - Handwriting Classification for the Analysis of Art-Historical Documents [6.918282834668529]
We focus on the analysis of handwriting in scanned document from the art-historic Archive of the WPI。
視覚構造に基づいて抽出されたテキストの断片をラベル付けする手書き分類モデルを提案する。
論文 参考訳(メタデータ) (2020-11-04T13:06:46Z) - Neural Deepfake Detection with Factual Structure of Text [78.30080218908849]
テキストのディープフェイク検出のためのグラフベースモデルを提案する。
我々のアプローチは、ある文書の事実構造をエンティティグラフとして表現する。
本モデルでは,機械生成テキストと人文テキストの事実構造の違いを識別することができる。
論文 参考訳(メタデータ) (2020-10-15T02:35:31Z) - Multilevel Text Alignment with Cross-Document Attention [59.76351805607481]
既存のアライメントメソッドは、1つの事前定義されたレベルで動作します。
本稿では,文書を文書間注目要素で表現するための階層的アテンションエンコーダを予め確立した新しい学習手法を提案する。
論文 参考訳(メタデータ) (2020-10-03T02:52:28Z) - Fast(er) Reconstruction of Shredded Text Documents via Self-Supervised
Deep Asymmetric Metric Learning [62.34197797857823]
細断文書の自動復元における中心的な問題は、細断文書の相互互換性評価である。
本研究は,推定回数を線形にスケールするペアワイド互換性を測るスケーラブルな深層学習手法を提案する。
提案手法は,505個のシュレッダーを持つテストインスタンスに対して,22倍の高速化を実現した最先端技術に匹敵する精度を有する。
論文 参考訳(メタデータ) (2020-03-23T03:22:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。