論文の概要: Innovative Methods for Non-Destructive Inspection of Handwritten
Documents
- arxiv url: http://arxiv.org/abs/2310.11217v2
- Date: Fri, 12 Jan 2024 19:28:15 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-18 01:10:39.692486
- Title: Innovative Methods for Non-Destructive Inspection of Handwritten
Documents
- Title(参考訳): 手書き文書の非破壊検査のための革新的方法
- Authors: Eleonora Breci (1), Luca Guarnera (1), Sebastiano Battiato (1) ((1)
University of Catania)
- Abstract要約: 本稿では,画像処理と深層学習技術を用いて,本文の本質的な尺度を抽出・解析できるフレームワークを提案する。
比較対象文書の特徴ベクトル間のユークリッド距離を定量化することにより、著者を特定することができる。
実験により,異なる執筆媒体の著者を客観的に決定できる手法が得られた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Handwritten document analysis is an area of forensic science, with the goal
of establishing authorship of documents through examination of inherent
characteristics. Law enforcement agencies use standard protocols based on
manual processing of handwritten documents. This method is time-consuming, is
often subjective in its evaluation, and is not replicable. To overcome these
limitations, in this paper we present a framework capable of extracting and
analyzing intrinsic measures of manuscript documents related to text line
heights, space between words, and character sizes using image processing and
deep learning techniques. The final feature vector for each document involved
consists of the mean and standard deviation for every type of measure
collected. By quantifying the Euclidean distance between the feature vectors of
the documents to be compared, authorship can be discerned. Our study pioneered
the comparison between traditionally handwritten documents and those produced
with digital tools (e.g., tablets). Experimental results demonstrate the
ability of our method to objectively determine authorship in different writing
media, outperforming the state of the art.
- Abstract(参考訳): 手書き文書分析は法医学の一分野であり、本質的特徴の検証を通じて文書の著者シップを確立することを目的としている。
法執行機関は手書き文書のマニュアル処理に基づく標準プロトコルを使用する。
この方法は時間がかかり、しばしばその評価に主観的であり、複製可能ではない。
この制約を克服するために,本稿では,テキスト行の高さ,単語間空間,文字サイズに関する本質的尺度を画像処理と深層学習手法を用いて抽出・分析できる枠組みを提案する。
各文書の最終的な特徴ベクトルは、収集された各種類の測度の平均偏差と標準偏差からなる。
比較対象文書の特徴ベクトル間のユークリッド距離を定量化することにより、著者シップを識別することができる。
本研究は,従来の手書き文書とデジタルツール(タブレットなど)を用いた文書との比較を開拓した。
実験により, 異なる筆記媒体において著者を客観的に決定する手法が, 芸術の状態を上回っていることを示す。
関連論文リスト
- A Novel Dataset for Non-Destructive Inspection of Handwritten Documents [0.0]
法医学的手書き検査は、原稿の著者を適切に定義または仮説化するために手書きの文書を調べることを目的としている。
2つのサブセットからなる新しい挑戦的データセットを提案する。第1は古典的なペンと紙で書かれた21の文書で、後者は後にデジタル化され、タブレットなどの一般的なデバイスで直接取得される。
提案したデータセットの予備的な結果は、第1サブセットで90%の分類精度が得られることを示している。
論文 参考訳(メタデータ) (2024-01-09T09:25:58Z) - Same or Different? Diff-Vectors for Authorship Analysis [78.83284164605473]
古典的な著作物分析において、特徴ベクトルは文書を表し、特徴の値は文書中の特徴の相対周波数(関数の増大)を表し、クラスラベルは文書の著者を表す。
筆者らの実験は共著者検証,著者検証,クローズドセットの著者帰属に取り組んでおり,DVは自然に第1の問題を解くのに向いているが,第2と第3の問題を解くための2つの新しい方法も提供している。
論文 参考訳(メタデータ) (2023-01-24T08:48:12Z) - PART: Pre-trained Authorship Representation Transformer [64.78260098263489]
文書を書く著者は、語彙、レジストリ、句読点、ミススペル、絵文字の使用など、テキスト内での識別情報をインプリントする。
以前の作品では、手作りのフィーチャや分類タスクを使用して著者モデルをトレーニングし、ドメイン外の著者に対するパフォーマンスの低下につながった。
セマンティクスの代わりにtextbfauthorship の埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - Open Set Classification of Untranscribed Handwritten Documents [56.0167902098419]
重要な写本の膨大な量のデジタルページイメージが世界中のアーカイブに保存されている。
ドキュメントのクラスや型付け'はおそらくメタデータに含まれる最も重要なタグです。
技術的問題は文書の自動分類の1つであり、それぞれが書き起こされていない手書きのテキスト画像からなる。
論文 参考訳(メタデータ) (2022-06-20T20:43:50Z) - Specialized Document Embeddings for Aspect-based Similarity of Research
Papers [4.661692753666685]
アスペクトベースの類似性は、アスペクト固有の埋め込み空間における古典的ベクトル類似性問題として扱う。
文書は単一の汎用的な埋め込みではなく、複数の専門的な埋め込みとして表現する。
当社のアプローチは、暗黙の偏見から生じる潜在的なリスクを明確化することで軽減します。
論文 参考訳(メタデータ) (2022-03-28T07:35:26Z) - Handwriting Classification for the Analysis of Art-Historical Documents [6.918282834668529]
We focus on the analysis of handwriting in scanned document from the art-historic Archive of the WPI。
視覚構造に基づいて抽出されたテキストの断片をラベル付けする手書き分類モデルを提案する。
論文 参考訳(メタデータ) (2020-11-04T13:06:46Z) - Neural Deepfake Detection with Factual Structure of Text [78.30080218908849]
テキストのディープフェイク検出のためのグラフベースモデルを提案する。
我々のアプローチは、ある文書の事実構造をエンティティグラフとして表現する。
本モデルでは,機械生成テキストと人文テキストの事実構造の違いを識別することができる。
論文 参考訳(メタデータ) (2020-10-15T02:35:31Z) - Multilevel Text Alignment with Cross-Document Attention [59.76351805607481]
既存のアライメントメソッドは、1つの事前定義されたレベルで動作します。
本稿では,文書を文書間注目要素で表現するための階層的アテンションエンコーダを予め確立した新しい学習手法を提案する。
論文 参考訳(メタデータ) (2020-10-03T02:52:28Z) - Fast(er) Reconstruction of Shredded Text Documents via Self-Supervised
Deep Asymmetric Metric Learning [62.34197797857823]
細断文書の自動復元における中心的な問題は、細断文書の相互互換性評価である。
本研究は,推定回数を線形にスケールするペアワイド互換性を測るスケーラブルな深層学習手法を提案する。
提案手法は,505個のシュレッダーを持つテストインスタンスに対して,22倍の高速化を実現した最先端技術に匹敵する精度を有する。
論文 参考訳(メタデータ) (2020-03-23T03:22:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。