論文の概要: Handwriting Extraction and Analysis of Signature Lists in Swiss Popular Initiatives
- arxiv url: http://arxiv.org/abs/2606.05018v1
- Date: Wed, 03 Jun 2026 15:41:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.86597
- Title: Handwriting Extraction and Analysis of Signature Lists in Swiss Popular Initiatives
- Title(参考訳): スイスのポピュラーイニシアチブにおける手書き文字の抽出と署名リストの分析
- Authors: Marco Peer, Thomas Gorges, Mathias Seuret, Vincent Christlein, Andreas Fischer,
- Abstract要約: オフザシェルフのOCRシステムは手書き署名データの転写に十分な信頼性を持っていない。
ライター検索手法は、シグネチャリスト間で視覚的に類似したエントリを効果的に識別することができる。
- 参考スコア(独自算出の注目度): 3.1565960088761784
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Popular initiatives and referendums are central to Swiss democracy, yet the validation of handwritten signature lists remains a labor-intensive manual process. This paper investigates the potential of automated document analysis methods, including OCR and AI-based handwriting analysis, to support this task. We propose a pipeline combining template-based line segmentation with text recognition and writer retrieval techniques, evaluated on a dataset of 443 handwritten entries from 418 writers. Results show that OCR struggles with out-of-vocabulary handwriting, with a CER of 29.6% for first names. In contrast, writer retrieval performs more robustly, reaching an mAP of 50.6%. Furthermore, our experiments indicate that off-the-shelf OCR systems are not sufficiently reliable for transcription of handwritten signature data, particularly for short, out-of-vocabulary entries such as names or addresses. However, writer retrieval methods can effectively identify visually similar entries across signature lists, making them a suitable tool for supporting the detection of potential duplicate submissions based on handwriting similarity.
- Abstract(参考訳): 人気のあるイニシアティブや国民投票はスイス民主主義の中心であるが、手書き署名リストの検証は労働集約的な手作業のままである。
本稿では,OCRやAIを用いた手書き文字解析などの自動文書解析手法が,このタスクを支援する可能性について検討する。
そこで本研究では,テキスト認識と文字検索を併用したテンプレートベースラインセグメンテーションと,418人の書き手による443項目のデータセットを用いて評価するパイプラインを提案する。
その結果、OCRは語彙外手書きに苦戦しており、CERは初名に対して29.6%であることがわかった。
対照的に、ライター検索はより堅牢で、mAPは50.6%に達する。
さらに,本実験では,手書き署名データの書き起こし,特に名前や住所などの語彙外入力に対して,オフザシェルフOCRシステムは十分に信頼性が低いことが示唆された。
しかし,書き手検索手法は,手書き類似性に基づいた潜在的重複投稿の検出を支援するのに適したツールとして,署名リスト間の視覚的に類似したエントリを効果的に識別することができる。
関連論文リスト
- Privacy-Preserving Biometric Verification with Handwritten Random Digit String [49.77172854374479]
手書き認証は、何十年もの間、安定したアイデンティティ認証方法として存在してきた。
しかし、この技術は、署名などの手書きバイオメトリックスに個人情報が組み込まれているため、潜在的なプライバシー侵害のリスクがある。
プライバシ保護による手書き文字の検証にRandom Digit String (RDS) を用いることを提案する。
論文 参考訳(メタデータ) (2025-03-17T03:47:25Z) - Online Writer Retrieval with Chinese Handwritten Phrases: A Synergistic Temporal-Frequency Representation Learning Approach [53.189911918976655]
DOLPHINは,相乗的時間周波数解析による手書き表現の向上を目的とした新しい検索モデルである。
OLIWER(OLIWER)は,1,731人から670,000以上の中国語の字句を含む大規模オンライン作家検索データセットである。
本研究は,手書き表現の質向上における点サンプリング周波数と圧力特性の重要性を強調した。
論文 参考訳(メタデータ) (2024-12-16T11:19:22Z) - A Novel Dataset for Non-Destructive Inspection of Handwritten Documents [0.0]
法医学的手書き検査は、原稿の著者を適切に定義または仮説化するために手書きの文書を調べることを目的としている。
2つのサブセットからなる新しい挑戦的データセットを提案する。第1は古典的なペンと紙で書かれた21の文書で、後者は後にデジタル化され、タブレットなどの一般的なデバイスで直接取得される。
提案したデータセットの予備的な結果は、第1サブセットで90%の分類精度が得られることを示している。
論文 参考訳(メタデータ) (2024-01-09T09:25:58Z) - Summarization-Based Document IDs for Generative Retrieval with Language Models [65.11811787587403]
要約に基づく文書IDを導入し、各文書のIDは抽出的要約または抽象的キーフレーズから構成される。
以上の結果から,ACIDの使用はトップ10とトップ20のリコールをそれぞれ15.6%,14.4%(相対)改善することがわかった。
また, 抽出IDは, MSMARCOのスニペットではなく, ウィキペディア記事の抽象IDよりも優れていた。
論文 参考訳(メタデータ) (2023-11-14T23:28:36Z) - Innovative Methods for Non-Destructive Inspection of Handwritten
Documents [0.0]
本稿では,画像処理と深層学習技術を用いて,本文の本質的な尺度を抽出・解析できるフレームワークを提案する。
比較対象文書の特徴ベクトル間のユークリッド距離を定量化することにより、著者を特定することができる。
実験により,異なる執筆媒体の著者を客観的に決定できる手法が得られた。
論文 参考訳(メタデータ) (2023-10-17T12:45:04Z) - PART: Pre-trained Authorship Representation Transformer [52.623051272843426]
文書を書く著者は、自分のテキストに識別情報を印字する。
以前の作品では、手作りの機能や分類タスクを使って著者モデルを訓練していた。
セマンティクスの代わりにテキストの埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - Open Set Classification of Untranscribed Handwritten Documents [56.0167902098419]
重要な写本の膨大な量のデジタルページイメージが世界中のアーカイブに保存されている。
ドキュメントのクラスや型付け'はおそらくメタデータに含まれる最も重要なタグです。
技術的問題は文書の自動分類の1つであり、それぞれが書き起こされていない手書きのテキスト画像からなる。
論文 参考訳(メタデータ) (2022-06-20T20:43:50Z) - Letter-level Online Writer Identification [86.13203975836556]
我々は文字レベルのオンラインライタIDという新たな問題に焦点をあてる。
主な課題は、しばしば異なるスタイルで手紙を書くことである。
我々はこの問題をオンライン書記スタイルのばらつき(Var-O-Styles)と呼ぶ。
論文 参考訳(メタデータ) (2021-12-06T07:21:53Z) - Object Detection Based Handwriting Localization [2.6641834518599308]
文書から手書き領域をローカライズするオブジェクト検出手法を提案する。
提案手法は手書き文字認識や署名検証などの他の作業を容易にすることも期待されている。
論文 参考訳(メタデータ) (2021-06-28T21:25:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。