論文の概要: A Generic Image Retrieval Method for Date Estimation of Historical
Document Collections
- arxiv url: http://arxiv.org/abs/2204.04028v1
- Date: Fri, 8 Apr 2022 12:30:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-11 15:28:23.683067
- Title: A Generic Image Retrieval Method for Date Estimation of Historical
Document Collections
- Title(参考訳): 歴史的文書コレクションの日付推定のための汎用画像検索法
- Authors: Adri\`a Molina and Lluis Gomez and Oriol Ramos Terrades and Josep
Llad\'os
- Abstract要約: 本稿では,異種コレクションの前方でよく一般化する検索手法に基づく頑健な日付推定システムを提案する。
我々は、スムーズなnDCGというランキング損失関数を用いて、各問題の文書の順序を学習する畳み込みニューラルネットワークを訓練する。
- 参考スコア(独自算出の注目度): 0.4588028371034407
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Date estimation of historical document images is a challenging problem, with
several contributions in the literature that lack of the ability to generalize
from one dataset to others. This paper presents a robust date estimation system
based in a retrieval approach that generalizes well in front of heterogeneous
collections. we use a ranking loss function named smooth-nDCG to train a
Convolutional Neural Network that learns an ordination of documents for each
problem. One of the main usages of the presented approach is as a tool for
historical contextual retrieval. It means that scholars could perform
comparative analysis of historical images from big datasets in terms of the
period where they were produced. We provide experimental evaluation on
different types of documents from real datasets of manuscript and newspaper
images.
- Abstract(参考訳): 歴史的文書画像の日付推定は困難な問題であり、あるデータセットから他のデータセットへ一般化する能力に欠ける文献にいくつかの貢献がある。
本稿では,異種コレクションの前方でよく一般化する検索手法に基づく頑健な日付推定システムを提案する。
smooth-ndcg というランキング損失関数を用いて畳み込みニューラルネットワークを訓練し,問題毎に文書の順序を学習する。
提案手法の主な使用例の1つは、歴史的な文脈検索のためのツールである。
これは、大データセットから得られた歴史画像の比較分析を、制作時期の観点から行うことができることを意味している。
原稿や新聞画像の実際のデータセットから異なる種類の文書を実験的に評価する。
関連論文リスト
- Fetch-A-Set: A Large-Scale OCR-Free Benchmark for Historical Document Retrieval [2.7471068141502]
このベンチマークには、紀元前2世紀にさかのぼる膨大な文書が収められている。
文化遺産の領域における複雑な抽出作業に焦点をあてることで、文学における重要なギャップを埋める。
論文 参考訳(メタデータ) (2024-06-11T14:45:00Z) - PHD: Pixel-Based Language Modeling of Historical Documents [55.75201940642297]
実史文書に類似した合成スキャンを生成する新しい手法を提案する。
我々は,1700-1900年代における合成スキャンと実際の歴史新聞を組み合わせて,我々のモデルであるPHDを事前訓練した。
我々は、この領域におけるその有用性を強調しながら、我々のモデルを歴史的QAタスクに適用することに成功しました。
論文 参考訳(メタデータ) (2023-10-22T08:45:48Z) - Prompt me a Dataset: An investigation of text-image prompting for
historical image dataset creation using foundation models [0.9065034043031668]
基礎モデルを用いた歴史資料からの画像抽出のためのパイプラインを提案する。
我々は,テキスト画像のプロンプトと,それらが複雑度の異なる人文科学データセットに与える影響を評価する。
論文 参考訳(メタデータ) (2023-09-04T15:37:03Z) - Incorporating Relevance Feedback for Information-Seeking Retrieval using
Few-Shot Document Re-Ranking [56.80065604034095]
我々は,クエリとユーザが関連すると考えるドキュメントとの類似性に基づいて,文書を再参照するkNNアプローチを提案する。
異なる統合戦略を評価するため、既存の4つの情報検索データセットを関連フィードバックシナリオに変換する。
論文 参考訳(メタデータ) (2022-10-19T16:19:37Z) - Pattern Spotting and Image Retrieval in Historical Documents using Deep
Hashing [60.67014034968582]
本稿では,歴史文書のデジタルコレクションにおける画像検索とパターンスポッティングのためのディープラーニング手法を提案する。
ディープラーニングモデルは、実数値またはバイナリコード表現を提供する2つの異なるバリエーションを考慮して、特徴抽出に使用される。
また,提案手法により検索時間を最大200倍に短縮し,関連する作業と比較してストレージコストを最大6,000倍に削減する。
論文 参考訳(メタデータ) (2022-08-04T01:39:37Z) - Questions Are All You Need to Train a Dense Passage Retriever [123.13872383489172]
ARTは、ラベル付きトレーニングデータを必要としない高密度検索モデルをトレーニングするための、新しいコーパスレベルのオートエンコーディングアプローチである。
そこで,(1) 入力質問を用いて証拠文書の集合を検索し,(2) 文書を用いて元の質問を再構築する確率を計算する。
論文 参考訳(メタデータ) (2022-06-21T18:16:31Z) - A Survey of Historical Document Image Datasets [2.8707038627097226]
本稿では,文書画像解析のための画像データセットの体系的な文献レビューを行う。
手書きの写本や初期の版画などの史料に焦点が当てられている。
歴史的文書分析のための適切なデータセットを見つけることは、異なる機械学習アルゴリズムを用いた研究を促進するための重要な前提条件である。
論文 参考訳(メタデータ) (2022-03-16T09:56:48Z) - Date Estimation in the Wild of Scanned Historical Photos: An Image
Retrieval Approach [3.5698678013121334]
本稿では,史料からの古写真年代推定手法を提案する。
主な貢献は、検索タスクとして日付推定を定式化することであり、クエリが与えられた場合、検索した画像は推定日付類似度でランク付けされる。
我々は,日時推定と日時感応画像検索の2つのタスクにおいて,提案手法の性能を実験的に評価した。
論文 参考訳(メタデータ) (2021-06-10T09:53:03Z) - docExtractor: An off-the-shelf historical document element extraction [18.828438308738495]
文献からテキストやイラストなどの視覚的要素を抽出する汎用的手法である docExtractor を提案する。
さまざまなデータセットにまたがるオフザシェルフシステムとして,高品質なパフォーマンスを提供することを実証する。
IlluHisDocと呼ばれる新しい公開データセットを導入し、歴史文書におけるイラストのセグメンテーションを詳細に評価する。
論文 参考訳(メタデータ) (2020-12-15T10:19:18Z) - Partially-Aligned Data-to-Text Generation with Distant Supervision [69.15410325679635]
我々はPADTG(Partially-Aligned Data-to-Text Generation)と呼ばれる新しい生成タスクを提案する。
自動的にアノテートされたデータをトレーニングに利用し、アプリケーションドメインを大幅に拡張するため、より実用的です。
我々のフレームワークは、全てのベースラインモデルより優れており、部分整合データの利用の可能性を検証する。
論文 参考訳(メタデータ) (2020-10-03T03:18:52Z) - Self-supervised Deep Reconstruction of Mixed Strip-shredded Text
Documents [63.41717168981103]
本研究は,従来の1ページ再構成の深層学習手法を,より現実的で複雑なシナリオに拡張する。
本手法では, 整合性評価を2クラス(無効または無効)パターン認識問題としてモデル化する。
提案手法は複雑なシナリオにおいて競合する手法よりも優れ、90%以上の精度で精度が向上する。
論文 参考訳(メタデータ) (2020-07-01T21:48:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。