論文の概要: ICFHR 2020 Competition on Image Retrieval for Historical Handwritten
Fragments
- arxiv url: http://arxiv.org/abs/2010.10197v1
- Date: Tue, 20 Oct 2020 11:12:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 07:13:17.040219
- Title: ICFHR 2020 Competition on Image Retrieval for Historical Handwritten
Fragments
- Title(参考訳): ICFHR 2020コンペティション:歴史的手書き破片の画像検索
- Authors: Mathias Seuret, Anguelos Nicolaou, Dominique Stutzmann, Andreas Maier,
Vincent Christlein
- Abstract要約: このコンペティションは、歴史文書画像の書き手とスタイル分析のための一連のコンペティションに成功している。
ほとんどのチームが畳み込みニューラルネットワークに基づく手法を提出したが、勝利したエントリーは40%未満のmAPを達成した。
- 参考スコア(独自算出の注目度): 11.154300222718879
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This competition succeeds upon a line of competitions for writer and style
analysis of historical document images. In particular, we investigate the
performance of large-scale retrieval of historical document fragments in terms
of style and writer identification. The analysis of historic fragments is a
difficult challenge commonly solved by trained humanists. In comparison to
previous competitions, we make the results more meaningful by addressing the
issue of sample granularity and moving from writer to page fragment retrieval.
The two approaches, style and author identification, provide information on
what kind of information each method makes better use of and indirectly
contribute to the interpretability of the participating method. Therefore, we
created a large dataset consisting of more than 120 000 fragments. Although the
most teams submitted methods based on convolutional neural networks, the
winning entry achieves an mAP below 40%.
- Abstract(参考訳): このコンペティションは、歴史的な文書画像の作家とスタイル分析のためのコンペティションで成功している。
特に,歴史文書の断片の大規模検索性能について,スタイルと作者識別の観点から検討した。
歴史的断片の分析は、訓練された人文主義者によって一般的に解決される難しい課題である。
従来の競合と比較すると,サンプル粒度問題に対処し,著者からページフラグメント検索へ移行することで,より有意義な結果が得られる。
この2つのアプローチ、スタイルと著者識別は、各メソッドがよりよく利用する情報の種類に関する情報を提供し、参加者のメソッドの解釈可能性に間接的に寄与する。
そのため、120万以上のフラグメントからなる大きなデータセットを作成しました。
ほとんどのチームが畳み込みニューラルネットワークに基づく手法を提出しているが、勝利は40%未満のマップを達成している。
関連論文リスト
- Temporal Image Caption Retrieval Competition -- Description and Results [0.9999629695552195]
本稿では,テキスト画像検索のマルチモーダル課題に対処し,時間的データを含むモーダル性を拡張する新しいタスクを提案する。
本論文は,274年にわたる歴史あるアメリカの新聞をデジタル化して収集する,日刊アメリカ・チャレニアングアメリカプロジェクトを基にした画像検索コンペティション(TICRC)である。
論文 参考訳(メタデータ) (2024-10-08T19:45:53Z) - PHD: Pixel-Based Language Modeling of Historical Documents [55.75201940642297]
実史文書に類似した合成スキャンを生成する新しい手法を提案する。
我々は,1700-1900年代における合成スキャンと実際の歴史新聞を組み合わせて,我々のモデルであるPHDを事前訓練した。
我々は、この領域におけるその有用性を強調しながら、我々のモデルを歴史的QAタスクに適用することに成功しました。
論文 参考訳(メタデータ) (2023-10-22T08:45:48Z) - ICDAR 2023 Competition on Structured Text Extraction from Visually-Rich
Document Images [198.35937007558078]
大会は2022年12月30日に開かれ、2023年3月24日に閉幕した。
トラック1には35人の参加者と91人の有効な応募があり、トラック2には15人の参加者と26人の応募がある。
提案手法の性能によると, 複雑なシナリオやゼロショットシナリオにおいて, 期待される情報抽出性能にはまだ大きなギャップがあると考えられる。
論文 参考訳(メタデータ) (2023-06-05T22:20:52Z) - DAPR: A Benchmark on Document-Aware Passage Retrieval [57.45793782107218]
我々は,このタスクemphDocument-Aware Passage Retrieval (DAPR)を提案する。
State-of-The-Art(SoTA)パスレトリバーのエラーを分析しながら、大きなエラー(53.5%)は文書コンテキストの欠如に起因する。
提案するベンチマークにより,検索システムの開発・比較を今後行うことができる。
論文 参考訳(メタデータ) (2023-05-23T10:39:57Z) - Fine-Grained Distillation for Long Document Retrieval [86.39802110609062]
ロングドキュメント検索は、大規模コレクションからクエリ関連ドキュメントを取得することを目的としている。
知識蒸留は、異質だが強力なクロスエンコーダを模倣することによって、レトリバーを改善するために事実上のものである。
本稿では, 長期文書検索のための新たな学習フレームワークFGDを提案する。
論文 参考訳(メタデータ) (2022-12-20T17:00:36Z) - Writer Retrieval and Writer Identification in Greek Papyri [4.44566870214758]
著者識別は、既知の著者の分類であり、著者検索は、画像のデータセットにおける画像の類似性によって、著者を見つけようとする。
自動書き手識別・検索手法はすでに多くの歴史的文書タイプに対して有望な結果を提供しているが,繊維構造や重度アーティファクトのため,パピリデータは非常に困難である。
そこで本研究では,パピリ文字における書き手識別の改善に,優れたバイナライゼーションが重要であることを示す。
論文 参考訳(メタデータ) (2022-12-15T08:42:25Z) - Placing (Historical) Facts on a Timeline: A Classification cum Coref
Resolution Approach [4.809236881780707]
タイムラインは、ある期間に起こった重要な歴史的事実を視覚化する最も効果的な方法の1つである。
複数の(歴史的)テキスト文書からイベントタイムラインを生成するための2段階システムを提案する。
我々の結果は、歴史学者、歴史研究の進展、そして国の社会・政治の風景を理解する上で非常に役立ちます。
論文 参考訳(メタデータ) (2022-06-28T15:36:44Z) - Where Does the Performance Improvement Come From? - A Reproducibility
Concern about Image-Text Retrieval [85.03655458677295]
画像テキスト検索は、情報検索分野において、徐々に主要な研究方向になりつつある。
まず、画像テキスト検索タスクに焦点が当てられている理由と関連性について検討する。
本研究では,事前学習と非事前学習による検索モデルの再現の諸側面を解析する。
論文 参考訳(メタデータ) (2022-03-08T05:01:43Z) - ICDAR 2021 Competition on Components Segmentation Task of Document
Photos [63.289361617237944]
3つの課題タスクが提案され、提供されたデータセット上で異なるセグメンテーションの割り当てが実行される。
収集されたデータはブラジルのいくつかのID文書のもので、その個人情報は便利に交換された。
さまざまなディープラーニングモデルが、各タスクで最高の結果を得るために、さまざまな戦略を持つ参加者によって適用されました。
論文 参考訳(メタデータ) (2021-06-16T00:49:58Z) - Whole page recognition of historical handwriting [1.2183405753834562]
そこで本研究では,手書きページを受信し,その全文を転写するテキストローカライゼーションを伴わないエンドツーエンド推論手法について検討する。
明示的な文字や単語や行のセグメンテーションは推論にかかわらないため、我々はこのアプローチを「セグメンテーションフリー」と呼ぶ。
テキストのローカライゼーションやセグメンテーションを伴わないページ全体の推論手法が競合していると結論付けている。
論文 参考訳(メタデータ) (2020-09-22T15:46:33Z) - Combining Visual and Textual Features for Semantic Segmentation of
Historical Newspapers [2.5899040911480187]
本稿では,歴史新聞のセマンティックセマンティックセグメンテーションのためのマルチモーダルアプローチを提案する。
ダイアクロニックなスイスとルクセンブルクの新聞の実験に基づいて、視覚的特徴とテキスト的特徴の予測力について検討する。
その結果、強力な視覚ベースラインと比較して、マルチモーダルモデルの一貫した改善が見られた。
論文 参考訳(メタデータ) (2020-02-14T17:56:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。