論文の概要: Feature Mixing for Writer Retrieval and Identification on Papyri
Fragments
- arxiv url: http://arxiv.org/abs/2306.12939v1
- Date: Thu, 22 Jun 2023 14:55:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-23 14:18:26.435242
- Title: Feature Mixing for Writer Retrieval and Identification on Papyri
Fragments
- Title(参考訳): パピルスフラグメントの著者検索と同定のための特徴混合
- Authors: Marco Peer and Robert Sablatnig
- Abstract要約: 本稿では,パピルスの書き手検索と識別のためのディープラーニングに基づくアプローチを提案する。
本稿では,残骨と特徴混合ステージを組み合わせ,検索性能を向上させるニューラルネットワークアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 0.7614628596146599
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper proposes a deep-learning-based approach to writer retrieval and
identification for papyri, with a focus on identifying fragments associated
with a specific writer and those corresponding to the same image. We present a
novel neural network architecture that combines a residual backbone with a
feature mixing stage to improve retrieval performance, and the final descriptor
is derived from a projection layer. The methodology is evaluated on two
benchmarks: PapyRow, where we achieve a mAP of 26.6 % and 24.9 % on writer and
page retrieval, and HisFragIR20, showing state-of-the-art performance (44.0 %
and 29.3 % mAP). Furthermore, our network has an accuracy of 28.7 % for writer
identification. Additionally, we conduct experiments on the influence of two
binarization techniques on fragments and show that binarizing does not enhance
performance. Our code and models are available to the community.
- Abstract(参考訳): 本稿では,パピリの著者検索と同定を深層学習に基づくアプローチとして,特定の著者と関連した断片と同一画像に対応する断片の同定に焦点をあてた。
本稿では,検索性能を向上させるために,残差バックボーンと特徴混合ステージを組み合わせた新しいニューラルネットワークアーキテクチャを提案する。
この手法は2つのベンチマークで評価されている: papyrow(著者とページの検索において26.6 %と24.9 %)とhisfragir20(最先端のパフォーマンスを示す)である。
さらに,筆者の識別精度は28.7 %である。
さらに,2つのバイナライズ手法がフラグメントに与える影響について実験を行い,バイナライズが性能を向上しないことを示す。
私たちのコードとモデルはコミュニティで利用可能です。
関連論文リスト
- An Efficient MLP-based Point-guided Segmentation Network for Ore Images
with Ambiguous Boundary [12.258442550351178]
本稿では,エッジバーリングの問題を解決することを目的とした,MLP(Multi-Layer Perceptron)に基づく軽量フレームワークを提案する。
提案手法は, 73MBのモデルサイズで, 毎秒27フレーム以上の処理速度を実現する。
提案手法は,性能スコアが60.4,48.9 in$AP_50box$と$AP_50mask$の順に高い精度を提供する。
論文 参考訳(メタデータ) (2024-02-27T10:09:29Z) - Detecting and recognizing characters in Greek papyri with YOLOv8, DeiT
and SimCLR [9.7902367664742]
本稿は、ギリシャ文字の検出・認識に関するICDAR 2023コンペティションへの参加について論じる。
我々は、YOLOv8モデルのアンサンブルを用いて個々の文字を検出し、分類し、2つの異なるアプローチを用いて文字予測を精査した。
平均精度(mAP)は51.4%であり,mAPは42.2%,検出精度(mAP)は51.4%であった。
論文 参考訳(メタデータ) (2024-01-23T06:08:00Z) - Towards Writer Retrieval for Historical Datasets [0.6445605125467572]
キーポイントで検出されたクラスタリングSIFT記述子に基づく文字検索のための教師なしアプローチ。
残余ネットワークに続いて提案したNetRVLADは,複雑さを低減した符号化層である。
このアプローチは、現代的なデータセットでも同等のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2023-05-09T11:44:44Z) - Pattern Spotting and Image Retrieval in Historical Documents using Deep
Hashing [60.67014034968582]
本稿では,歴史文書のデジタルコレクションにおける画像検索とパターンスポッティングのためのディープラーニング手法を提案する。
ディープラーニングモデルは、実数値またはバイナリコード表現を提供する2つの異なるバリエーションを考慮して、特徴抽出に使用される。
また,提案手法により検索時間を最大200倍に短縮し,関連する作業と比較してストレージコストを最大6,000倍に削減する。
論文 参考訳(メタデータ) (2022-08-04T01:39:37Z) - Spatio-temporal Relation Modeling for Few-shot Action Recognition [100.3999454780478]
本稿では,高次時間表現を同時に学習しながら,クラス固有の特徴の識別性を向上する数ショットアクション認識フレームワークSTRMを提案する。
本手法は,本研究でもっとも優れた手法に比べて,分類精度が3.5%向上した。
論文 参考訳(メタデータ) (2021-12-09T18:59:14Z) - Face Trees for Expression Recognition [13.099925083569333]
表情認識のためのエンドツーエンドアーキテクチャを提案する。
提案アーキテクチャでは,顔の構造を学習するためのランドマーク位置と,テクスチャ情報を学ぶためのランドマーク周辺のパッチに焦点を当てた2つの主要なストリームが組み込まれている。
AffectNet と FER2013 の2つの大規模顔表情データセットについて広範囲に実験を行い,提案手法の有効性を検証した。
論文 参考訳(メタデータ) (2021-12-05T06:35:12Z) - G-DetKD: Towards General Distillation Framework for Object Detectors via
Contrastive and Semantic-guided Feature Imitation [49.421099172544196]
そこで本研究では,すべてのピラミッドレベルにまたがる特徴ペア間のソフトマッチングを自動的に行う,意味誘導型特徴模倣手法を提案する。
また,異なる特徴領域間の関係で符号化された情報を効果的に捉えるために,コントラスト蒸留を導入する。
本手法は,(1)フレームワークのコンポーネントを別々に使用した場合に,既存の検出KD技術よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2021-08-17T07:44:27Z) - Cross-domain Speech Recognition with Unsupervised Character-level
Distribution Matching [60.8427677151492]
2つの領域における各文字間の微粒化適応を行うための文字レベルの分布マッチング手法であるCMatchを提案する。
Libri-Adaptデータセットを用いた実験の結果,提案手法はクロスデバイスとクロス環境の両方で14.39%,16.50%の単語誤り率(WER)を低減できることがわかった。
論文 参考訳(メタデータ) (2021-04-15T14:36:54Z) - A Replication Study of Dense Passage Retriever [32.192420072129636]
Karpukhinらによって提案された高密度通過レトリバー(DPR)技術について研究する。
(2020) エンドツーエンドのオープンドメイン質問応答。
本稿では,著者らによるモデルチェックポイントから本研究の再現性について検討する。
私たちは、オリジナルの作業とまったく同じモデルを使って、エンドツーエンドの質問応答の有効性を改善することができます。
論文 参考訳(メタデータ) (2021-04-12T18:10:39Z) - Corner Proposal Network for Anchor-free, Two-stage Object Detection [174.59360147041673]
オブジェクト検出の目標は、画像内のオブジェクトのクラスと位置を決定することである。
本稿では,多数のオブジェクト提案を抽出する新しいアンカーフリー2段階フレームワークを提案する。
この2つの段階が,リコールと精度の向上に有効な解であることを示す。
論文 参考訳(メタデータ) (2020-07-27T19:04:57Z) - Weakly-Supervised Semantic Segmentation by Iterative Affinity Learning [86.45526827323954]
弱教師付きセマンティックセグメンテーションは、トレーニングのためにピクセル単位のラベル情報が提供されないため、難しい課題である。
このようなペア関係を学習するための反復アルゴリズムを提案する。
本稿では,提案アルゴリズムが最先端手法に対して好適に動作することを示す。
論文 参考訳(メタデータ) (2020-02-19T10:32:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。