論文の概要: KaiRacters: Character-level-based Writer Retrieval for Greek Papyri
- arxiv url: http://arxiv.org/abs/2407.07536v1
- Date: Wed, 10 Jul 2024 10:51:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-11 17:01:49.103712
- Title: KaiRacters: Character-level-based Writer Retrieval for Greek Papyri
- Title(参考訳): KaiRacters: ギリシャ・パピリのキャラクターレベルの作家検索
- Authors: Marco Peer, Robert Sablatnig, Olga Serbaeva, Isabelle Marthot-Santaniello,
- Abstract要約: ギリシア語文では, トリオグラムカイと4つの追加文字(エプシロン, カッパ, ム, オメガ)について, 文字レベルの注釈を導入する。
1ページあたり15文字程度しか使わないことで、パフォーマンスを最大4%まで向上できることが示されています。
- 参考スコア(独自算出の注目度): 1.6874375111244329
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a character-based approach for enhancing writer retrieval performance in the context of Greek papyri. Our contribution lies in introducing character-level annotations for frequently used characters, in our case the trigram kai and four additional letters (epsilon, kappa, mu, omega), in Greek texts. We use a state-of-the-art writer retrieval approach based on NetVLAD and compare a character-level-based feature aggregation method against the current default baseline of using small patches located at SIFT keypoint locations for building the page descriptors. We demonstrate that by using only about 15 characters per page, we are able to boost the performance up to 4% mAP (a relative improvement of 11%) on the GRK-120 dataset. Additionally, our qualitative analysis offers insights into the similarity scores of SIFT patches and specific characters. We publish the dataset with character-level annotations, including a quality label and our binarized images for further research.
- Abstract(参考訳): 本稿では,ギリシア語のpapyriの文脈における文字検索性能向上のための文字ベースアプローチを提案する。
私たちの貢献は、頻繁に使われる文字に対する文字レベルの注釈の導入であり、この場合、ギリシア語のテキストでトリグラムカイと4つの追加文字(epsilon, kappa, mu, omega)が導入された。
我々は,NetVLADに基づく最先端のライター検索手法を用いて,SIFTキーポイント位置にある小さなパッチを使ってページ記述子を構築する場合の,文字レベルに基づく特徴集約手法と,現在のデフォルトベースラインとの比較を行った。
1ページあたり15文字程度しか使用せず、GRK-120データセット上で4%mAP(相対改善11%)のパフォーマンスを向上できることを実証した。
さらに、定性的分析はSIFTパッチと特定の文字の類似点に関する洞察を与える。
我々は、品質ラベルやバイナライズされた画像を含む文字レベルのアノテーションでデータセットを公開し、さらなる研究を行う。
関連論文リスト
- Detecting Document-level Paraphrased Machine Generated Content: Mimicking Human Writing Style and Involving Discourse Features [57.34477506004105]
機械生成コンテンツは、学術プラジャリズムや誤報の拡散といった課題を提起する。
これらの課題を克服するために、新しい方法論とデータセットを導入します。
人間の筆記スタイルをエミュレートするエンコーダデコーダモデルであるMhBARTを提案する。
また,PDTB前処理による談話解析を統合し,構造的特徴を符号化するモデルであるDTransformerを提案する。
論文 参考訳(メタデータ) (2024-12-17T08:47:41Z) - BookWorm: A Dataset for Character Description and Analysis [59.186325346763184]
本稿では,短い事実プロファイルを生成する文字記述と,詳細な解釈を提供する文字解析という2つのタスクを定義する。
本稿では,Gutenbergプロジェクトからの書籍と,人間による記述と分析のペアリングを行うBookWormデータセットを紹介する。
その結果,検索に基づくアプローチは両タスクにおいて階層的アプローチよりも優れていた。
論文 参考訳(メタデータ) (2024-10-14T10:55:58Z) - Multi-Modal Multi-Granularity Tokenizer for Chu Bamboo Slip Scripts [65.10991154918737]
本研究は、古代中国の春・秋・戦国時代(紀元前771-256年)に用いられた中竹の文字に焦点を当てたものである。
我々のトークンライザはまず文字検出を採用して文字境界の特定を行い、次に文字レベルとサブキャラクタレベルの両方で文字認識を行う。
学術コミュニティを支援するために,100K以上の注釈付き文字イメージスキャンを備えたCBSの最初の大規模データセットも収集した。
論文 参考訳(メタデータ) (2024-09-02T07:42:55Z) - LOCR: Location-Guided Transformer for Optical Character Recognition [55.195165959662795]
自動回帰中にトランスフォーマーアーキテクチャに位置案内を組み込むモデルであるLOCRを提案する。
125Kの学術文書ページから777万以上のテキスト配置ペアからなるデータセット上でモデルをトレーニングする。
これは、編集距離、BLEU、METEOR、F測定によって測定されたarXivから構築されたテストセットの既存のメソッドよりも優れています。
論文 参考訳(メタデータ) (2024-03-04T15:34:12Z) - UFineBench: Towards Text-based Person Retrieval with Ultra-fine Granularity [50.91030850662369]
既存のテキストベースの人物検索データセットは、しばしば比較的粗い粒度のテキストアノテーションを持つ。
これにより、実際のシナリオにおけるクエリテキストのきめ細かいセマンティクスを理解するモデルが妨げられます。
我々は,超微細な人物検索のためにtextbfUFineBench という新しいベンチマークを作成した。
論文 参考訳(メタデータ) (2023-12-06T11:50:14Z) - FigCaps-HF: A Figure-to-Caption Generative Framework and Benchmark with
Human Feedback [31.230023678131843]
FigCaps-HFは、新しいフィギュアキャプション生成フレームワークである。
本フレームワークは,1) 図形選択ペアの品質を評価するための自動手法,2) 人物フィードバックを用いた新しい強化学習(RLHF) により,読取者の好みに応じて生成図形選択モデルを最適化する。
論文 参考訳(メタデータ) (2023-07-20T13:40:22Z) - Feature Mixing for Writer Retrieval and Identification on Papyri
Fragments [0.7614628596146599]
本稿では,パピルスの書き手検索と識別のためのディープラーニングに基づくアプローチを提案する。
本稿では,残骨と特徴混合ステージを組み合わせ,検索性能を向上させるニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-06-22T14:55:01Z) - Towards Writer Retrieval for Historical Datasets [0.6445605125467572]
キーポイントで検出されたクラスタリングSIFT記述子に基づく文字検索のための教師なしアプローチ。
残余ネットワークに続いて提案したNetRVLADは,複雑さを低減した符号化層である。
このアプローチは、現代的なデータセットでも同等のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2023-05-09T11:44:44Z) - Siamese based Neural Network for Offline Writer Identification on word
level data [7.747239584541488]
入力語画像に基づいて文書の著者を特定する新しい手法を提案する。
本手法はテキスト独立であり,入力画像のサイズに制約を課さない。
論文 参考訳(メタデータ) (2022-11-17T10:01:46Z) - PGNet: Real-time Arbitrarily-Shaped Text Spotting with Point Gathering
Network [54.03560668182197]
任意形状のテキストをリアルタイムで読み取るための,完全畳み込み点収集ネットワーク(PGNet)を提案する。
PG-CTCデコーダを用いて2次元空間から高レベル文字分類ベクトルを収集し,NMSやRoI操作を使わずにテキストシンボルに復号する。
実験により,提案手法は競争精度が向上し,走行速度が著しく向上することが確認された。
論文 参考訳(メタデータ) (2021-04-12T13:27:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。