論文の概要: NeuroPapyri: A Deep Attention Embedding Network for Handwritten Papyri Retrieval
- arxiv url: http://arxiv.org/abs/2408.07785v1
- Date: Wed, 14 Aug 2024 19:36:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-16 15:48:53.082494
- Title: NeuroPapyri: A Deep Attention Embedding Network for Handwritten Papyri Retrieval
- Title(参考訳): NeuroPapyri: 手書きパパリ検索のためのディープアテンション埋め込みネットワーク
- Authors: Giuseppe De Gregorio, Simon Perrin, Rodrigo C. G. Pena, Isabelle Marthot-Santaniello, Harold Mouchère,
- Abstract要約: NeuroPapyriは、古代ギリシアのパピルスを含む画像の分析に特化して設計された革新的なディープラーニングベースのモデルである。
本稿では,NeuroPapyriモデルとそのアーキテクチャとトレーニング手法について述べる。
評価の結果, 文献検索におけるNeuroPapyriの有効性が示された。
- 参考スコア(独自算出の注目度): 1.12313922953616
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The intersection of computer vision and machine learning has emerged as a promising avenue for advancing historical research, facilitating a more profound exploration of our past. However, the application of machine learning approaches in historical palaeography is often met with criticism due to their perceived ``black box'' nature. In response to this challenge, we introduce NeuroPapyri, an innovative deep learning-based model specifically designed for the analysis of images containing ancient Greek papyri. To address concerns related to transparency and interpretability, the model incorporates an attention mechanism. This attention mechanism not only enhances the model's performance but also provides a visual representation of the image regions that significantly contribute to the decision-making process. Specifically calibrated for processing images of papyrus documents with lines of handwritten text, the model utilizes individual attention maps to inform the presence or absence of specific characters in the input image. This paper presents the NeuroPapyri model, including its architecture and training methodology. Results from the evaluation demonstrate NeuroPapyri's efficacy in document retrieval, showcasing its potential to advance the analysis of historical manuscripts.
- Abstract(参考訳): コンピュータビジョンと機械学習の交わりは、歴史研究を進めるための有望な道として現れ、我々の過去をより深く探究することを可能にしている。
しかし、歴史的パレオグラフィーにおける機械学習のアプローチの適用は、その「ブラックボックス」の性質が認識されているため、しばしば批判を浴びる。
この課題に対応するために,古代ギリシアのパピルスを含む画像の分析に特化して設計された,革新的な深層学習モデルであるNeuroPapyriを紹介した。
透明性と解釈可能性に関する懸念に対処するため、モデルには注意機構が組み込まれている。
この注意機構は、モデルの性能を高めるだけでなく、意思決定プロセスに大きく貢献する画像領域の視覚的表現も提供する。
具体的には、パピルス文書の画像を手書きテキストの行で処理するために調整され、個々の注意マップを使用して、入力画像中の特定の文字の有無を通知する。
本稿では,NeuroPapyriモデルとそのアーキテクチャとトレーニング手法について述べる。
評価の結果, 文献検索におけるNeuroPapyriの有効性が示された。
関連論文リスト
- Information Theoretic Text-to-Image Alignment [49.396917351264655]
本稿では,ステア画像生成のための情報理論アライメント尺度を用いた新しい手法を提案する。
提案手法は最先端の手法よりも優れているが,MIを推定するためには事前学習されたデノナイジングネットワークを必要としない。
論文 参考訳(メタデータ) (2024-05-31T12:20:02Z) - Masked Modeling for Self-supervised Representation Learning on Vision
and Beyond [69.64364187449773]
仮面モデリングは、トレーニング中に比例的にマスキングされる元のデータの一部を予測する、独特なアプローチとして現れてきた。
マスクモデリングにおけるテクニックの詳細については,多様なマスキング戦略,ターゲット回復,ネットワークアーキテクチャなどについて詳述する。
我々は、現在の手法の限界について議論し、マスクモデリング研究を進めるためのいくつかの道のりを指摘した。
論文 参考訳(メタデータ) (2023-12-31T12:03:21Z) - Enhancing Image Captioning with Neural Models [0.0]
本研究では, 異なるニューラルアーキテクチャの性能について検討し, インジェクションアーキテクチャに着目し, キャプション生成を評価するための新しい品質指標を提案する。
その結果、マージモデルはより大きな語彙と高いROUGEスコアを示す一方で、インジェクションアーキテクチャは関連性があり簡潔な画像キャプションを生成することがわかった。
論文 参考訳(メタデータ) (2023-12-01T09:06:56Z) - A domain adaptive deep learning solution for scanpath prediction of
paintings [66.46953851227454]
本稿では,ある絵画の視覚的体験における視聴者の眼球運動分析に焦点を当てた。
我々は、人間の視覚的注意を予測するための新しいアプローチを導入し、人間の認知機能に影響を及ぼす。
提案した新しいアーキテクチャは、画像を取り込んでスキャンパスを返す。
論文 参考訳(メタデータ) (2022-09-22T22:27:08Z) - A Survey on Graph-Based Deep Learning for Computational Histopathology [36.58189530598098]
我々は、デジタル病理と生検画像パッチの分析に機械学習と深層学習の利用が急速に拡大しているのを目撃した。
畳み込みニューラルネットワークを用いたパッチワイド機能に関する従来の学習は、グローバルなコンテキスト情報をキャプチャしようとする際のモデルを制限する。
本稿では,グラフに基づく深層学習の概念的基盤を提供し,腫瘍の局在と分類,腫瘍浸潤とステージング,画像検索,生存予測の現在の成功について論じる。
論文 参考訳(メタデータ) (2021-07-01T07:50:35Z) - Catalyzing Clinical Diagnostic Pipelines Through Volumetric Medical
Image Segmentation Using Deep Neural Networks: Past, Present, & Future [0.0]
本稿では,最先端(sota)ニューラルネットワークに基づくセグメンテーションアルゴリズムについて概説する。
また、効果的なディープラーニングベースのソリューションの臨床的意義を示す。
論文 参考訳(メタデータ) (2021-03-27T19:05:11Z) - Deep Co-Attention Network for Multi-View Subspace Learning [73.3450258002607]
マルチビューサブスペース学習のための深層コアテンションネットワークを提案する。
共通情報と相補情報の両方を敵意で抽出することを目的としている。
特に、新しいクロス再構成損失を使用し、ラベル情報を利用して潜在表現の構築を誘導する。
論文 参考訳(メタデータ) (2021-02-15T18:46:44Z) - SketchEmbedNet: Learning Novel Concepts by Imitating Drawings [125.45799722437478]
モデルを用いて画像のスケッチを作成することによって学習した画像表現の特性について検討する。
この生成型クラスに依存しないモデルでは,新規な例,クラス,さらには新規なデータセットからの画像の情報埋め込みが,数ショットで生成されることが示されている。
論文 参考訳(メタデータ) (2020-08-27T16:43:28Z) - Image Segmentation Using Deep Learning: A Survey [58.37211170954998]
イメージセグメンテーションは、画像処理とコンピュータビジョンにおいて重要なトピックである。
深層学習モデルを用いた画像セグメンテーション手法の開発を目的とした研究が,これまでに数多く行われている。
論文 参考訳(メタデータ) (2020-01-15T21:37:47Z) - A Gentle Introduction to Deep Learning for Graphs [23.809161531445053]
この作品は、グラフのディープラーニング分野のチュートリアルとして設計されている。
構造化情報処理に対する局所的および反復的アプローチに基づくグラフ表現学習の一般的な定式化を導入する。
グラフの新規かつ効果的なニューラルモデルを設計するために組み合わせられる基本的なビルディングブロックを導入している。
論文 参考訳(メタデータ) (2019-12-29T16:43:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。