論文の概要: Knowledge Graphs for Digitized Manuscripts in Jagiellonian Digital Library Application
- arxiv url: http://arxiv.org/abs/2506.03180v1
- Date: Thu, 29 May 2025 14:49:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 21:20:13.914935
- Title: Knowledge Graphs for Digitized Manuscripts in Jagiellonian Digital Library Application
- Title(参考訳): Jagiellonian Digital Library アプリケーションにおけるデジタル化マニュアルの知識グラフ
- Authors: Jan Ignatowicz, Krzysztof Kutt, Grzegorz J. Nalepa,
- Abstract要約: 美術館、図書館、資料館、博物館(GLAM)は積極的に蔵書をデジタル化し、広範なデジタルコレクションを作成している。
これらのコレクションには、アイテムを記述するメタデータが備わっていることが多いが、その内容は正確には書かれていない。
本稿では,コンピュータビジョン(CV),人工知能(AI),セマンティックWeb技術の統合手法を探求し,メタデータを充実させ,デジタル化された原稿やインキュナブラの知識グラフを構築する。
- 参考スコア(独自算出の注目度): 8.732274235941974
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Digitizing cultural heritage collections has become crucial for preservation of historical artifacts and enhancing their availability to the wider public. Galleries, libraries, archives and museums (GLAM institutions) are actively digitizing their holdings and creates extensive digital collections. Those collections are often enriched with metadata describing items but not exactly their contents. The Jagiellonian Digital Library, standing as a good example of such an effort, offers datasets accessible through protocols like OAI-PMH. Despite these improvements, metadata completeness and standardization continue to pose substantial obstacles, limiting the searchability and potential connections between collections. To deal with these challenges, we explore an integrated methodology of computer vision (CV), artificial intelligence (AI), and semantic web technologies to enrich metadata and construct knowledge graphs for digitized manuscripts and incunabula.
- Abstract(参考訳): 文化遺産コレクションのデジタル化は、歴史的遺物の保存と、一般大衆への普及に欠かせないものとなっている。
美術館、図書館、資料館、博物館(GLAM)は積極的に蔵書をデジタル化し、広範なデジタルコレクションを作成している。
これらのコレクションには、アイテムを記述するメタデータが備わっていることが多いが、その内容は正確には書かれていない。
Jagiellonian Digital Libraryは、このような取り組みの好例として、OAI-PMHのようなプロトコルを通じてアクセス可能なデータセットを提供している。
これらの改善にもかかわらず、メタデータの完全性と標準化は、コレクション間の検索可能性と潜在的な接続を制限する、重大な障害を生じ続けている。
これらの課題に対処するため、デジタル化された原稿やインキュナブラのための知識グラフを構築し、メタデータを充実させるために、コンピュータビジョン(CV)、人工知能(AI)、セマンティックウェブ技術の統合方法論を検討する。
関連論文リスト
- Position Paper: Metadata Enrichment Model: Integrating Neural Networks and Semantic Knowledge Graphs for Cultural Heritage Applications [8.732274235941974]
本稿では,メタデータをデジタル化するための概念的フレームワークであるMetadata Enrichment Model(MEM)を提案する。
MEMは、微調整されたコンピュータビジョンモデル、大きな言語モデル、構造化知識グラフを組み合わせる。
我々はジャギロニアデジタル図書館からデジタル化されたインキュナブラのデータセットをリリースする。
論文 参考訳(メタデータ) (2025-05-29T15:22:18Z) - Granite Vision: a lightweight, open-source multimodal model for enterprise Intelligence [88.74800617923083]
視覚機能を備えた軽量な大規模言語モデルであるGranite Visionを紹介した。
我々のモデルは、包括的な命令追従データセットに基づいて訓練されている。
Granite Visionは、ビジュアル文書理解に関連する標準ベンチマークで強力な結果を得る。
論文 参考訳(メタデータ) (2025-02-14T05:36:32Z) - Making History Readable [0.0]
このポスターは、手書きの手紙、新聞、デジタル化された地形図に焦点を当てた3つのコレクションをハイライトしている。
各コレクションで課題を議論し、それに対処するためのアプローチの詳細を述べます。
提案手法は,これらのコレクションの内容を検索し,ナビゲートしやすくすることで,ユーザエクスペリエンスを向上させることを目的としている。
論文 参考訳(メタデータ) (2024-11-26T17:06:58Z) - A Library Perspective on Supervised Text Processing in Digital Libraries: An Investigation in the Biomedical Domain [3.9519587827662397]
本研究では,8つのバイオメディカルベンチマークを用いて,関係抽出とテキスト分類に焦点を当てた。
精度とアプリケーションコストのトレードオフを検討し、遠隔監視とChatGPT、LLama、Olmoといった大規模言語モデルを通じてデータ生成のトレーニングを行い、最終パイプラインの設計方法について論じる。
論文 参考訳(メタデータ) (2024-11-06T07:54:10Z) - Unlocking Comics: The AI4VA Dataset for Visual Understanding [62.345344799258804]
本稿では,1950年代のフレンチ・ベルジアン漫画に,深度推定,セマンティックセグメンテーション,サリエンシ検出,キャラクタ識別などのタスクを注記した新しいデータセットを提案する。
2つの異なる一貫したスタイルで構成され、自然画像から得られたオブジェクトの概念とラベルを取り入れている。
このような多様な情報を含むことで、このデータセットは計算の創造性を約束するだけでなく、アートのデジタル化やストーリーテリングの革新のための道も提供します。
論文 参考訳(メタデータ) (2024-10-27T14:27:05Z) - Microsoft Cloud-based Digitization Workflow with Rich Metadata Acquisition for Cultural Heritage Objects [7.450700594277742]
我々はジャギロニア図書館(JL)で新しいデジタル化ワークフローを開発した。
ソリューションは、簡単にアクセスできる技術ソリューション - MS Excelファイルインターフェースを備えたMicrosoftクラウド、メタデータ取得用のOffice Script、ストレージ用のMS 365 -- に基づいており、ドメインの専門家がメタデータを取得することができる。
最終的な目標は、一般的な知識基盤と他の文化遺産コレクションに関連付けられた分析された保持状況を記述する知識グラフを作成することである。
論文 参考訳(メタデータ) (2024-07-09T15:49:47Z) - A Comprehensive Survey of 3D Dense Captioning: Localizing and Describing
Objects in 3D Scenes [80.20670062509723]
3Dシークエンスキャプションは、3Dシーンの詳細な説明を作成することを目的とした、視覚言語によるブリッジングタスクである。
2次元の視覚的キャプションと比較して、現実世界の表現が密接なため、大きな可能性と課題が提示される。
既存手法の人気と成功にもかかわらず、この分野の進歩を要約した総合的な調査は乏しい。
論文 参考訳(メタデータ) (2024-03-12T10:04:08Z) - Open Set Classification of Untranscribed Handwritten Documents [56.0167902098419]
重要な写本の膨大な量のデジタルページイメージが世界中のアーカイブに保存されている。
ドキュメントのクラスや型付け'はおそらくメタデータに含まれる最も重要なタグです。
技術的問題は文書の自動分類の1つであり、それぞれが書き起こされていない手書きのテキスト画像からなる。
論文 参考訳(メタデータ) (2022-06-20T20:43:50Z) - Digital Editions as Distant Supervision for Layout Analysis of Printed
Books [76.29918490722902]
本稿では,この意味的マークアップを,レイアウト解析モデルのトレーニングと評価のための遠隔監視として利用する手法について述べる。
DTA(Deutsches Textarchiv)の50万ページにわたるモデルアーキテクチャの実験では、これらの領域レベルの評価手法と画素レベルのメトリクスとワードレベルのメトリクスとの高い相関性を見出した。
自己学習による精度向上の可能性と、DTAで訓練されたモデルが他の歴史書に一般化できる可能性について論じる。
論文 参考訳(メタデータ) (2021-12-23T16:51:53Z) - Text-Based Person Search with Limited Data [66.26504077270356]
テキストベースの人物検索(TBPS)は、画像ギャラリーから対象人物を記述的なテキストクエリで検索することを目的としている。
限られたデータによってもたらされる問題に対処する2つの新しいコンポーネントを持つフレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-20T22:20:47Z) - Object Retrieval and Localization in Large Art Collections using Deep
Multi-Style Feature Fusion and Iterative Voting [10.807131260367298]
本稿では,特定のモチーフやオブジェクトを含む画像領域を検索するアルゴリズムを提案する。
GPUによる近似近傍探索による領域ベースの投票では、広範囲なデータセット内の小さなモチーフを数秒で見つけ、ローカライズすることが可能です。
論文 参考訳(メタデータ) (2021-07-14T18:40:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。