論文の概要: Knowledge Graphs Generation from Cultural Heritage Texts: Combining LLMs and Ontological Engineering for Scholarly Debates
- arxiv url: http://arxiv.org/abs/2511.10354v1
- Date: Fri, 14 Nov 2025 01:46:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-14 22:53:22.824607
- Title: Knowledge Graphs Generation from Cultural Heritage Texts: Combining LLMs and Ontological Engineering for Scholarly Debates
- Title(参考訳): 文化遺産資料からの知識グラフ生成--LLMとオントロジー工学を組み合わせて-
- Authors: Andrea Schimmenti, Valentina Pasqual, Fabio Vitali, Marieke van Erp,
- Abstract要約: 本稿では,大規模言語モデルに基づく知識抽出のための体系的5段階手法であるATR4CHを紹介する。
本研究は,信頼性評価に関する議論のケーススタディを通じて,方法論の検証を行う。
ATR4CHは、文化遺産機関がテキスト知識をクエリ可能な知識グラフに体系的に変換することを可能にする。
- 参考スコア(独自算出の注目度): 0.3033221007650832
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cultural Heritage texts contain rich knowledge that is difficult to query systematically due to the challenges of converting unstructured discourse into structured Knowledge Graphs (KGs). This paper introduces ATR4CH (Adaptive Text-to-RDF for Cultural Heritage), a systematic five-step methodology for Large Language Model-based Knowledge Extraction from Cultural Heritage documents. We validate the methodology through a case study on authenticity assessment debates. Methodology - ATR4CH combines annotation models, ontological frameworks, and LLM-based extraction through iterative development: foundational analysis, annotation schema development, pipeline architecture, integration refinement, and comprehensive evaluation. We demonstrate the approach using Wikipedia articles about disputed items (documents, artifacts...), implementing a sequential pipeline with three LLMs (Claude Sonnet 3.7, Llama 3.3 70B, GPT-4o-mini). Findings - The methodology successfully extracts complex Cultural Heritage knowledge: 0.96-0.99 F1 for metadata extraction, 0.7-0.8 F1 for entity recognition, 0.65-0.75 F1 for hypothesis extraction, 0.95-0.97 for evidence extraction, and 0.62 G-EVAL for discourse representation. Smaller models performed competitively, enabling cost-effective deployment. Originality - This is the first systematic methodology for coordinating LLM-based extraction with Cultural Heritage ontologies. ATR4CH provides a replicable framework adaptable across CH domains and institutional resources. Research Limitations - The produced KG is limited to Wikipedia articles. While the results are encouraging, human oversight is necessary during post-processing. Practical Implications - ATR4CH enables Cultural Heritage institutions to systematically convert textual knowledge into queryable KGs, supporting automated metadata enrichment and knowledge discovery.
- Abstract(参考訳): 文化遺産のテキストには、構造化されていない言説を構造化知識グラフ(KG)に変換するという課題のため、体系的にクエリが難しい豊富な知識が含まれている。
本稿では,ATR4CH(Adaptive Text-to-RDF for Cultural Heritage)について紹介する。
本研究は,信頼性評価に関する議論のケーススタディを通じて,方法論の検証を行う。
方法論 - ATR4CHは、基本的な分析、アノテーションスキーマ開発、パイプラインアーキテクチャ、統合改善、包括的な評価といった反復的な開発を通じて、アノテーションモデル、オントロジフレームワーク、LLMベースの抽出を組み合わせる。
本稿では,3つのLCM (Claude Sonnet 3.7, Llama 3.3 70B, GPT-4o-mini) を連続パイプラインとして実装した。
発見 - この方法論は、メタデータ抽出のための 0.96-0.99 F1、エンティティ認識のための 0.7-0.8 F1、仮説抽出のための 0.65-0.75 F1、証拠抽出のための 0.95-0.97、談話表現のための 0.62 G-EVAL といった複雑な文化遺産の知識を抽出することに成功している。
より小型のモデルは競争力があり、コスト効率の良い配備を可能にした。
原点性 - LLMに基づく抽出と文化遺産のオントロジーを協調する最初の体系的方法論である。
ATR4CHはCHドメインと機関リソースに適応可能な複製可能なフレームワークを提供する。
研究制限 - 生成されたKGはウィキペディアの記事に限られている。
結果は励まされるが、後処理には人間の監視が必要である。
実践的意味 - ATR4CHは、文化遺産の機関が、テキストの知識をクエリ可能なKGに体系的に変換し、メタデータの自動強化と知識発見をサポートする。
関連論文リスト
- Evaluating Cultural Knowledge Processing in Large Language Models: A Cognitive Benchmarking Framework Integrating Retrieval-Augmented Generation [3.141716989847573]
本研究では,大規模言語モデル(LLM)がどのように処理し,文化的に特異的な知識を適用するかを評価するための認知的ベンチマークフレームワークを提案する。
このフレームワークはブルームの分類とRAG(Retrieval-Augmented Generation)を統合し、6つの階層的認知領域にわたるモデルパフォーマンスを評価する。
論文 参考訳(メタデータ) (2025-11-03T15:04:23Z) - CultureScope: A Dimensional Lens for Probing Cultural Understanding in LLMs [57.653830744706305]
CultureScopeは、大規模な言語モデルにおける文化的理解を評価するための、これまでで最も包括的な評価フレームワークである。
文化的な氷山理論に触発されて、文化知識分類のための新しい次元スキーマを設計する。
実験結果から,文化的理解を効果的に評価できることが示唆された。
論文 参考訳(メタデータ) (2025-09-19T17:47:48Z) - CultureSynth: A Hierarchical Taxonomy-Guided and Retrieval-Augmented Framework for Cultural Question-Answer Synthesis [41.483432890962824]
本稿では,大規模言語モデルの文化的能力を評価する新しいフレームワークであるCulture Synthを紹介する。
Culture Synth-7ベンチマークには、7つの言語にまたがる19,360項目と4,149項目の検証済みエントリが含まれている。
論文 参考訳(メタデータ) (2025-09-13T16:33:56Z) - Beyond Chunking: Discourse-Aware Hierarchical Retrieval for Long Document Question Answering [51.7493726399073]
本稿では,長文質問応答を改善するための対話型階層型フレームワークを提案する。
このフレームワークには3つの重要な革新がある: 長文の専門的な談話解析、LLMに基づく談話関係ノードの拡張、構造誘導階層検索である。
論文 参考訳(メタデータ) (2025-05-26T14:45:12Z) - Leveraging Large Language Models for Semantic Query Processing in a Scholarly Knowledge Graph [1.7418328181959968]
本研究は,革新的なセマンティッククエリ処理システムを開発することを目的としている。
オーストラリア国立大学のコンピュータサイエンス(CS)研究者による研究成果に関する総合的な情報を得ることができる。
論文 参考訳(メタデータ) (2024-05-24T09:19:45Z) - CRAFT: Extracting and Tuning Cultural Instructions from the Wild [38.255242754975654]
本稿では,未構造化コーパスから高品質で文化的に関連のある命令チューニングデータセットを抽出するための新しいパイプラインを提案する。
自己指示生成パイプラインを用いて、文化的概念を特定し、指導をトリガーする。
シンガポール、フィリピン、アメリカという3つの地域で実験を行い、最大6%のパフォーマンス向上を実現しました。
論文 参考訳(メタデータ) (2024-05-06T03:21:55Z) - Massively Multi-Cultural Knowledge Acquisition & LM Benchmarking [48.21982147529661]
本稿では,多文化知識獲得のための新しいアプローチを提案する。
本手法は,文化トピックに関するウィキペディア文書からリンクページの広範囲なネットワークへ戦略的にナビゲートする。
私たちの仕事は、AIにおける文化的格差のギャップを深く理解し、橋渡しするための重要なステップです。
論文 参考訳(メタデータ) (2024-02-14T18:16:54Z) - Contextualization Distillation from Large Language Model for Knowledge
Graph Completion [51.126166442122546]
我々は、差別的かつ生成的なKGCフレームワークと互換性のあるプラグイン・アンド・プレイ方式であるContextualization Distillation戦略を導入する。
提案手法は,大規模言語モデルに対して,コンパクトで構造的な三重項を文脈に富んだセグメントに変換するように指示することから始まる。
多様なデータセットとKGC技術にわたる総合的な評価は、我々のアプローチの有効性と適応性を強調している。
論文 参考訳(メタデータ) (2024-01-28T08:56:49Z) - O-Dang! The Ontology of Dangerous Speech Messages [53.15616413153125]
O-Dang!:The Ontology of Dangerous Speech Messages, a systematic and interoperable Knowledge Graph (KG)
O-Dang!は、Lingguistic Linked Open Dataコミュニティで共有されている原則に従って、イタリアのデータセットを構造化されたKGにまとめ、整理するように設計されている。
ゴールド・スタンダードとシングル・アノテータのラベルをKGにエンコードするモデルを提供する。
論文 参考訳(メタデータ) (2022-07-13T11:50:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。