論文の概要: Cultural Analytics for Good: Building Inclusive Evaluation Frameworks for Historical IR
- arxiv url: http://arxiv.org/abs/2601.11874v1
- Date: Sat, 17 Jan 2026 01:54:55 GMT
- ステータス: 情報取得中
- システム内更新日: 2026-01-21 12:31:12.807956
- Title: Cultural Analytics for Good: Building Inclusive Evaluation Frameworks for Historical IR
- Title(参考訳): 良いもののための文化的分析:歴史的IRのための包括的評価フレームワークの構築
- Authors: Suchana Datta, Dwaipayan Roy, Derek Greene, Gerardine Meaney, Karen Wade, Philipp Mayr,
- Abstract要約: この研究は、情報検索と文化的分析の分野を橋渡しし、歴史的知識への公平なアクセスを支援する。
The British Library BL19 digital collection, we construct a benchmark for studies in language, terminology and retrieve in the 19th century fiction and non-fiction。
- 参考スコア(独自算出の注目度): 6.217528366941651
- License:
- Abstract: This work bridges the fields of information retrieval and cultural analytics to support equitable access to historical knowledge. Using the British Library BL19 digital collection (more than 35,000 works from 1700-1899), we construct a benchmark for studying changes in language, terminology and retrieval in the 19th-century fiction and non-fiction. Our approach combines expert-driven query design, paragraph-level relevance annotation, and Large Language Model (LLM) assistance to create a scalable evaluation framework grounded in human expertise. We focus on knowledge transfer from fiction to non-fiction, investigating how narrative understanding and semantic richness in fiction can improve retrieval for scholarly and factual materials. This interdisciplinary framework not only improves retrieval accuracy but also fosters interpretability, transparency, and cultural inclusivity in digital archives. Our work provides both practical evaluation resources and a methodological paradigm for developing retrieval systems that support richer, historically aware engagement with digital archives, ultimately working towards more emancipatory knowledge infrastructures.
- Abstract(参考訳): この研究は、情報検索と文化的分析の分野を橋渡しし、歴史的知識への公平なアクセスを支援する。
英国図書館BL19デジタルコレクション(1700年から1899年までの35,000作品以上)を用いて、19世紀のフィクションやノンフィクションにおける言語、用語、検索の変化を研究するためのベンチマークを構築した。
我々のアプローチは、専門家主導のクエリ設計、段落レベルの関連アノテーション、およびLarge Language Model (LLM) の支援を組み合わせて、人間の専門知識に基づくスケーラブルな評価フレームワークを構築します。
我々は,フィクションからノンフィクションへの知識伝達に注目し,小説における物語的理解と意味的豊かさが,学術的・事実的資料の検索をいかに改善するかを考察する。
この学際的な枠組みは、検索精度を向上するだけでなく、デジタルアーカイブにおける解釈可能性、透明性、文化的傾向を促進する。
我々の研究は、デジタルアーカイブとのよりリッチで歴史的に認識された関わりを支援する検索システムを開発するための実践的評価資源と方法論パラダイムの両方を提供する。
関連論文リスト
- Knowledge Graphs Generation from Cultural Heritage Texts: Combining LLMs and Ontological Engineering for Scholarly Debates [0.3033221007650832]
本稿では,大規模言語モデルに基づく知識抽出のための体系的5段階手法であるATR4CHを紹介する。
本研究は,信頼性評価に関する議論のケーススタディを通じて,方法論の検証を行う。
ATR4CHは、文化遺産機関がテキスト知識をクエリ可能な知識グラフに体系的に変換することを可能にする。
論文 参考訳(メタデータ) (2025-11-13T14:29:51Z) - Retrieval-Augmented Generation for Natural Language Art Provenance Searches in the Getty Provenance Index [0.0]
本研究は,ゲティ・プロヴァンス・インデックスに焦点をあてて,芸術研究のための検索・拡張生成フレームワークを提案する。
先行研究は、真正性を検証し、再生と法的主張を支持し、美術品の文化的・歴史的文脈を理解するために不可欠な美術品の所有権の歴史を確立している。
本手法により,意味検索や文脈要約による自然言語・多言語検索が可能となり,メタデータ構造への依存を軽減できる。
論文 参考訳(メタデータ) (2025-08-26T14:58:09Z) - Beyond Chunking: Discourse-Aware Hierarchical Retrieval for Long Document Question Answering [51.7493726399073]
本稿では,長文質問応答を改善するための対話型階層型フレームワークを提案する。
このフレームワークには3つの重要な革新がある: 長文の専門的な談話解析、LLMに基づく談話関係ノードの拡張、構造誘導階層検索である。
論文 参考訳(メタデータ) (2025-05-26T14:45:12Z) - Time Travel: A Comprehensive Benchmark to Evaluate LMMs on Historical and Cultural Artifacts [65.90535970515266]
TimeTravelは、10つの主要な歴史的地域にわたる266の異なる文化にまたがる10,250のエキスパート認定サンプルのベンチマークである。
TimeTravelは、原稿、アートワーク、碑文、考古学的発見のAIによる分析のために設計されている。
我々は、TimeTravelで現代のAIモデルを評価し、その強みを強調し、改善すべき領域を特定する。
論文 参考訳(メタデータ) (2025-02-20T18:59:51Z) - Massively Multi-Cultural Knowledge Acquisition & LM Benchmarking [48.21982147529661]
本稿では,多文化知識獲得のための新しいアプローチを提案する。
本手法は,文化トピックに関するウィキペディア文書からリンクページの広範囲なネットワークへ戦略的にナビゲートする。
私たちの仕事は、AIにおける文化的格差のギャップを深く理解し、橋渡しするための重要なステップです。
論文 参考訳(メタデータ) (2024-02-14T18:16:54Z) - Curatr: A Platform for Semantic Analysis and Curation of Historical
Literary Texts [5.075506385456811]
本稿では,機械学習によるセマンティックサーチによる文献の探索とキュレーションを行うオンラインプラットフォームであるCuratrを提案する。
このプラットフォームは、ニューラルネットワークの埋め込みと専門家のドメイン知識を組み合わせて、セマティックレキシコンの生成を可能にする。
論文 参考訳(メタデータ) (2023-06-13T15:15:31Z) - Embedding Knowledge for Document Summarization: A Survey [66.76415502727802]
従来の研究は、知識を組み込んだ文書要約器が優れた消化器を生成するのに優れていたことを証明した。
本稿では,文書要約ビューに基づいて,知識と知識の埋め込みを再カプセル化する手法を提案する。
論文 参考訳(メタデータ) (2022-04-24T04:36:07Z) - A New Neural Search and Insights Platform for Navigating and Organizing
AI Research [56.65232007953311]
我々は、古典的なキーワード検索とニューラル検索を組み合わせた新しいプラットフォームであるAI Research Navigatorを導入し、関連する文献を発見し整理する。
本稿では,システム全体のアーキテクチャの概要と,文書分析,質問応答,検索,分析,専門家検索,レコメンデーションの構成要素について概説する。
論文 参考訳(メタデータ) (2020-10-30T19:12:25Z) - Ontologies in CLARIAH: Towards Interoperability in History, Language and
Media [0.05277024349608833]
デジタル人文科学の最も重要な目標の1つは、研究者に新しい研究質問のためのデータとツールを提供することである。
FAIRの原則は、データが必要な状態として、これらのフレームワークを提供する。 Findable は、さまざまなソースに散らばっているため、しばしば参照可能 アクセス可能 いくつかはオフラインやペイウォールの後方にあるかもしれない 相互運用可能 標準的な知識表現フォーマットを使用して、共有される。
オランダの国立プロジェクト CLARIAH に開発・統合されたツールについて述べる。
論文 参考訳(メタデータ) (2020-04-06T17:38:47Z) - Explaining Relationships Between Scientific Documents [55.23390424044378]
本稿では,2つの学術文書間の関係を自然言語テキストを用いて記述する課題に対処する。
本稿では154K文書から622Kサンプルのデータセットを作成する。
論文 参考訳(メタデータ) (2020-02-02T03:54:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。