論文の概要: A Dataset for Named Entity Recognition and Relation Extraction from Art-historical Image Descriptions
- arxiv url: http://arxiv.org/abs/2602.19133v1
- Date: Sun, 22 Feb 2026 11:29:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.496914
- Title: A Dataset for Named Entity Recognition and Relation Extraction from Art-historical Image Descriptions
- Title(参考訳): 美術史的画像記述から名前付きエンティティ認識と関係抽出のためのデータセット
- Authors: Stefanie Schneider, Miriam Göldl, Julian Stalter, Ricarda Vollmer,
- Abstract要約: FRAMEは、名前付きエンティティ認識(NER)と関係抽出(RE)のための、手動で注釈付き歴史画像記述データセットである。
博物館のカタログ、オークションの一覧、オープンアクセスプラットフォーム、学術データベースから説明が集められた。
データセットはUIMA XMI Common Analysis Structure (CAS)ファイルとしてリリースされ、画像とメタデータが添付されている。
- 参考スコア(独自算出の注目度): 0.379152625956354
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces FRAME (Fine-grained Recognition of Art-historical Metadata and Entities), a manually annotated dataset of art-historical image descriptions for Named Entity Recognition (NER) and Relation Extraction (RE). Descriptions were collected from museum catalogs, auction listings, open-access platforms, and scholarly databases, then filtered to ensure that each text focuses on a single artwork and contains explicit statements about its material, composition, or iconography. FRAME provides stand-off annotations in three layers: a metadata layer for object-level properties, a content layer for depicted subjects and motifs, and a co-reference layer linking repeated mentions. Across layers, entity spans are labeled with 37 types and connected by typed RE links between mentions. Entity types are aligned with Wikidata to support Named Entity Linking (NEL) and downstream knowledge-graph construction. The dataset is released as UIMA XMI Common Analysis Structure (CAS) files with accompanying images and bibliographic metadata, and can be used to benchmark and fine-tune NER and RE systems, including zero- and few-shot setups with Large Language Models (LLMs).
- Abstract(参考訳): 本稿では,名前付きエンティティ認識 (NER) と関係抽出 (RE) のための手動注釈付き画像記述データセット FRAME (Fine-fine Recognition of Art-historical Metadata and Entities) を紹介する。
博物館のカタログ、オークションリスト、オープンアクセスプラットフォーム、学術データベースから説明が収集され、各テキストが単一のアートワークに焦点を合わせ、その素材、構成、イコノグラフィーに関する明示的な記述を含むようにフィルタリングされた。
FRAMEは3つのレイヤにスタンドオフアノテーションを提供する。オブジェクトレベルのプロパティのメタデータ層、描写対象とモチーフのコンテンツ層、繰り返し言及をリンクする参照層である。
レイヤ全体で、エンティティスパンは37の型でラベル付けされ、参照間の型付きREリンクで接続される。
エンティティ型はWikidataと整列して、Nel(Named Entity Linking)と下流のナレッジグラフ構造をサポートする。
データセットはUIMA XMI Common Analysis Structure (CAS)ファイルとしてリリースされ、画像と書誌メタデータが添付されている。
関連論文リスト
- A Sketch+Text Composed Image Retrieval Dataset for Thangka [14.600552992453977]
Composed Image Retrieval (CIR)は、複数のクエリーモダリティを組み合わせることで画像検索を可能にする。
CIRThanは、Thangkaイメージ用のスケッチ+テキストコンポジションイメージ検索データセットである。
論文 参考訳(メタデータ) (2026-02-09T09:14:29Z) - Hypergraph based Understanding for Document Semantic Entity Recognition [65.84258776834524]
我々は,ハイパグラフアテンションを利用したハイパグラフアテンション文書セマンティックエンティティ認識フレームワークHGAを構築し,エンティティ境界とエンティティカテゴリを同時に重視する。
FUNSD, CORD, XFUNDIE で得られた結果は,本手法が意味的エンティティ認識タスクの性能を効果的に向上できることを示す。
論文 参考訳(メタデータ) (2024-07-09T14:35:49Z) - EUFCC-340K: A Faceted Hierarchical Dataset for Metadata Annotation in GLAM Collections [6.723689308768857]
EUFCC340Kデータセットは、AAT(Art & Architecture Thesaurus)に基づいた階層構造に従って、材料、オブジェクトタイプ、ディシプリエンス、主題という、複数の面にまたがって構成されている。
2つの異なるテストシナリオにおけるモデルロバスト性および一般化能力の評価実験は、マルチラベル分類ツールの改善におけるデータセットの有用性を実証する。
論文 参考訳(メタデータ) (2024-06-04T14:57:56Z) - Knowledge-Enhanced Dual-stream Zero-shot Composed Image Retrieval [53.89454443114146]
本研究では,ゼロショット合成画像検索タスク(ZS-CIR)について検討した。
従来の作品では、参照画像の特徴をテキスト埋め込み空間に投影することで、擬似ワードトークンを生成する。
知識強化型デュアルストリームゼロショット合成画像検索フレームワーク(KEDs)を提案する。
KEDはデータベースを組み込むことで、参照画像の属性を暗黙的にモデル化する。
論文 参考訳(メタデータ) (2024-03-24T04:23:56Z) - DocumentNet: Bridging the Data Gap in Document Pre-Training [78.01647768018485]
本稿では,Webから大規模かつ弱いラベル付きデータを収集し,VDERモデルの学習に役立てる手法を提案する。
収集されたデータセットはDocumentNetと呼ばれ、特定のドキュメントタイプやエンティティセットに依存しない。
広く採用されているVDERタスクの実験は、DocumentNetを事前トレーニングに組み込んだ場合、大幅に改善されている。
論文 参考訳(メタデータ) (2023-06-15T08:21:15Z) - Is Medieval Distant Viewing Possible? : Extending and Enriching Annotation of Legacy Image Collections using Visual Analytics [3.89394670917253]
本稿では,相反するメタデータと重複するメタデータを示す2つの注釈付き中世の写本画像について述べる。
統合データセットの"ブリッジ"として機能する,より均一なラベルセットを作ることを目標としています。
ビジュアルインターフェースは、メタデータの総合計を超えるデータ間の関係について、専門家に概要を提供する。
論文 参考訳(メタデータ) (2022-08-20T10:59:33Z) - Boosting Entity-aware Image Captioning with Multi-modal Knowledge Graph [96.95815946327079]
名前付きエンティティの長期分布により、名前付きエンティティと視覚的キューの関係を学習することは困難である。
本稿では、視覚オブジェクトと名前付きエンティティを関連付けるために、マルチモーダルな知識グラフを構築する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2021-07-26T05:50:41Z) - Document-level Relation Extraction as Semantic Segmentation [38.614931876015625]
文書レベルの関係抽出は、文書から複数のエンティティペア間の関係を抽出することを目的としている。
本稿では,局所的およびグローバルな情報を取得するために,エンティティレベルの関係行列を予測することで,この問題に対処する。
文書レベルの関係抽出のための文書U字型ネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-07T13:44:44Z) - Learning to Infer Unseen Single-/Multi-Attribute-Object Compositions with Graph Networks [47.43595942156663]
本稿では,複雑な関係を学習するための属性オブジェクト意味関連グラフモデルを提案する。
属性とオブジェクトを表すノードでは、グラフは柔軟に構築でき、単一の属性と複数属性オブジェクトの合成認識を実現する。
論文 参考訳(メタデータ) (2020-10-27T14:57:35Z) - DART: Open-Domain Structured Data Record to Text Generation [91.23798751437835]
82k以上のインスタンス(DART)を持つオープンドメイン構造化DAta Record to Text生成データセットであるDARTを提案する。
本稿では,テーブルヘッダとテーブルタイトル間の意味的依存関係を利用して,その構造を符号化するテーブルから意味的三重項を抽出する手法を提案する。
我々のデータセット構築フレームワークは、オープンドメイン意味解析と対話行動に基づく意味表現タスクからヘテロジニアスソースを効果的に統合する。
論文 参考訳(メタデータ) (2020-07-06T16:35:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。