論文の概要: Is Medieval Distant Viewing Possible? : Extending and Enriching Annotation of Legacy Image Collections using Visual Analytics
- arxiv url: http://arxiv.org/abs/2208.09657v2
- Date: Thu, 11 Apr 2024 12:25:45 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-12 19:46:03.450637
- Title: Is Medieval Distant Viewing Possible? : Extending and Enriching Annotation of Legacy Image Collections using Visual Analytics
- Title(参考訳): 中世遠隔視は可能か? : 視覚分析によるレガシー画像のアノテーションの拡張と強化
- Authors: Christofer Meinecke, Estelle Guéville, David Joseph Wrisley, Stefan Jänicke,
- Abstract要約: 本稿では,相反するメタデータと重複するメタデータを示す2つの注釈付き中世の写本画像について述べる。
統合データセットの"ブリッジ"として機能する,より均一なラベルセットを作ることを目標としています。
ビジュアルインターフェースは、メタデータの総合計を超えるデータ間の関係について、専門家に概要を提供する。
- 参考スコア(独自算出の注目度): 3.89394670917253
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Distant viewing approaches have typically used image datasets close to the contemporary image data used to train machine learning models. To work with images from other historical periods requires expert annotated data, and the quality of labels is crucial for the quality of results. Especially when working with cultural heritage collections that contain myriad uncertainties, annotating data, or re-annotating, legacy data is an arduous task. In this paper, we describe working with two pre-annotated sets of medieval manuscript images that exhibit conflicting and overlapping metadata. Since a manual reconciliation of the two legacy ontologies would be very expensive, we aim (1) to create a more uniform set of descriptive labels to serve as a "bridge" in the combined dataset, and (2) to establish a high quality hierarchical classification that can be used as a valuable input for subsequent supervised machine learning. To achieve these goals, we developed visualization and interaction mechanisms, enabling medievalists to combine, regularize and extend the vocabulary used to describe these, and other cognate, image datasets. The visual interfaces provide experts an overview of relationships in the data going beyond the sum total of the metadata. Word and image embeddings as well as co-occurrences of labels across the datasets, enable batch re-annotation of images, recommendation of label candidates and support composing a hierarchical classification of labels.
- Abstract(参考訳): 遠隔観察アプローチは一般的に、機械学習モデルのトレーニングに使用される現代の画像データに近いイメージデータセットを使用している。
他の歴史的時代の画像を扱うためには、専門家による注釈付きデータが必要であり、ラベルの品質は結果の品質に不可欠である。
特に、無数の不確実性、アノテートデータ、あるいは再アノテートを含む文化遺産コレクションを扱う場合、レガシーデータは困難な作業である。
本稿では,相反するメタデータと重複するメタデータを示す2つの注釈付き中世写本画像について述べる。
従来の2つのオントロジを手作業で調整する作業は非常にコストがかかるため,(1)統合データセットのブリッジとして機能する,より均一な記述ラベルセットを作成すること,(2)その後の教師付き機械学習の貴重な入力として使用できる高品質な階層分類を確立すること,などが目的である。
これらの目的を達成するために、中世の学者がこれらを記述するのに使用される語彙と、その他の共生的な画像データセットを組み合わせて、規則化し、拡張できる可視化と相互作用機構を開発した。
ビジュアルインターフェースは、メタデータの総和を超えるデータ間の関係について、専門家に概要を提供する。
単語と画像の埋め込みとデータセット間のラベルの共起、画像のバッチ再アノテーション、ラベル候補の推薦、ラベルの階層的な分類の構成のサポート。
関連論文リスト
- Semi-Supervised Image Captioning by Adversarially Propagating Labeled
Data [95.0476489266988]
本稿では、画像キャプションモデルの一般化を改善するための、新しいデータ効率半教師付きフレームワークを提案する。
提案手法は,キャプタにペアデータから学習し,段階的に未ペアデータの関連付けを行うよう訓練する。
1)画像ベースと(2)高密度領域ベースキャプションデータセットの両方を総合的かつ包括的な実験結果とし,それに続いて,少ないペアリングデータセットの包括的分析を行った。
論文 参考訳(メタデータ) (2023-01-26T15:25:43Z) - Is one annotation enough? A data-centric image classification benchmark
for noisy and ambiguous label estimation [2.2807344448218503]
実世界の9つのデータセットと1つの画像に複数のアノテーションを付加した,データ中心の画像分類ベンチマークを提案する。
複数のアノテーションが実際のクラス分布をよりよく近似できることを示す。
ハードラベルはデータのあいまいさを捉えることができず、これは過信モデルの一般的な問題につながる可能性がある。
論文 参考訳(メタデータ) (2022-07-13T14:17:21Z) - Boosting Entity-aware Image Captioning with Multi-modal Knowledge Graph [96.95815946327079]
名前付きエンティティの長期分布により、名前付きエンティティと視覚的キューの関係を学習することは困難である。
本稿では、視覚オブジェクトと名前付きエンティティを関連付けるために、マルチモーダルな知識グラフを構築する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2021-07-26T05:50:41Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z) - Grafit: Learning fine-grained image representations with coarse labels [114.17782143848315]
本稿では,学習ラベルの提供するものよりも細かな表現を学習する問題に対処する。
粗いラベルと下層の細粒度潜在空間を併用することにより、カテゴリレベルの検索手法の精度を大幅に向上させる。
論文 参考訳(メタデータ) (2020-11-25T19:06:26Z) - Multi-label Zero-shot Classification by Learning to Transfer from
External Knowledge [36.04579549557464]
マルチラベルゼロショット分類は、入力画像に対する複数の未知のクラスラベルを予測することを目的としている。
本稿では,外部知識の伝達を学習することで,新たなゼロショット分類フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-30T17:26:46Z) - Hierarchical Image Classification using Entailment Cone Embeddings [68.82490011036263]
まずラベル階層の知識を任意のCNNベースの分類器に注入する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の利用が全体的な性能を高めることを実証的に示す。
論文 参考訳(メタデータ) (2020-04-02T10:22:02Z) - Learning Representations For Images With Hierarchical Labels [1.3579420996461438]
クラスラベルによって誘導されるセマンティック階層に関する情報を活用するための一連の手法を提案する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の提供により、全体的な性能が向上することを示す。
しかし,CNN分類器には階層的な情報が注入され,組込みベースモデルでは,新たに提示された実世界ETHエコロジーコレクションイメージデータセットの階層非依存モデルよりも優れていた。
論文 参考訳(メタデータ) (2020-04-02T09:56:03Z) - Collaborative Learning of Semi-Supervised Clustering and Classification
for Labeling Uncurated Data [6.871887763122593]
ドメイン固有のイメージコレクションは、科学とビジネスの様々な領域において潜在的な価値を示す。
このような画像データに同時代の教師付き画像解析手法を採用するには、まずクリーン化と整理を行い、次に特定のドメインで使用される命名書に手動でラベル付けする必要がある。
我々はPludシステムの設計と実装を行い、専門家が費やした労力を最小限に抑え、現実的な大量の画像の収集を処理した。
論文 参考訳(メタデータ) (2020-03-09T17:03:05Z) - Automatically Discovering and Learning New Visual Categories with
Ranking Statistics [145.89790963544314]
我々は,他のクラスをラベル付けした画像コレクションにおいて,新しいクラスを発見する問題に対処する。
汎用クラスタリングモデルを学び、後者を用いて、非競合データ中の新しいクラスを識別する。
我々は,標準分類ベンチマークに対するアプローチと,新しいカテゴリー発見法の性能を,有意なマージンで評価した。
論文 参考訳(メタデータ) (2020-02-13T18:53:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。