論文の概要: Subjective Assessments of Legibility in Ancient Manuscript Images -- The
SALAMI Dataset
- arxiv url: http://arxiv.org/abs/2102.09961v1
- Date: Fri, 19 Feb 2021 14:53:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-22 13:26:59.848221
- Title: Subjective Assessments of Legibility in Ancient Manuscript Images -- The
SALAMI Dataset
- Title(参考訳): 古代写本画像における可読性の主観的評価--SALAMIデータセット
- Authors: Simon Brenner and Robert Sablatnig
- Abstract要約: 古代写本画像(SALAMI)における可読性の主観的評価の新しいデータセットについて紹介する。
このデータセットは、平均可読性と不確実性の対応する空間マップを持つ50の原稿領域の250の画像で構成されています。
本研究は, その設計の有効性と信頼性, 得られた結果が統計的に動機づけられた最初の研究である。
- 参考スコア(独自算出の注目度): 1.5229257192293197
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The research field concerned with the digital restoration of degraded written
heritage lacks a quantitative metric for evaluating its results, which prevents
the comparison of relevant methods on large datasets. Thus, we introduce a
novel dataset of Subjective Assessments of Legibility in Ancient Manuscript
Images (SALAMI) to serve as a ground truth for the development of quantitative
evaluation metrics in the field of digital text restoration. This dataset
consists of 250 images of 50 manuscript regions with corresponding spatial maps
of mean legibility and uncertainty, which are based on a study conducted with
20 experts of philology and paleography. As this study is the first of its
kind, the validity and reliability of its design and the results obtained are
motivated statistically: we report a high intra- and inter-rater agreement and
show that the bulk of variation in the scores is introduced by the images
regions observed and not by controlled or uncontrolled properties of
participants and test environments, thus concluding that the legibility scores
measured are valid attributes of the underlying images.
- Abstract(参考訳): 劣化した文書のデジタル復元に関わる研究分野は、その結果を評価するための定量的指標を欠いているため、大規模なデータセットにおける関連する方法の比較が妨げられている。
そこで本稿では,デジタルテキスト復元の分野における定量的評価指標の開発のための基礎的真理として,SALAMI(Subjective Assessments of Legibility in Ancient Manuscript Images)を新たに導入する。
このデータセットは、文献学と古文献学の専門家20人による研究に基づいて、平均的適性と不確実性に対応する空間地図を持つ50の写本領域の250の画像で構成されている。
本研究は第1種であり, 設計の妥当性と信頼性は統計的に動機づけられる: 高い内部および層間合意を報告し, 被験者とテスト環境の制御・制御されていない特性によって観測された画像領域によって, スコアのばらつきが導入されることを示し, 測定された正当性スコアが基礎画像の有効属性であることを結論する。
関連論文リスト
- Affinity-Graph-Guided Contractive Learning for Pretext-Free Medical Image Segmentation with Minimal Annotation [55.325956390997]
本稿では,医用画像セグメンテーションのための親和性グラフ誘導半教師付きコントラスト学習フレームワーク(Semi-AGCL)を提案する。
このフレームワークは、まず、ロバストな初期特徴空間を提供する平均パッチエントロピー駆動のパッチ間サンプリング法を設計する。
完全アノテーションセットの10%に過ぎず, 完全注釈付きベースラインの精度にアプローチし, 限界偏差は2.52%に過ぎなかった。
論文 参考訳(メタデータ) (2024-10-14T10:44:47Z) - Handwritten Stenography Recognition and the LION Dataset [0.0]
Stenographic Domain Knowledgeは、4つの異なるエンコーディング手法を適用することで統合される。
テストエラー率は、ステントグラフィー固有のターゲットシーケンスエンコーディングと事前トレーニングと微調整を組み合わせることで大幅に低減される。
論文 参考訳(メタデータ) (2023-08-15T14:25:53Z) - Predicting beauty, liking, and aesthetic quality: A comparative analysis
of image databases for visual aesthetics research [0.0]
対象認識のために開発された畳み込みニューラルネットワークの層を, (A) 先行研究された20の統計画像特性の集合を用いて, 連続して評価を予測できるかを検討する。
以上の結果から,各データセットにおける審美評価の予測可能性に有意な変化が認められた。
意外なことに、統計的画像特性と畳み込みニューラルネットワークは、類似した精度で美的評価を予測し、この2つの手法が捉えた画像情報の顕著な重複を浮き彫りにした。
論文 参考訳(メタデータ) (2023-07-03T13:03:17Z) - MAUVE Scores for Generative Models: Theory and Practice [95.86006777961182]
本報告では,テキストや画像の生成モデルで発生するような分布のペア間の比較尺度であるMAUVEについて述べる。
我々は、MAUVEが人間の文章の分布と現代のニューラル言語モデルとのギャップを定量化できることを発見した。
我々は、MAUVEが既存のメトリクスと同等以上の画像の既知の特性を識別できることを視覚領域で実証する。
論文 参考訳(メタデータ) (2022-12-30T07:37:40Z) - TeTIm-Eval: a novel curated evaluation data set for comparing
text-to-image models [1.1252184947601962]
テキスト・ツー・イメージ・モデルの評価と比較は難しい問題です。
本稿では,<i>i>i>i>i>i>i>i>i>i>i>i</i>i>i>i>i>i>i>i>i>i>i</i>i>i>i>i>i>i>i>i>i</i>i>i>i>i</i>i>i>i>i>i>i>i</i>i>i>i>i>i>i</i>i>i>i>i>i>i>i>i>i>i>i>i>i>i>i>i>i>i>i>i>i>i>i>i>i</i>i>i>i>i</i>i>i>i</i>i>i>i</i>i>i</i>i>i</i>
初期の実験結果から,ヒト判定の精度はCLIPスコアと完全に一致していることが明らかとなった。
論文 参考訳(メタデータ) (2022-12-15T13:52:03Z) - Towards a Guideline for Evaluation Metrics in Medical Image Segmentation [0.0]
本研究は、医療画像分割評価のための以下の指標の概要と解釈ガイドを提供する。
要約として,標準化された医用画像分割評価のためのガイドラインを提案する。
論文 参考訳(メタデータ) (2022-02-10T13:38:05Z) - A new baseline for retinal vessel segmentation: Numerical identification
and correction of methodological inconsistencies affecting 100+ papers [0.0]
得られた性能スコアのコヒーレンスに関する詳細な数値解析を行った。
視野の使用に関する報告結果に矛盾が認められた。
これまでに達成された最高精度はFoV領域の0.9582であり、これは人間のアノテーションよりも1%高い。
論文 参考訳(メタデータ) (2021-11-06T11:09:11Z) - Reliable Evaluations for Natural Language Inference based on a Unified
Cross-dataset Benchmark [54.782397511033345]
クラウドソースの自然言語推論(NLI)データセットは、アノテーションアーティファクトのような重大なバイアスに悩まされる可能性がある。
14のNLIデータセットと9つの広く使用されているニューラルネットワークベースのNLIモデルを再評価した、新しいクロスデータセットベンチマークを提案する。
提案した評価手法と実験ベースラインは,将来信頼性の高いNLI研究を刺激する基盤となる可能性がある。
論文 参考訳(メタデータ) (2020-10-15T11:50:12Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z) - Unsupervised Learning of Landmarks based on Inter-Intra Subject
Consistencies [72.67344725725961]
本稿では,物体間ランドマーク成分を顔画像に組み込むことにより,画像ランドマーク発見のための教師なし学習手法を提案する。
これは、補助的な主題関連構造に基づいて、元の主題のランドマークを変換するオブジェクト間マッピングモジュールによって達成される。
変換された画像から元の被写体に戻るために、ランドマーク検出器は、対のオブジェクト内画像と対のオブジェクト間画像の両方に一貫した意味を含む空間的位置を学習せざるを得ない。
論文 参考訳(メタデータ) (2020-04-16T20:38:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。