論文の概要: Stylometry for Noisy Medieval Data: Evaluating Paul Meyer's Hagiographic
Hypothesis
- arxiv url: http://arxiv.org/abs/2012.03845v1
- Date: Mon, 7 Dec 2020 16:48:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-16 21:30:33.052086
- Title: Stylometry for Noisy Medieval Data: Evaluating Paul Meyer's Hagiographic
Hypothesis
- Title(参考訳): 騒々しい中世データのためのスティロメトリ:Paul Meyerのハジノグラフィー仮説の評価
- Authors: Jean-Baptiste Camps, Thibault Cl\'erice, Ariane Pinche
- Abstract要約: MS BnF, frに含まれるハギグラフィ作品の場合に適用される手書きテキスト認識とスタイロメトリック解析を組み合わせたワークフローを使用します。
412.
我々は、パウル・マイヤー(Paul Meyer)の著作群の構成に関する仮説を評価し、非常に匿名なコーパスにおける潜在的権威的グループ化を検討することを目的とする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stylometric analysis of medieval vernacular texts is still a significant
challenge: the importance of scribal variation, be it spelling or more
substantial, as well as the variants and errors introduced in the tradition,
complicate the task of the would-be stylometrist. Basing the analysis on the
study of the copy from a single hand of several texts can partially mitigate
these issues (Camps and Cafiero, 2013), but the limited availability of
complete diplomatic transcriptions might make this difficult. In this paper, we
use a workflow combining handwritten text recognition and stylometric analysis,
applied to the case of the hagiographic works contained in MS BnF, fr. 412. We
seek to evaluate Paul Meyer's hypothesis about the constitution of groups of
hagiographic works, as well as to examine potential authorial groupings in a
vastly anonymous corpus.
- Abstract(参考訳): 中世の語彙テキストのスティロメトリクス分析は、スペルやより実質的なスクラベ変化の重要性に加えて、伝統に導入された変種や誤りが、スケロメトリストの仕事を複雑にするなど、依然として重要な課題である。
いくつかのテキストの1つの手からコピーを解析することにより、これらの問題を部分的に軽減することができる(Camps and Cafiero, 2013)。
本稿では,ms bnf, frに含まれるハギグラフ作品に対して,手書き文字認識とスタイロメトリ解析を組み合わせたワークフローを提案する。
412.
我々は、ポール・マイヤーの著作群の構成に関する仮説を評価し、非常に匿名なコーパスにおける潜在的権威的グループ化を検討する。
関連論文リスト
- Impact of Ground Truth Quality on Handwriting Recognition [0.5328877196581558]
ブルリンジャーのデータベースには、主に近代以前のドイツ語とラテン語のテキストの1万以上のラベル付きテキストラインイメージが含まれている。
本稿では,そのような誤りがトレーニングや評価に与える影響を調査し,典型的なアライメント誤りを検出し,修正する手段を提案する。
論文 参考訳(メタデータ) (2023-12-14T15:36:41Z) - The Learnable Typewriter: A Generative Approach to Text Analysis [17.355857281085164]
テキスト行中の文字解析と認識に対する生成文書固有のアプローチを提案する。
同様のフォントや手書きのテキスト行を入力として、我々のアプローチは多数の異なる文字を学習することができる。
論文 参考訳(メタデータ) (2023-02-03T11:17:59Z) - Writer Retrieval and Writer Identification in Greek Papyri [4.44566870214758]
著者識別は、既知の著者の分類であり、著者検索は、画像のデータセットにおける画像の類似性によって、著者を見つけようとする。
自動書き手識別・検索手法はすでに多くの歴史的文書タイプに対して有望な結果を提供しているが,繊維構造や重度アーティファクトのため,パピリデータは非常に困難である。
そこで本研究では,パピリ文字における書き手識別の改善に,優れたバイナライゼーションが重要であることを示す。
論文 参考訳(メタデータ) (2022-12-15T08:42:25Z) - PART: Pre-trained Authorship Representation Transformer [64.78260098263489]
文書を書く著者は、語彙、レジストリ、句読点、ミススペル、絵文字の使用など、テキスト内での識別情報をインプリントする。
以前の作品では、手作りのフィーチャや分類タスクを使用して著者モデルをトレーニングし、ドメイン外の著者に対するパフォーマンスの低下につながった。
セマンティクスの代わりにtextbfauthorship の埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - TFW2V: An Enhanced Document Similarity Method for the Morphologically
Rich Finnish Language [0.5801044612920816]
本研究は,形態学的に豊かな言語であるフィンランド語に対する現在のアプローチの実験に焦点をあてる。
本稿では,長文文書と限られた量のデータの両方を扱う上で,高い効率性を示す簡易な方法TFW2Vを提案する。
論文 参考訳(メタデータ) (2021-12-23T12:27:45Z) - Image Collation: Matching illustrations in manuscripts [76.21388548732284]
図形照合の課題と,大規模な注釈付き公開データセットを導入して,ソリューションの評価を行う。
本研究は,本課題における美術類似度測定の実態を分析し,簡単な場合では成功したが,大規模な写本に苦慮していることを示す。
サイクル一貫性の対応を利用して,大幅な性能向上が期待できることを示す。
論文 参考訳(メタデータ) (2021-08-18T12:12:14Z) - Toward the Understanding of Deep Text Matching Models for Information
Retrieval [72.72380690535766]
本稿では,既存の深層テキストマッチング手法が情報検索の基本的な勾配を満たすかどうかを検証することを目的とする。
具体的には, 項周波数制約, 項識別制約, 長さ正規化制約, TF長制約の4つの属性を用いる。
LETOR 4.0 と MS Marco の実験結果から,研究対象の深層テキストマッチング手法はすべて,統計学において高い確率で上記の制約を満たすことが示された。
論文 参考訳(メタデータ) (2021-08-16T13:33:15Z) - Comprehensive Studies for Arbitrary-shape Scene Text Detection [78.50639779134944]
ボトムアップに基づくシーンテキスト検出のための統合フレームワークを提案する。
統一されたフレームワークの下では、非コアモジュールの一貫性のある設定が保証されます。
包括的調査と精巧な分析により、以前のモデルの利点と欠点を明らかにしている。
論文 参考訳(メタデータ) (2021-07-25T13:18:55Z) - Pareto Probing: Trading Off Accuracy for Complexity [87.09294772742737]
我々は,プローブの複雑性と性能の基本的なトレードオフを反映したプローブ計量について論じる。
係り受け解析による実験により,文脈表現と非文脈表現の統語的知識の幅広いギャップが明らかとなった。
論文 参考訳(メタデータ) (2020-10-05T17:27:31Z) - Generalized Word Shift Graphs: A Method for Visualizing and Explaining
Pairwise Comparisons Between Texts [0.15833270109954134]
計算テキスト分析における一般的な課題は、2つのコーパスが単語頻度、感情、情報内容などの測定によってどのように異なるかを定量化することである。
一般化された単語シフトグラフを導入し、個々の単語が2つのテキスト間の変動にどのように貢献するかを意味的かつ解釈可能な要約を生成する。
このフレームワークは、相対周波数、辞書スコア、Kulback-LeiblerやJensen-Shannonの発散といったエントロピーに基づく測度など、テキストの比較によく使われる多くのアプローチを自然に含んでいることを示す。
論文 参考訳(メタデータ) (2020-08-05T17:27:11Z) - A computational model implementing subjectivity with the 'Room Theory'.
The case of detecting Emotion from Text [68.8204255655161]
本研究は,テキスト分析における主観性と一般的文脈依存性を考慮した新しい手法を提案する。
単語間の類似度を用いて、ベンチマーク中の要素の相対的関連性を抽出することができる。
この方法は、主観的評価がテキストの相対値や意味を理解するために関係しているすべてのケースに適用できる。
論文 参考訳(メタデータ) (2020-05-12T21:26:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。