論文の概要: Stylometry for Noisy Medieval Data: Evaluating Paul Meyer's Hagiographic
Hypothesis
- arxiv url: http://arxiv.org/abs/2012.03845v1
- Date: Mon, 7 Dec 2020 16:48:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-16 21:30:33.052086
- Title: Stylometry for Noisy Medieval Data: Evaluating Paul Meyer's Hagiographic
Hypothesis
- Title(参考訳): 騒々しい中世データのためのスティロメトリ:Paul Meyerのハジノグラフィー仮説の評価
- Authors: Jean-Baptiste Camps, Thibault Cl\'erice, Ariane Pinche
- Abstract要約: MS BnF, frに含まれるハギグラフィ作品の場合に適用される手書きテキスト認識とスタイロメトリック解析を組み合わせたワークフローを使用します。
412.
我々は、パウル・マイヤー(Paul Meyer)の著作群の構成に関する仮説を評価し、非常に匿名なコーパスにおける潜在的権威的グループ化を検討することを目的とする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stylometric analysis of medieval vernacular texts is still a significant
challenge: the importance of scribal variation, be it spelling or more
substantial, as well as the variants and errors introduced in the tradition,
complicate the task of the would-be stylometrist. Basing the analysis on the
study of the copy from a single hand of several texts can partially mitigate
these issues (Camps and Cafiero, 2013), but the limited availability of
complete diplomatic transcriptions might make this difficult. In this paper, we
use a workflow combining handwritten text recognition and stylometric analysis,
applied to the case of the hagiographic works contained in MS BnF, fr. 412. We
seek to evaluate Paul Meyer's hypothesis about the constitution of groups of
hagiographic works, as well as to examine potential authorial groupings in a
vastly anonymous corpus.
- Abstract(参考訳): 中世の語彙テキストのスティロメトリクス分析は、スペルやより実質的なスクラベ変化の重要性に加えて、伝統に導入された変種や誤りが、スケロメトリストの仕事を複雑にするなど、依然として重要な課題である。
いくつかのテキストの1つの手からコピーを解析することにより、これらの問題を部分的に軽減することができる(Camps and Cafiero, 2013)。
本稿では,ms bnf, frに含まれるハギグラフ作品に対して,手書き文字認識とスタイロメトリ解析を組み合わせたワークフローを提案する。
412.
我々は、ポール・マイヤーの著作群の構成に関する仮説を評価し、非常に匿名なコーパスにおける潜在的権威的グループ化を検討する。
関連論文リスト
- A Bayesian Approach to Harnessing the Power of LLMs in Authorship Attribution [57.309390098903]
著者の属性は、文書の起源または著者を特定することを目的としている。
大きな言語モデル(LLM)とその深い推論能力と長距離テキストアソシエーションを維持する能力は、有望な代替手段を提供する。
IMDbおよびブログデータセットを用いた結果, 著者10名を対象に, 著者1名に対して, 85%の精度が得られた。
論文 参考訳(メタデータ) (2024-10-29T04:14:23Z) - Paired Completion: Flexible Quantification of Issue-framing at Scale with LLMs [0.41436032949434404]
我々は,大規模なテキストデータセット内の問題フレーミングと物語分析のための新しい検出手法を開発し,厳密に評価する。
問題フレーミングは大きなコーパスにおいて, 与えられた問題に対して, いずれの視点でも, 確実に, 効率的に検出できることを示す。
論文 参考訳(メタデータ) (2024-08-19T07:14:15Z) - Impact of Ground Truth Quality on Handwriting Recognition [0.5328877196581558]
ブルリンジャーのデータベースには、主に近代以前のドイツ語とラテン語のテキストの1万以上のラベル付きテキストラインイメージが含まれている。
本稿では,そのような誤りがトレーニングや評価に与える影響を調査し,典型的なアライメント誤りを検出し,修正する手段を提案する。
論文 参考訳(メタデータ) (2023-12-14T15:36:41Z) - The Learnable Typewriter: A Generative Approach to Text Analysis [17.355857281085164]
テキスト行中の文字解析と認識に対する生成文書固有のアプローチを提案する。
同様のフォントや手書きのテキスト行を入力として、我々のアプローチは多数の異なる文字を学習することができる。
論文 参考訳(メタデータ) (2023-02-03T11:17:59Z) - PART: Pre-trained Authorship Representation Transformer [64.78260098263489]
文書を書く著者は、語彙、レジストリ、句読点、ミススペル、絵文字の使用など、テキスト内での識別情報をインプリントする。
以前の作品では、手作りのフィーチャや分類タスクを使用して著者モデルをトレーニングし、ドメイン外の著者に対するパフォーマンスの低下につながった。
セマンティクスの代わりにtextbfauthorship の埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - TFW2V: An Enhanced Document Similarity Method for the Morphologically
Rich Finnish Language [0.5801044612920816]
本研究は,形態学的に豊かな言語であるフィンランド語に対する現在のアプローチの実験に焦点をあてる。
本稿では,長文文書と限られた量のデータの両方を扱う上で,高い効率性を示す簡易な方法TFW2Vを提案する。
論文 参考訳(メタデータ) (2021-12-23T12:27:45Z) - Image Collation: Matching illustrations in manuscripts [76.21388548732284]
図形照合の課題と,大規模な注釈付き公開データセットを導入して,ソリューションの評価を行う。
本研究は,本課題における美術類似度測定の実態を分析し,簡単な場合では成功したが,大規模な写本に苦慮していることを示す。
サイクル一貫性の対応を利用して,大幅な性能向上が期待できることを示す。
論文 参考訳(メタデータ) (2021-08-18T12:12:14Z) - Toward the Understanding of Deep Text Matching Models for Information
Retrieval [72.72380690535766]
本稿では,既存の深層テキストマッチング手法が情報検索の基本的な勾配を満たすかどうかを検証することを目的とする。
具体的には, 項周波数制約, 項識別制約, 長さ正規化制約, TF長制約の4つの属性を用いる。
LETOR 4.0 と MS Marco の実験結果から,研究対象の深層テキストマッチング手法はすべて,統計学において高い確率で上記の制約を満たすことが示された。
論文 参考訳(メタデータ) (2021-08-16T13:33:15Z) - Pareto Probing: Trading Off Accuracy for Complexity [87.09294772742737]
我々は,プローブの複雑性と性能の基本的なトレードオフを反映したプローブ計量について論じる。
係り受け解析による実験により,文脈表現と非文脈表現の統語的知識の幅広いギャップが明らかとなった。
論文 参考訳(メタデータ) (2020-10-05T17:27:31Z) - Generalized Word Shift Graphs: A Method for Visualizing and Explaining
Pairwise Comparisons Between Texts [0.15833270109954134]
計算テキスト分析における一般的な課題は、2つのコーパスが単語頻度、感情、情報内容などの測定によってどのように異なるかを定量化することである。
一般化された単語シフトグラフを導入し、個々の単語が2つのテキスト間の変動にどのように貢献するかを意味的かつ解釈可能な要約を生成する。
このフレームワークは、相対周波数、辞書スコア、Kulback-LeiblerやJensen-Shannonの発散といったエントロピーに基づく測度など、テキストの比較によく使われる多くのアプローチを自然に含んでいることを示す。
論文 参考訳(メタデータ) (2020-08-05T17:27:11Z) - A computational model implementing subjectivity with the 'Room Theory'.
The case of detecting Emotion from Text [68.8204255655161]
本研究は,テキスト分析における主観性と一般的文脈依存性を考慮した新しい手法を提案する。
単語間の類似度を用いて、ベンチマーク中の要素の相対的関連性を抽出することができる。
この方法は、主観的評価がテキストの相対値や意味を理解するために関係しているすべてのケースに適用できる。
論文 参考訳(メタデータ) (2020-05-12T21:26:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。