Fugu-MT 論文翻訳(概要): Stylometry for Noisy Medieval Data: Evaluating Paul Meyer's Hagiographic Hypothesis

論文の概要: Stylometry for Noisy Medieval Data: Evaluating Paul Meyer's Hagiographic Hypothesis

arxiv url: http://arxiv.org/abs/2012.03845v1
Date: Mon, 7 Dec 2020 16:48:34 GMT
ステータス: 翻訳完了
システム内更新日: 2021-05-16 21:30:33.052086
Title: Stylometry for Noisy Medieval Data: Evaluating Paul Meyer's Hagiographic Hypothesis
Title（参考訳）: 騒々しい中世データのためのスティロメトリ:Paul Meyerのハジノグラフィー仮説の評価
Authors: Jean-Baptiste Camps, Thibault Cl\'erice, Ariane Pinche
Abstract要約: MS BnF, frに含まれるハギグラフィ作品の場合に適用される手書きテキスト認識とスタイロメトリック解析を組み合わせたワークフローを使用します。 412. 我々は、パウル・マイヤー(Paul Meyer)の著作群の構成に関する仮説を評価し、非常に匿名なコーパスにおける潜在的権威的グループ化を検討することを目的とする。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Stylometric analysis of medieval vernacular texts is still a significant challenge: the importance of scribal variation, be it spelling or more substantial, as well as the variants and errors introduced in the tradition, complicate the task of the would-be stylometrist. Basing the analysis on the study of the copy from a single hand of several texts can partially mitigate these issues (Camps and Cafiero, 2013), but the limited availability of complete diplomatic transcriptions might make this difficult. In this paper, we use a workflow combining handwritten text recognition and stylometric analysis, applied to the case of the hagiographic works contained in MS BnF, fr. 412. We seek to evaluate Paul Meyer's hypothesis about the constitution of groups of hagiographic works, as well as to examine potential authorial groupings in a vastly anonymous corpus.
Abstract（参考訳）: 中世の語彙テキストのスティロメトリクス分析は、スペルやより実質的なスクラベ変化の重要性に加えて、伝統に導入された変種や誤りが、スケロメトリストの仕事を複雑にするなど、依然として重要な課題である。いくつかのテキストの1つの手からコピーを解析することにより、これらの問題を部分的に軽減することができる(Camps and Cafiero, 2013)。本稿では,ms bnf, frに含まれるハギグラフ作品に対して,手書き文字認識とスタイロメトリ解析を組み合わせたワークフローを提案する。 412. 我々は、ポール・マイヤーの著作群の構成に関する仮説を評価し、非常に匿名なコーパスにおける潜在的権威的グループ化を検討する。

関連論文リスト

StegoStylo: Squelching Stylometric Scrutiny through Steganographic Stitching [0.0]
スティロメトリーは、著作権と盗作に関する調査を支援し、有害なコンテンツの検出を支援し、文学作品の歴史的文脈を提供する。スティロメトリは著者認証のツールとして使われ、主張された著者から本質的なテキストが生まれるかどうかを確認する。本稿では, ステガノグラフィーと対角的スタイメトリーを併用することにより, テガノグラフィーと対角的スタイメトリー分析を両立させる方法について検討する。
論文参考訳（メタデータ） (2026-01-14T00:49:20Z)
Making Characters Count. A Computational Approach to Scribal Profiling in 14th-Century Middle Dutch Manuscripts from the Carthusian Monastery of Herne [0.0]
ヘルネのカルタゴの修道院は14世紀後半に高品質な写本を製作した。過去の研究では、古生物学とコーディックロジーに基づいて、13の異なる頭蓋骨を区別している。テキストの言語特性のレンズを通してこの仮説を再検討し, 頭蓋骨プロファイリングの分野からの計算手法を用いた。
論文参考訳（メタデータ） (2025-08-26T08:20:40Z)
The Medium Is Not the Message: Deconfounding Text Embeddings via Linear Concept Erasure [91.01653854955286]
埋め込みベースの類似度メトリクスは、テキストのソースや言語のような刺激的な属性に影響される可能性がある。本稿では,エンコーダ表現から観測された共同創設者に関する情報を除去するデバイアスアルゴリズムにより,これらのバイアスを最小の計算コストで大幅に低減することを示す。
論文参考訳（メタデータ） (2025-07-01T23:17:12Z)
A Bayesian Approach to Harnessing the Power of LLMs in Authorship Attribution [57.309390098903]
著者の属性は、文書の起源または著者を特定することを目的としている。大きな言語モデル(LLM)とその深い推論能力と長距離テキストアソシエーションを維持する能力は、有望な代替手段を提供する。 IMDbおよびブログデータセットを用いた結果, 著者10名を対象に, 著者1名に対して, 85%の精度が得られた。
論文参考訳（メタデータ） (2024-10-29T04:14:23Z)
Says Who? Effective Zero-Shot Annotation of Focalization [0.0]
物語が提示される視点であるフォカライゼーションは、幅広い語彙文法的特徴を通じて符号化される。訓練されたアノテータでさえしばしば正しいラベルについて意見が一致せず、このタスクは質的にも計算的にも難しいことを示唆している。課題の難しさにもかかわらず、LPMは訓練された人間のアノテーションと同等の性能を示し、GPT-4oは平均84.79%のF1を達成する。
論文参考訳（メタデータ） (2024-09-17T17:50:15Z)
STRICTA: Structured Reasoning in Critical Text Assessment for Peer Review and Beyond [68.47402386668846]
本研究では,テキストアセスメントをステップワイド推論プロセスとしてモデル化するために,Structured Reasoning In Critical Text Assessment (STRICTA)を導入する。 STRICTAは、因果性理論に基づく相互接続推論ステップのグラフに評価を分解する。約40人のバイオメディカル専門家が20以上の論文について4000以上の推論ステップのデータセットにSTRICTAを適用した。
論文参考訳（メタデータ） (2024-09-09T06:55:37Z)
Paired Completion: Flexible Quantification of Issue-framing at Scale with LLMs [0.41436032949434404]
我々は,大規模なテキストデータセット内の問題フレーミングと物語分析のための新しい検出手法を開発し,厳密に評価する。問題フレーミングは大きなコーパスにおいて, 与えられた問題に対して, いずれの視点でも, 確実に, 効率的に検出できることを示す。
論文参考訳（メタデータ） (2024-08-19T07:14:15Z)
Impact of Ground Truth Quality on Handwriting Recognition [0.5328877196581558]
ブルリンジャーのデータベースには、主に近代以前のドイツ語とラテン語のテキストの1万以上のラベル付きテキストラインイメージが含まれている。本稿では,そのような誤りがトレーニングや評価に与える影響を調査し,典型的なアライメント誤りを検出し,修正する手段を提案する。
論文参考訳（メタデータ） (2023-12-14T15:36:41Z)
The Learnable Typewriter: A Generative Approach to Text Analysis [17.355857281085164]
テキスト行中の文字解析と認識に対する生成文書固有のアプローチを提案する。同様のフォントや手書きのテキスト行を入力として、我々のアプローチは多数の異なる文字を学習することができる。
論文参考訳（メタデータ） (2023-02-03T11:17:59Z)
PART: Pre-trained Authorship Representation Transformer [64.78260098263489]
文書を書く著者は、語彙、レジストリ、句読点、ミススペル、絵文字の使用など、テキスト内での識別情報をインプリントする。以前の作品では、手作りのフィーチャや分類タスクを使用して著者モデルをトレーニングし、ドメイン外の著者に対するパフォーマンスの低下につながった。セマンティクスの代わりにtextbfauthorship の埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文参考訳（メタデータ） (2022-09-30T11:08:39Z)
TFW2V: An Enhanced Document Similarity Method for the Morphologically Rich Finnish Language [0.5801044612920816]
本研究は,形態学的に豊かな言語であるフィンランド語に対する現在のアプローチの実験に焦点をあてる。本稿では,長文文書と限られた量のデータの両方を扱う上で,高い効率性を示す簡易な方法TFW2Vを提案する。
論文参考訳（メタデータ） (2021-12-23T12:27:45Z)
Image Collation: Matching illustrations in manuscripts [76.21388548732284]
図形照合の課題と,大規模な注釈付き公開データセットを導入して,ソリューションの評価を行う。本研究は,本課題における美術類似度測定の実態を分析し,簡単な場合では成功したが,大規模な写本に苦慮していることを示す。サイクル一貫性の対応を利用して,大幅な性能向上が期待できることを示す。
論文参考訳（メタデータ） (2021-08-18T12:12:14Z)
Toward the Understanding of Deep Text Matching Models for Information Retrieval [72.72380690535766]
本稿では,既存の深層テキストマッチング手法が情報検索の基本的な勾配を満たすかどうかを検証することを目的とする。具体的には, 項周波数制約, 項識別制約, 長さ正規化制約, TF長制約の4つの属性を用いる。 LETOR 4.0 と MS Marco の実験結果から,研究対象の深層テキストマッチング手法はすべて,統計学において高い確率で上記の制約を満たすことが示された。
論文参考訳（メタデータ） (2021-08-16T13:33:15Z)
Pareto Probing: Trading Off Accuracy for Complexity [87.09294772742737]
我々は,プローブの複雑性と性能の基本的なトレードオフを反映したプローブ計量について論じる。係り受け解析による実験により,文脈表現と非文脈表現の統語的知識の幅広いギャップが明らかとなった。
論文参考訳（メタデータ） (2020-10-05T17:27:31Z)
Generalized Word Shift Graphs: A Method for Visualizing and Explaining Pairwise Comparisons Between Texts [0.15833270109954134]
計算テキスト分析における一般的な課題は、2つのコーパスが単語頻度、感情、情報内容などの測定によってどのように異なるかを定量化することである。一般化された単語シフトグラフを導入し、個々の単語が2つのテキスト間の変動にどのように貢献するかを意味的かつ解釈可能な要約を生成する。このフレームワークは、相対周波数、辞書スコア、Kulback-LeiblerやJensen-Shannonの発散といったエントロピーに基づく測度など、テキストの比較によく使われる多くのアプローチを自然に含んでいることを示す。
論文参考訳（メタデータ） (2020-08-05T17:27:11Z)
A computational model implementing subjectivity with the 'Room Theory'. The case of detecting Emotion from Text [68.8204255655161]
本研究は,テキスト分析における主観性と一般的文脈依存性を考慮した新しい手法を提案する。単語間の類似度を用いて、ベンチマーク中の要素の相対的関連性を抽出することができる。この方法は、主観的評価がテキストの相対値や意味を理解するために関係しているすべてのケースに適用できる。
論文参考訳（メタデータ） (2020-05-12T21:26:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。