論文の概要: A Quantitative Confirmation of the Currier Language Distinction
- arxiv url: http://arxiv.org/abs/2604.25979v2
- Date: Tue, 05 May 2026 15:54:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 14:45:21.049494
- Title: A Quantitative Confirmation of the Currier Language Distinction
- Title(参考訳): Currier Language Distinction の定量的確認
- Authors: Christophe Parisel,
- Abstract要約: 我々は、Voynich ManuscriptにおけるCurrier A/B言語の特徴を分析する。
A/Bコントラストは原始的ではなく,高次元系の低分解能投影であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a unified quantitative analysis of the Currier A/B language distinction in the Voynich Manuscript, proceeding in two stages. First, we confirm that the distinction is genuine: a Beta-Binomial mixture model applied to character-pair substitution ratios across 185 folios, without access to Currier's labels, selects 2 by BIC and predicts held-out folio labels at 89% accuracy. Second, we show that the A/B contrast is not primitive but is a low-resolution projection of a higher-dimensional generative system. Its dominant component is a discrete boolean "switch" set once per folio, governing the vowel following the digraphs ch and sh. A two-state binomial mixture achieves Delta\ AIC = 2,549 over a single-state model and assigns 195 of 197 folios unambiguously. This switch does not operate uniformly: word templates divide into fixed contexts and switchable contexts, with template identity accounting for 92% of variance.
- Abstract(参考訳): 本稿では,Voynich ManuscriptにおけるCurrier A/B言語区別の統一的定量的解析を行い,その2段階について述べる。
まず,Currierのラベルにアクセスせずに185フォリオの文字対置換比に適用したβ-Binomial混合モデルを用いて,BICで2を選択し,ホールドアウトフォリオラベルを89%精度で予測する。
第二に、A/Bコントラストは原始的ではなく、高次元生成系の低分解能投影であることを示す。
その支配的な構成要素は、フォリオ毎に1度ずつ個別のブールの「スウィッチ」セットであり、ディグラフ ch と sh に続く母音を統治する。
二状態二項混合は、Delta\ AIC = 2,549 を単状態モデル上で達成し、197個のフォリオのうち195個を曖昧に割り当てる。
このスイッチは均一に動作しない: 単語テンプレートは固定されたコンテキストと切り替え可能なコンテキストに分割され、テンプレートIDは分散の92%を占める。
関連論文リスト
- Towards a Linguistic Evaluation of Narratives: A Quantitative Stylistic Framework [51.56484100374058]
本研究は, 品質の指標としての言語的次元に着目し, ナラティブアセスメントに対する定量的アプローチを提案する。
本稿では,33種類の定量的言語的特徴を包括的に抽出し,物語の自動評価手法を提案する。
論文 参考訳(メタデータ) (2026-04-21T09:21:40Z) - Agentic Cognitive Profiling: Realigning Automated Alzheimer's Disease Detection with Clinical Construct Validity [66.94391219005291]
本稿では,臨床プロトコルロジックによる自動スクリーニングを実現するエージェント認知プロファイリング(ACP)を提案する。
我々の設計の中心は、すべての定量化を決定論的関数呼び出しに委譲することで、測定から意味的理解を分離することである。
ACPは、タスク試験で90.5%のスコアマッチ率、AD予測で85.3%の精度を達成し、一般的な基準を上回っている。
論文 参考訳(メタデータ) (2026-03-18T06:15:35Z) - Revisiting Northrop Frye's Four Myths Theory with Large Language Models [0.0]
ノースロップ・フライの4つの基本的物語ジャンルの理論は文学的批判に大きな影響を与えた。
パターンに基づく分析を補完する新しいキャラクタ関数フレームワークを提案する。
4つの普遍的性格関数(主人公,メンター,アンタゴニスト,仲間)をユングの精神構造成分にマッピングすることで導出する。
論文 参考訳(メタデータ) (2026-02-17T16:02:52Z) - Estimating the Influence of Sequentially Correlated Literary Properties in Textual Classification: A Data-Centric Hypothesis-Testing Approach [4.161155428666988]
逐次的に相関した文学的特性の影響を定量化するために,データ中心の仮説テストフレームワークを導入する。
従来の(単語n-gramと文字k-mer)とニューラル(対照的に訓練された)埋め込みを、教師なしと教師なしの両方の分類設定で比較する。
その結果, 逐次相関の制御は偽陽性の低減に不可欠であることが示唆された。
論文 参考訳(メタデータ) (2024-11-07T18:28:40Z) - CopyBench: Measuring Literal and Non-Literal Reproduction of Copyright-Protected Text in Language Model Generation [132.00910067533982]
LM世代におけるリテラルコピーと非リテラルコピーの両方を測定するために設計されたベンチマークであるCopyBenchを紹介する。
リテラル複写は比較的稀であるが、イベント複写と文字複写という2種類の非リテラル複写は、7Bパラメータのモデルでも発生する。
論文 参考訳(メタデータ) (2024-07-09T17:58:18Z) - Explainability of machine learning approaches in forensic linguistics: a case study in geolinguistic authorship profiling [46.58131072375399]
法医学的文脈を考慮した機械学習手法の説明可能性について検討する。
我々は、ドイツ語圏のソーシャルメディアデータに基づく未知のテキストのジオ言語的プロファイリングの手段として、多種多様な分類に焦点を当てた。
抽出した語彙的特徴がそれぞれの品種を実際に代表しており、訓練されたモデルは分類の場所名にも依存していることに注意する。
論文 参考訳(メタデータ) (2024-04-29T08:52:52Z) - Individual Text Corpora Predict Openness, Interests, Knowledge and Level of Education [0.5825410941577593]
個々の検索履歴から経験への開放性の個性次元を予測することができる。
個々のテキストコーパス(IC)は,平均500万ワードトークン数214人の参加者から生成される。
論文 参考訳(メタデータ) (2024-03-29T21:44:24Z) - From exemplar to copy: the scribal appropriation of a Hadewijch
manuscript computationally explored [1.9798034349981157]
この研究は、中世の神秘作家ハドゥヴェイヒ(Hadewijch)の自筆譜が保存されている、最も古い写本の2つに捧げられている。
Bを作成した書記者は、Aを模範として用いたと推定される。
機械学習を用いて、原稿AとBを分離する最も特徴的な特徴を特定します。
論文 参考訳(メタデータ) (2022-10-25T14:40:25Z) - PART: Pre-trained Authorship Representation Transformer [52.623051272843426]
文書を書く著者は、自分のテキストに識別情報を印字する。
以前の作品では、手作りの機能や分類タスクを使って著者モデルを訓練していた。
セマンティクスの代わりにテキストの埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - Writer Recognition Using Off-line Handwritten Single Block Characters [59.17685450892182]
我々は、生年月日DoBの6桁の個人番号を使用する。
本稿では,方向測定を行う手作り特徴に基づく認識手法と,ResNet50モデルによる深い特徴に基づく認識手法について検討する。
その結果,DoBでは手書き情報に同一性関連情報が6桁程度存在することがわかった。
論文 参考訳(メタデータ) (2022-01-25T23:04:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。