論文の概要: Rank-Turbulence Delta and Interpretable Approaches to Stylometric Delta Metrics
- arxiv url: http://arxiv.org/abs/2604.19499v2
- Date: Wed, 22 Apr 2026 08:44:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:10.458061
- Title: Rank-Turbulence Delta and Interpretable Approaches to Stylometric Delta Metrics
- Title(参考訳): ランク乱流デルタとスティロメトリーデルタ計量への解釈的アプローチ
- Authors: Dmitry Pronin, Evgeny Kazartsev,
- Abstract要約: 本稿では、著者帰属のための2つの新しい手段、Ranc-Turbulence DeltaとJensen-Shannon Deltaを紹介します。
我々はまず,単語周波数ベクトルの中心的および非中心的なz-scoringと対比して,この測度の理論的基礎を設定した。
我々は各デルタ距離を数値的に解釈可能なトークンレベルの分解を開発する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This article introduces two new measures for authorship attribution - Rank-Turbulence Delta and Jensen-Shannon Delta - which generalise Burrows's classical Delta by applying distance functions designed for probabilistic distributions. We first set out the theoretical basis of the measures, contrasting centred and uncentred z-scoring of word-frequency vectors and re-casting the uncentred vectors as probability distributions. Building on this representation, we develop a token-level decomposition that renders every Delta distance numerically interpretable, thereby facilitating close reading and the validation of results. The effectiveness of the methods is assessed on four literary corpora in English, German, French and Russian. The English, German and French datasets are compiled from Project Gutenberg, whereas the Russian benchmark is the SOCIOLIT corpus containing 755 works by 180 authors spanning the eighteenth to the twenty-first centuries. Rank-Turbulence Delta attains attribution accuracy comparable with Cosine Delta; Jensen-Shannon Delta consistently matches or exceeds the performance of canonical Burrows's Delta. Finally, several established attribution algorithms are re-evaluated on the extended SOCIOLIT corpus.
- Abstract(参考訳): 本稿では,Brows の古典的 Delta を確率分布に設計した距離関数を適用することで一般化する著者帰属法である Rank-Turbulence Delta と Jensen-Shannon Delta の2つの新しい方法を紹介する。
そこで我々はまず,単語周波数ベクトルの集中型および非集中型z-scoringと,非集中型ベクトルを確率分布として再キャストする手法の理論的基礎を設定した。
この表現に基づいて,各デルタ距離を数値的に解釈可能なトークンレベルの分解法を開発し,クローズリーディングと結果の検証を容易にする。
この方法の有効性は、英語、ドイツ語、フランス語、ロシア語の4つの文体で評価される。
英語、ドイツ語、フランス語のデータセットはプロジェクト・グーテンベルクから収集され、ロシア語のベンチマークは18世紀から21世紀にかけての180人の著者による755の著作を含むSOCIOLITコーパスである。
Rank-Turbulence Delta は Cosine Delta に匹敵する属性の精度を達成し、Jensen-Shannon Delta はカノニカルな Burrows's Delta と一貫して一致または上回っている。
最後に、いくつかの確立された帰属アルゴリズムを拡張SOCIOLITコーパスで再評価する。
関連論文リスト
- Efficient Thought Space Exploration through Strategic Intervention [54.35208611253168]
本稿では,この知見を2つの相乗的コンポーネントを通して操作するHint-Practice Reasoning(HPR)フレームワークを提案する。
フレームワークの中核となる革新は、動的に介入点を識別する分散不整合低減(DIR)である。
算術的および常識的推論ベンチマークによる実験は、HPRの最先端の効率-精度トレードオフを実証している。
論文 参考訳(メタデータ) (2025-11-13T07:26:01Z) - DeltaProduct: Improving State-Tracking in Linear RNNs via Householder Products [60.72655477351486]
リニアリカレントニューラルネットワーク(線形RNN)は、シーケンスモデリングのためのトランスフォーマーの競合代替手段として登場した。
既存のアーキテクチャは、表現性と効率の基本的なトレードオフに直面しており、状態遷移行列の構造によって規定されている。
論文 参考訳(メタデータ) (2025-02-14T16:59:05Z) - Delta - Contrastive Decoding Mitigates Text Hallucinations in Large Language Models [1.0742675209112622]
大型言語モデル(LLM)は幻覚を起こす傾向があり、事実的に誤りまたは偽造されたコンテンツを生成する。
モデルの再訓練や追加データを必要とせずに幻覚を減少させる推定時間手法であるDeltaを提案する。
論文 参考訳(メタデータ) (2025-02-09T09:16:42Z) - Alchemy: Amplifying Theorem-Proving Capability through Symbolic Mutation [71.32761934724867]
この研究は、記号的突然変異を通じて形式的な定理を構成するデータ合成のフレームワークであるAlchemyを提案する。
マドリブにおける各候補定理について、書き直しや適用に使用できるすべてのイベーシブルな定理を同定する。
その結果、マドリブの定理の数は110kから6Mへと桁違いに増加する。
論文 参考訳(メタデータ) (2024-10-21T08:04:21Z) - How does Burrows' Delta work on medieval Chinese poetic texts? [0.0]
Burrows' Deltaは2002年に導入され、著者帰属のための効果的なツールであることが証明されている。
デルタ法が中国語のテキストに与える影響を分析する研究は、ヨーロッパ語のテキストよりも少ない。
唐代の詩人はデルタで正しく識別され、ヨーロッパ標準語で書かれた著者の実証的なパターンが再び確認されている。
論文 参考訳(メタデータ) (2024-07-11T00:07:14Z) - Navigating the Metrics Maze: Reconciling Score Magnitudes and Accuracies [24.26653413077486]
10年前、単一のメトリクスBLEUが機械翻訳研究の進歩を支配した。
本稿では,現代のメトリクスの「ダイナミックレンジ」について考察する。
論文 参考訳(メタデータ) (2024-01-12T18:47:40Z) - Training BERT Models to Carry Over a Coding System Developed on One Corpus to Another [0.0]
本稿では,ハンガリーの文芸雑誌の段落で開発されたコーディングシステムを通じて,BERTモデルを学習する方法について述べる。
コーディングシステムの目的は、1989年のハンガリーにおける政治変革に関する文学翻訳の認識の傾向を追跡することである。
論文 参考訳(メタデータ) (2023-08-07T17:46:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。