論文の概要: How does Burrows' Delta work on medieval Chinese poetic texts?
- arxiv url: http://arxiv.org/abs/2407.08099v1
- Date: Thu, 11 Jul 2024 00:07:14 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-12 19:18:18.689428
- Title: How does Burrows' Delta work on medieval Chinese poetic texts?
- Title(参考訳): バラーズのデルタは中世中国の詩文でどのように機能するのか?
- Authors: Boris Orekhov,
- Abstract要約: Burrows' Deltaは2002年に導入され、著者帰属のための効果的なツールであることが証明されている。
デルタ法が中国語のテキストに与える影響を分析する研究は、ヨーロッパ語のテキストよりも少ない。
唐代の詩人はデルタで正しく識別され、ヨーロッパ標準語で書かれた著者の実証的なパターンが再び確認されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Burrows' Delta was introduced in 2002 and has proven to be an effective tool for author attribution. Despite the fact that these are different languages, they mostly belong to the same grammatical type and use the same graphic principle to convey speech in writing: a phonemic alphabet with word separation using spaces. The question I want to address in this article is how well this attribution method works with texts in a language with a different grammatical structure and a script based on different principles. There are fewer studies analyzing the effectiveness of the Delta method on Chinese texts than on texts in European languages. I believe that such a low level of attention to Delta from sinologists is due to the structure of the scientific field dedicated to medieval Chinese poetry. Clustering based on intertextual distances worked flawlessly. Delta produced results where clustering showed that the samples of one author were most similar to each other, and Delta never confused different poets. Despite the fact that I used an unconventional approach and applied the Delta method to a language poorly suited for it, the method demonstrated its effectiveness. Tang dynasty poets are correctly identified using Delta, and the empirical pattern observed for authors writing in European standard languages has been confirmed once again.
- Abstract(参考訳): Burrows' Deltaは2002年に導入され、著者帰属のための効果的なツールであることが証明されている。
これらは異なる言語であるにもかかわらず、それらは主に同じ文法型に属し、同じ図形原理を使って文章で話す:空間を用いて単語を分離する音素アルファベットである。
この記事では、この帰属メソッドが、異なる文法構造を持つ言語におけるテキストと、異なる原理に基づくスクリプトでいかにうまく機能するか、ということに対処したいと思います。
デルタ法が中国語のテキストに与える影響を分析する研究は、ヨーロッパ語のテキストよりも少ない。
罪学者からのデルタへのこのような低い関心は、中世中国の詩に捧げられた科学分野の構造が原因だと私は信じている。
テキスト間距離に基づくクラスタリングは完璧に動作した。
デルタは、クラスタリングによって、ある著者のサンプルが互いに最もよく似ていることを示し、デルタは異なる詩人を混乱させることはなかった。
従来の手法を使わずにデルタ法を適さない言語に適用したにもかかわらず、この手法の有効性を実証した。
唐代の詩人はデルタで正しく識別され、ヨーロッパ標準語で書かれた著者の実証的なパターンが再び確認されている。
関連論文リスト
- Metronome: tracing variation in poetic meters via local sequence alignment [0.18749305679160366]
本稿では,局所配列アライメントを用いて詩の構造的類似性を検出する教師なし手法を提案する。
この方法は詩のテキストを4文字のアルファベットを使って韻律的な特徴の文字列として符号化することに依存している。
これらの列は、重み付きシンボル(ミス)マッチングに基づいて距離測度を導出するように整列される。
論文 参考訳(メタデータ) (2024-04-26T11:37:45Z) - Spot the bot: Coarse-Grained Partition of Semantic Paths for Bots and
Humans [55.2480439325792]
本稿では,人書きテキストとボット生成テキストのセマンティックパスの粗粒度分割構造の比較に焦点をあてる。
意味構造が言語によって異なる可能性があるため、ロシア語、英語、ドイツ語、ベトナム語を調査する。
論文 参考訳(メタデータ) (2024-02-27T10:38:37Z) - PoetryDiffusion: Towards Joint Semantic and Metrical Manipulation in
Poetry Generation [58.36105306993046]
制御可能なテキスト生成は自然言語生成(NLG)において困難かつ有意義な分野である
本稿では,ソネット生成のための拡散モデルと中国語のSongCi詩の創始について述べる。
本モデルでは,人的評価だけでなく,意味的,計量的,総合的な性能の自動評価において,既存のモデルよりも優れる。
論文 参考訳(メタデータ) (2023-06-14T11:57:31Z) - Syllabic Quantity Patterns as Rhythmic Features for Latin Authorship
Attribution [74.27826764855911]
我々は、ラテン散文の計算的オーサシップ属性のタスクにおいて、リズミカルな特徴を導出する基盤として、音節量を用いる。
2つの異なる機械学習手法を用いて3つの異なるデータセットを用いて実験を行い、音節量に基づくリズム特徴がラテン散文の著者の識別に有用であることを示した。
論文 参考訳(メタデータ) (2021-10-27T06:25:31Z) - Semantics of European poetry is shaped by conservative forces: The
relationship between poetic meter and meaning in accentual-syllabic verse [0.0]
我々は1819世紀のヨーロッパ文学において、詩のメーターと意味論の永続的な関連性を示す最初の大規模な公式な証拠を提供する。
本研究は,15万詩の抽象的意味的特徴を用いた一連のクラスタリング実験を通して,この関係を追究するものである。
論文 参考訳(メタデータ) (2021-09-15T08:20:01Z) - Don't Go Far Off: An Empirical Study on Neural Poetry Translation [13.194404923699782]
いくつかの側面から詩の翻訳を実証的に検討する。
複数言語対の詩翻訳の並列データセットをコントリビュートする。
その結果,詩文の多言語微調整は,35倍の大きさの非詩文の多言語微調整よりも優れていた。
論文 参考訳(メタデータ) (2021-09-07T10:00:44Z) - CCPM: A Chinese Classical Poetry Matching Dataset [50.90794811956129]
本稿では,詩のマッチングによるモデルの意味的理解を評価するための新しい課題を提案する。
この課題は、現代漢訳の漢詩では、4人の候補者の中から1行の漢詩を選ばなければならない。
このデータセットを構築するために、まず中国古典詩と現代中国語の翻訳の並列データを得る。
論文 参考訳(メタデータ) (2021-06-03T16:49:03Z) - Building domain specific lexicon based on TikTok comment dataset [0.0]
それまでの研究では、例えば、Valence、Arousal、Dominance of sentenceに基づく文の感情傾向の分析など、英語の感情分析に焦点が当てられていた。
本稿では,ドメイン固有辞書を構築する手法を試みた。
モデルは感情的な傾向の中国語の単語を分類できます。
論文 参考訳(メタデータ) (2020-12-16T07:26:43Z) - Generating Major Types of Chinese Classical Poetry in a Uniformed
Framework [88.57587722069239]
GPT-2に基づく漢詩の主要なタイプを生成するフレームワークを提案する。
予備的な結果は、この強化されたモデルが、形も内容も質の高い大型漢詩を生成できることを示している。
論文 参考訳(メタデータ) (2020-03-13T14:16:25Z) - MixPoet: Diverse Poetry Generation via Learning Controllable Mixed
Latent Space [79.70053419040902]
多様な要素を吸収し,多様なスタイルを創出し,多様性を促進する新しいモデルであるMixPoetを提案する。
半教師付き変分オートエンコーダに基づいて、我々のモデルは潜在空間をいくつかの部分空間に切り離し、それぞれが敵の訓練によって1つの影響因子に条件付けされる。
中国詩の実験結果は、MixPoetが3つの最先端モデルに対して多様性と品質の両方を改善していることを示している。
論文 参考訳(メタデータ) (2020-03-13T03:31:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。