論文の概要: Punctuation patterns in "Finnegans Wake" by James Joyce are largely translation-invariant
- arxiv url: http://arxiv.org/abs/2501.12954v1
- Date: Wed, 22 Jan 2025 15:27:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-23 13:30:08.841956
- Title: Punctuation patterns in "Finnegans Wake" by James Joyce are largely translation-invariant
- Title(参考訳): ジェームズ・ジョイス『フィネガンス・ウェイク』における句読解パターンは翻訳不変である
- Authors: Krzysztof Bartnicki, Stanisław Drożdż, Jarosław Kwapień, Tomasz Stanisz,
- Abstract要約: 自然言語で書かれたテキストの複雑さ特性は句読点の規則に大きく関係している。
近年の研究では、ジェームズ・ジョイスの有名な「フィネガンス・ウェイク」がヴァイブル家からの極端に分布しており、それに対応するハザード関数が明らかに減少していることが示されている。
この研究の句読点特性は、一般的な場合とは対照的に、大半が翻訳不変であることが示されている。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: The complexity characteristics of texts written in natural languages are significantly related to the rules of punctuation. In particular, the distances between punctuation marks measured by the number of words quite universally follow the family of Weibull distributions known from survival analyses. However, the values of two parameters marking specific forms of these distributions distinguish specific languages. This is such a strong constraint that the punctuation distributions of texts translated from the original language into another adopt quantitative characteristics of the target language. All these changes take place within Weibull distributions such that the corresponding hazard functions are always increasing. Recent previous research shows that James Joyce's famous "Finnegans Wake" is subject to such extreme distribution from the Weibull family that the corresponding hazard function is clearly decreasing. At the same time, the distances of sentence ending punctuation marks, determining the variability of sentence length, have an almost perfect multifractal organization, so far to such an extent found nowhere else in the literature. In the present contribution based on several available translations (Dutch, French, German, Polish, Russian) of "Finnegans Wake", it is shown that the punctuation characteristics of this work remain largely translation invariant, contrary to the common cases. These observations may constitute further evidence that "Finnegans Wake" is a translinguistic work in this respect as well, in line with Joyce's original intention.
- Abstract(参考訳): 自然言語で書かれたテキストの複雑さ特性は句読点の規則に大きく関係している。
特に、単語数によって測定される句読点間の距離は、生存分析から知られているワイブル分布の族に準じる。
しかし、これらの分布の特定の形式を示す2つのパラメータの値は、特定の言語を区別する。
これは、元の言語から別の言語に翻訳されたテキストの句読点分布がターゲット言語の量的特性を採用するという強い制約である。
これらの変化はすべてワイブル分布内で起こり、対応するハザード関数は常に増加する。
近年の研究では、ジェームズ・ジョイスの有名な「フィネガンス・ウェイク」がヴァイブル家からの極端に分布しており、それに対応するハザード関数が明らかに減少していることが示されている。
同時に、文長の変動性を決定する句末句読点の距離はほぼ完全な多フラクタル構造を持ち、文献で見つからない程度にまで達している。
現在、いくつかの利用可能な翻訳(オランダ語、フランス語、ドイツ語、ポーランド語、ロシア語)に基づく『フィネガンス・ウェイク』では、この作品の句読点特性が一般的な場合とは対照的に、ほとんど変わらず残されていることが示されている。
これらの観察は、ジョイスの元々の意図に則って、この点でも「フィネガンス・ウェイク」が超言語学的な研究であることを示すさらなる証拠となるかもしれない。
関連論文リスト
- Statistics of punctuation in experimental literature -- the remarkable case of "Finnegans Wake" by James Joyce [0.0]
本研究は, 句読点パターンの分析を世界文学のより実験的な部分にまで拡張する。
個別のワイブル分布と句読点間の距離のコンプライアンスは、典型的にはここでも適用される。
ジェームズ・ジョイス(James Joyce)による作品のいくつかはこの点において、関連する分布の尾部がかなり厚くなっているという意味で、異なるものである。
論文 参考訳(メタデータ) (2024-08-31T15:30:51Z) - Harnessing Hierarchical Label Distribution Variations in Test Agnostic Long-tail Recognition [114.96385572118042]
テストラベルの分布の変動は階層的にグローバルレベルとローカルレベルに分解できると主張している。
ラベル分布の異なるDirichletメタ分布に専門家を割り当てる新しいMoE戦略である$mathsfDirMixE$を提案する。
本稿では,分散に基づく正規化による一般化の促進による目的性を示す。
論文 参考訳(メタデータ) (2024-05-13T14:24:56Z) - Complex systems approach to natural language [0.0]
複雑性科学の観点から、自然言語の研究で使用される主要な方法論概念を概説する。
定量的言語学における3つの主要な複雑性関連研究動向を概説する。
論文 参考訳(メタデータ) (2024-01-05T12:01:26Z) - X-PARADE: Cross-Lingual Textual Entailment and Information Divergence across Paragraphs [55.80189506270598]
X-PARADEは、段落レベルの情報の分岐の最初の言語間データセットである。
アノテーションは、対象言語における段落をスパンレベルでラベル付けし、ソース言語における対応する段落に対して評価する。
アライメントされた段落は、異なる言語のウィキペディアページから引用される。
論文 参考訳(メタデータ) (2023-09-16T04:34:55Z) - On the Efficacy of Sampling Adapters [82.5941326570812]
サンプリングアダプタを理解するための統一的なフレームワークを提案する。
彼らが実施するシフトは、正確さとリコールの間のトレードオフと見なすことができる、と私たちは主張する。
いくつかの精度強調尺度は、サンプリングアダプタが真の分布とより整合した確率分布をもたらすことを確実に示している。
論文 参考訳(メタデータ) (2023-07-07T17:59:12Z) - Universal versus system-specific features of punctuation usage patterns
in~major Western~languages [0.0]
文章では句読点はその表現の1つと見なすことができる。
本研究は,七大西欧語における世界名文・代表文の大規模なコーパスに基づく。
論文 参考訳(メタデータ) (2022-12-21T16:52:10Z) - Cross-Linguistic Syntactic Difference in Multilingual BERT: How Good is
It and How Does It Affect Transfer? [50.48082721476612]
マルチリンガルBERT (mBERT) は, 言語間シンタクティックな機能を示した。
我々は,mBERTから引き起こされる文法的関係の分布を,24言語に類型的に異なる文脈で検討した。
論文 参考訳(メタデータ) (2022-12-21T09:44:08Z) - A Measure-Theoretic Characterization of Tight Language Models [105.16477132329416]
病理学的には「確率質量」が無限列の集合に漏れることがある。
本稿では,言語モデリングの尺度論的扱いについて述べる。
多くのポピュラーな言語モデルファミリーが実際に密接な関係にあることを証明しています。
論文 参考訳(メタデータ) (2022-12-20T18:17:11Z) - On the Usefulness of Embeddings, Clusters and Strings for Text Generator
Evaluation [86.19634542434711]
Mauveは、弦上の2つの確率分布間の情報理論のばらつきを測定する。
我々は,Mauveが誤った理由で正しいことを示し,新たに提案された分岐はハイパフォーマンスには必要ないことを示した。
テキストの構文的およびコヒーレンスレベルの特徴を符号化することで、表面的な特徴を無視しながら、文字列分布に対するクラスタベースの代替品は、単に最先端の言語ジェネレータを評価するのに良いかもしれない、と結論付けています。
論文 参考訳(メタデータ) (2022-05-31T17:58:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。