論文の概要: Markov reads Pushkin, again: A statistical journey into the poetic world of Evgenij Onegin
- arxiv url: http://arxiv.org/abs/2604.20221v1
- Date: Wed, 22 Apr 2026 06:10:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:10.98761
- Title: Markov reads Pushkin, again: A statistical journey into the poetic world of Evgenij Onegin
- Title(参考訳): マルコフは再びプーシキンを読む:エヴゲニ・オネギンの詩の世界への統計的旅
- Authors: Angelo Maria Sabatini,
- Abstract要約: 本稿では,エヴゲニェ・オネギン(Evgenij Onegin-as)の母音/子音(V/C)符号化による音韻構造について検討する。
マルコフの元々のスキームにインスパイアされたバイナリエンコーディングを用いて、局所的なV/C依存と大規模シーケンシャルパターンの両方をキャプチャする最小主義確率モデルを構築する。
コンパクトな4状態マルコフ連鎖は記述的に正確で生成的であり、自己相関やメモリ深さといった元の配列の重要な特徴を再現している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study applies symbolic time series analysis and Markov modeling to explore the phonological structure of Evgenij Onegin-as captured through a graphemic vowel/consonant (V/C) encoding-and one contemporary Italian translation. Using a binary encoding inspired by Markov's original scheme, we construct minimalist probabilistic models that capture both local V/C dependencies and large-scale sequential patterns. A compact four-state Markov chain is shown to be descriptively accurate and generative, reproducing key features of the original sequences such as autocorrelation and memory depth. All findings are exploratory in nature and aim to highlight structural regularities while suggesting hypotheses about underlying narrative dynamics. The analysis reveals a marked asymmetry between the Russian and Italian texts: the original exhibits a gradual decline in memory depth, whereas the translation maintains a more uniform profile. To further investigate this divergence, we introduce phonological probes-short symbolic patterns that link surface structure to narrative-relevant cues. Tracked across the unfolding text, these probes reveal subtle connections between graphemic form and thematic development, particularly in the Russian original. By revisiting Markov's original proposal of applying symbolic analysis to a literary text and pairing it with contemporary tools from computational statistics and data science, this study shows that even minimalist Markov models can support exploratory analysis of complex poetic material. When complemented by a coarse layer of linguistic annotation, such models provide a general framework for comparative poetics and demonstrate that stylized structural patterns remain accessible through simple representations grounded in linguistic form.
- Abstract(参考訳): 本研究は記号的時系列解析とマルコフモデルを用いて,エヴゲニェ・オネギンの母音/子音(V/C)符号化による音韻構造を探究する。
マルコフの元々のスキームにインスパイアされたバイナリエンコーディングを用いて、局所的なV/C依存と大規模シーケンシャルパターンの両方をキャプチャする最小主義確率モデルを構築する。
コンパクトな4状態マルコフ連鎖は記述的正確で生成的であり、自己相関やメモリ深さといった元の配列の重要な特徴を再現している。
全ての発見は自然界で探索的であり、下層の物語力学に関する仮説を示唆しながら構造的規則性を強調することを目的としている。
この分析では、ロシア語とイタリア語のテキストの間に顕著な非対称性が示されており、原文は徐々に記憶深度が低下し、翻訳はより均一なプロファイルを維持している。
そこで本研究では, 音韻論的プローブ・ショート記号パターンを導入し, 表層構造と物語関連手がかりを関連づける。
展開されたテキストで追跡されたこれらのプローブは、特にロシアのオリジナルにおいて、グラデミック形式と主題的発達の間の微妙な関係を明らかにしている。
マルコフの文体に記号解析を適用し、計算統計学やデータ科学の現代ツールと組み合わせるという当初の提案を再考することにより、最小主義者のマルコフモデルでさえ複雑な詩素材の探索的分析を支持できることを示す。
言語アノテーションの粗い層によって補完される場合、そのようなモデルは比較詩学の一般的な枠組みを提供し、言語形式に基づく単純な表現を通して、スタイル化された構造パターンがアクセス可能であることを示す。
関連論文リスト
- Hybrid topic modelling for computational close reading: Mapping narrative themes in Pushkin's Evgenij Onegin [0.0]
本研究では,計算文学解析のためのハイブリッドトピックモデリングフレームワークを提案する。
LDA(Latent Dirichlet Allocation)とSPLS-DA(Partial Least Squares Discriminant Analysis)を統合し、物語詩における主題構造と縦長のダイナミクスをモデル化する。
論文 参考訳(メタデータ) (2026-03-20T13:37:08Z) - Mind-the-Glitch: Visual Correspondence for Detecting Inconsistencies in Subject-Driven Generation [120.23172120151821]
本稿では,事前学習した拡散モデルのバックボーンから視覚的特徴と意味的特徴を分離するための新しいアプローチを提案する。
注釈付きセマンティックと視覚対応を備えた画像ペアを構築する自動パイプラインを導入する。
被験者駆動画像生成における視覚的不整合を定量化する新しい指標であるビジュアルセマンティックマッチングを提案する。
論文 参考訳(メタデータ) (2025-09-26T07:11:55Z) - An Information-Theoretic Approach to Identifying Formulaic Clusters in Textual Data [2.977406733413627]
フォーミュラテキストは繰り返しと制約された表現によって特徴づけられ、自己情報の変動性が低い傾向にある。
本研究の目的は,反復句,構文構造,スタイルマーカーを解析することにより,定式的クラスタを同定することである。
重み付き自己情報分布を利用してテキスト中の構造化パターンを検出する情報理論アルゴリズムを開発した。
論文 参考訳(メタデータ) (2025-03-10T13:24:46Z) - SignAttention: On the Interpretability of Transformer Models for Sign Language Translation [2.079808290618441]
本稿では,トランスフォーマーを用いた手話翻訳モデルの最初の包括的解釈可能性解析について述べる。
モデル内の注意機構について検討し,視覚入力を逐次グルースで処理・調整する方法について考察する。
この研究はSLTモデルのより深い理解に寄与し、より透明で信頼性の高い翻訳システムを開発するための道を開いた。
論文 参考訳(メタデータ) (2024-10-18T14:38:37Z) - Model Criticism for Long-Form Text Generation [113.13900836015122]
我々は,テキストの高レベル構造を評価するために,潜在空間におけるモデル批判という統計ツールを適用した。
我々は,コヒーレンス,コア,トピックスという,ハイレベルな談話の3つの代表的な側面について実験を行った。
トランスフォーマーベースの言語モデルでは、トピック構造をキャプチャできるが、構造コヒーレンスやモデリングコアスを維持するのが難しくなる。
論文 参考訳(メタデータ) (2022-10-16T04:35:58Z) - A Latent-Variable Model for Intrinsic Probing [93.62808331764072]
固有プローブ構築のための新しい潜在変数定式化を提案する。
我々は、事前訓練された表現が言語間交互に絡み合ったモルフォシンタクスの概念を発達させる経験的証拠を見出した。
論文 参考訳(メタデータ) (2022-01-20T15:01:12Z) - Neural Deepfake Detection with Factual Structure of Text [78.30080218908849]
テキストのディープフェイク検出のためのグラフベースモデルを提案する。
我々のアプローチは、ある文書の事実構造をエンティティグラフとして表現する。
本モデルでは,機械生成テキストと人文テキストの事実構造の違いを識別することができる。
論文 参考訳(メタデータ) (2020-10-15T02:35:31Z) - Testing the Quantitative Spacetime Hypothesis using Artificial Narrative
Comprehension (II) : Establishing the Geometry of Invariant Concepts, Themes,
and Namespaces [0.0]
本研究は、セマンティック時空仮説の継続的な適用に寄与し、物語テキストの教師なし分析を実証する。
データストリームは、バイオインフォマティクス解析の方法で、マルチスケール干渉計によって、小さな成分に解析され、分別される。
入力のフラグメントは、各スケールで新しい有効言語を定義するアルファベット階層のシンボルとして機能する。
論文 参考訳(メタデータ) (2020-09-23T11:19:17Z) - Temporal Embeddings and Transformer Models for Narrative Text
Understanding [72.88083067388155]
キャラクタ関係モデリングのための物語テキスト理解のための2つのアプローチを提案する。
これらの関係の時間的進化は動的単語埋め込みによって説明され、時間とともに意味的変化を学ぶように設計されている。
最新の変換器モデルBERTに基づく教師付き学習手法を用いて文字間の静的な関係を検出する。
論文 参考訳(メタデータ) (2020-03-19T14:23:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。