論文の概要: A data science and machine learning approach to continuous analysis of
Shakespeare's plays
- arxiv url: http://arxiv.org/abs/2301.06024v3
- Date: Tue, 11 Jul 2023 14:20:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-13 16:55:23.002170
- Title: A data science and machine learning approach to continuous analysis of
Shakespeare's plays
- Title(参考訳): データサイエンスと機械学習によるシェイクスピア劇の連続分析
- Authors: Charles Swisher, Lior Shamir
- Abstract要約: ウィリアム・シェイクスピアの作品に機械学習分析を適用した。
この分析は、時間の経過とともに書き方が大きく変化したことを示している。
機械学習を適用して演劇の年を幾何学的に予測すると、ピアソンの相関は0.71である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The availability of quantitative text analysis methods has provided new ways
of analyzing literature in a manner that was not available in the
pre-information era. Here we apply comprehensive machine learning analysis to
the work of William Shakespeare. The analysis shows clear changes in the style
of writing over time, with the most significant changes in the sentence length,
frequency of adjectives and adverbs, and the sentiments expressed in the text.
Applying machine learning to make a stylometric prediction of the year of the
play shows a Pearson correlation of 0.71 between the actual and predicted year,
indicating that Shakespeare's writing style as reflected by the quantitative
measurements changed over time. Additionally, it shows that the stylometrics of
some of the plays is more similar to plays written either before or after the
year they were written. For instance, Romeo and Juliet is dated 1596, but is
more similar in stylometrics to plays written by Shakespeare after 1600. The
source code for the analysis is available for free download.
- Abstract(参考訳): 量的テキスト分析の手法が利用可能になったことにより、事前情報時代には利用できなかった文学の分析方法が新たに提供された。
ここでは,ウィリアム・シェイクスピアの著作に包括的機械学習分析を適用する。
分析の結果,文章の長さ,形容詞と副詞の頻度,文章で表される感情など,文章のスタイルが時間とともに明らかに変化することがわかった。
機械学習を適用して戯曲の年を幾何学的に予測すると、実際の年と予測年のピアソンの相関は0.71であり、シェイクスピアの筆跡が時間とともに変化したことを示唆している。
また、一部の戯曲の体裁は、その作年前後に書かれたものに近いことが示されている。
例えば、ロミオとジュリエットは1596年にさかのぼるが、1600年以降のシェイクスピアの戯曲に類似している。
この分析のソースコードは無料でダウンロードできる。
関連論文リスト
- LFED: A Literary Fiction Evaluation Dataset for Large Language Models [58.85989777743013]
元々は中国語で書かれたか、中国語に翻訳された95の文学小説を収集し、数世紀にわたって幅広い話題を扱っている。
質問分類を8つのカテゴリーで定義し,1,304の質問の作成を導く。
我々は、小説の特定の属性(小説の種類、文字番号、出版年など)がLLMのパフォーマンスに与える影響を詳細に分析する。
論文 参考訳(メタデータ) (2024-05-16T15:02:24Z) - A Comparison of Lexicon-Based and ML-Based Sentiment Analysis: Are There
Outlier Words? [14.816706893177997]
本稿では、4つのドメインから抽出された15万以上の英語テキストに対する感情を計算する。
回帰モデルを用いて各ドメインの文書に対するアプローチ間の感情スコアの差をモデル化する。
以上の結果から,単語の重要性はドメインに依存しており,感情スコアの違いを系統的に引き起こす辞書項目が存在しないことが示唆された。
論文 参考訳(メタデータ) (2023-11-10T18:21:50Z) - Textual Entailment Recognition with Semantic Features from Empirical
Text Representation [60.31047947815282]
テキストが仮説を包含するのは、仮説の真の価値がテキストに従う場合に限る。
本稿では,テキストと仮説のテキストの包含関係を同定する新しい手法を提案する。
本手法では,テキスト・ハイブリッド・ペア間の意味的含意関係を識別できる要素ワイド・マンハッタン距離ベクトルベースの特徴を用いる。
論文 参考訳(メタデータ) (2022-10-18T10:03:51Z) - A decomposition of book structure through ousiometric fluctuations in
cumulative word-time [1.181206257787103]
本書の本数ではなく,文数の関数として,文語がどのように変化するのかを考察する。
短い本は一般的な傾向を示すだけであり、長い本は一般的な傾向に加えて変動がある。
以上の結果から,長文は短文の拡張版ではなく,短文の連結構造に類似していることが示唆された。
論文 参考訳(メタデータ) (2022-08-19T18:17:27Z) - Syllabic Quantity Patterns as Rhythmic Features for Latin Authorship
Attribution [74.27826764855911]
我々は、ラテン散文の計算的オーサシップ属性のタスクにおいて、リズミカルな特徴を導出する基盤として、音節量を用いる。
2つの異なる機械学習手法を用いて3つの異なるデータセットを用いて実験を行い、音節量に基づくリズム特徴がラテン散文の著者の識別に有用であることを示した。
論文 参考訳(メタデータ) (2021-10-27T06:25:31Z) - Semantic Analysis for Automated Evaluation of the Potential Impact of
Research Articles [62.997667081978825]
本稿では,情報理論に基づくテキスト意味のベクトル表現のための新しい手法を提案する。
この情報意味論がLeicester Scientific Corpusに基づいてテキスト分類にどのように使用されるかを示す。
テキストの意味を表現するための情報的アプローチは,研究論文の科学的影響を効果的に予測する方法であることを示す。
論文 参考訳(メタデータ) (2021-04-26T20:37:13Z) - Multiple regression techniques for modeling dates of first performances
of Shakespeare-era plays [2.1827922098806214]
1585年から1610年にかけてシェイクスピア時代の戯曲(181曲)のセットを取り上げ、標準の参考作品からメタデータとしてベスト・ゲッズ・日を付け加えた。
80/20のトレーニング/テストスプリットでプレイの日時を予測するため,11の回帰手法を適用した。
100の独立した実行でモデルで最も一般的に発生する20の単語の詳細な分析は、言語学的および様式学的用語の傾向を説明するのに役立ちます。
論文 参考訳(メタデータ) (2021-04-13T04:13:53Z) - My Teacher Thinks The World Is Flat! Interpreting Automatic Essay
Scoring Mechanism [71.34160809068996]
最近の研究では、自動スコアリングシステムが常識的な敵対的サンプルになりやすいことが示されています。
近年の解釈能力の進歩を活かし,コヒーレンスやコンテント,関連性といった特徴がスコアリングの自動化にどの程度重要であるかを見出す。
また、モデルが意味的に世界知識や常識に基づかないことから、世界のような虚偽の事実を追加することは、それを減らすよりもむしろスコアを増加させる。
論文 参考訳(メタデータ) (2020-12-27T06:19:20Z) - Generalized Word Shift Graphs: A Method for Visualizing and Explaining
Pairwise Comparisons Between Texts [0.15833270109954134]
計算テキスト分析における一般的な課題は、2つのコーパスが単語頻度、感情、情報内容などの測定によってどのように異なるかを定量化することである。
一般化された単語シフトグラフを導入し、個々の単語が2つのテキスト間の変動にどのように貢献するかを意味的かつ解釈可能な要約を生成する。
このフレームワークは、相対周波数、辞書スコア、Kulback-LeiblerやJensen-Shannonの発散といったエントロピーに基づく測度など、テキストの比較によく使われる多くのアプローチを自然に含んでいることを示す。
論文 参考訳(メタデータ) (2020-08-05T17:27:11Z) - Quality of Word Embeddings on Sentiment Analysis Tasks [0.0]
我々は、歌詞感情分析と映画レビューの極性タスクにおいて、事前訓練された単語埋め込みモデルの性能を比較した。
われわれの結果によると、Twitterのツイートは歌詞の感情分析でベスト、Google NewsとCommon Crawlは映画極性分析のトップパフォーマーだ。
論文 参考訳(メタデータ) (2020-03-06T15:03:08Z) - Learning Dynamic Belief Graphs to Generalize on Text-Based Games [55.59741414135887]
テキストベースのゲームをプレイするには、自然言語処理とシーケンシャルな意思決定のスキルが必要である。
本研究では,原文からエンドツーエンドに学習したグラフ構造化表現を用いて,エージェントがテキストベースのゲームでどのように計画・一般化できるかを検討する。
論文 参考訳(メタデータ) (2020-02-21T04:38:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。