論文の概要: Multiple regression techniques for modeling dates of first performances
of Shakespeare-era plays
- arxiv url: http://arxiv.org/abs/2104.05929v2
- Date: Wed, 14 Apr 2021 23:37:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-16 09:14:03.995439
- Title: Multiple regression techniques for modeling dates of first performances
of Shakespeare-era plays
- Title(参考訳): シェイクスピア時代劇の初演日時をモデル化するための多重回帰手法
- Authors: Pablo Moscato, Hugh Craig, Gabriel Egan, Mohammad Nazmul Haque, Kevin
Huang, Julia Sloan, Jon Corrales de Oliveira
- Abstract要約: 1585年から1610年にかけてシェイクスピア時代の戯曲(181曲)のセットを取り上げ、標準の参考作品からメタデータとしてベスト・ゲッズ・日を付け加えた。
80/20のトレーニング/テストスプリットでプレイの日時を予測するため,11の回帰手法を適用した。
100の独立した実行でモデルで最も一般的に発生する20の単語の詳細な分析は、言語学的および様式学的用語の傾向を説明するのに役立ちます。
- 参考スコア(独自算出の注目度): 2.1827922098806214
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The date of the first performance of a play of Shakespeare's time must
usually be guessed with reference to multiple indirect external sources, or to
some aspect of the content or style of the play. Identifying these dates is
important to literary history and to accounts of developing authorial styles,
such as Shakespeare's. In this study, we took a set of Shakespeare-era plays
(181 plays from the period 1585--1610), added the best-guess dates for them
from a standard reference work as metadata, and calculated a set of
probabilities of individual words in these samples. We applied 11 regression
methods to predict the dates of the plays at an 80/20 training/test split. We
withdrew one play at a time, used the best-guess date metadata with the
probabilities and weightings to infer its date, and thus built a model of
date-probabilities interaction. We introduced a memetic algorithm-based
Continued Fraction Regression (CFR) which delivered models using a small number
of variables, leading to an interpretable model and reduced dimensionality. An
in-depth analysis of the most commonly occurring 20 words in the CFR models in
100 independent runs helps explain the trends in linguistic and stylistic
terms. The analysis with the subset of words revealed an interesting
correlation of signature words with the Shakespeare-era play's genre.
- Abstract(参考訳): シェイクスピアの時代の戯曲の最初の上演日は、通常、複数の間接的な外部ソース、あるいは劇の内容や様式のいくつかの側面を参照して推測しなければならない。
これらの日付を特定することは文学史やシェイクスピアなどの著作様式の発展に重要である。
本研究では,シェークスピア時代の戯曲(181年,1585年~1610年)のセットを取り上げ,標準参考作品から最高のゲーミング日をメタデータとして追加し,それらのサンプル中の個々の単語の確率を計算した。
80/20のトレーニング/テストスプリットでプレイの日時を予測するため,11の回帰手法を適用した。
私たちは一度にひとつのプレーを削除し、確率と重み付けを備えた最高の日付メタデータを使用して、日付と確率の相互作用のモデルを構築しました。
我々は,少数の変数を用いてモデルを伝達し,解釈可能なモデルと次元の縮小をもたらす,メメティックアルゴリズムに基づく連続的フラクション回帰(CFR)を導入した。
100インディペンデントランにおけるcfrモデルで最も一般的に発生する20単語の詳細な分析は、言語的および様式的用語の傾向を説明するのに役立つ。
単語のサブセットによる分析は、シェイクスピア時代の劇のジャンルと署名語の興味深い相関関係を明らかにした。
関連論文リスト
- Deep Time Series Models: A Comprehensive Survey and Benchmark [74.28364194333447]
時系列データは、現実世界のシナリオにおいて非常に重要である。
近年、時系列コミュニティで顕著なブレークスルーが見られた。
多様な分析タスクのためのディープ時系列モデルの公正なベンチマークとして、時系列ライブラリ(TSLib)をリリースします。
論文 参考訳(メタデータ) (2024-07-18T08:31:55Z) - LFED: A Literary Fiction Evaluation Dataset for Large Language Models [58.85989777743013]
元々は中国語で書かれたか、中国語に翻訳された95の文学小説を収集し、数世紀にわたって幅広い話題を扱っている。
質問分類を8つのカテゴリーで定義し,1,304の質問の作成を導く。
我々は、小説の特定の属性(小説の種類、文字番号、出版年など)がLLMのパフォーマンスに与える影響を詳細に分析する。
論文 参考訳(メタデータ) (2024-05-16T15:02:24Z) - Dissecting vocabulary biases datasets through statistical testing and
automated data augmentation for artifact mitigation in Natural Language
Inference [3.154631846975021]
我々は、データセットのアーティファクトを調査し、これらの問題に対処するための戦略を開発することに重点を置いている。
文字レベルから単語レベルにまたがる複数の自動データ拡張戦略を提案する。
実験により,提案手法はモデル精度を効果的に向上し,バイアスを最大0.66%,バイアスを1.14%低減することを示した。
論文 参考訳(メタデータ) (2023-12-14T08:46:26Z) - Contrastive Difference Predictive Coding [79.74052624853303]
本研究では、時系列データの断片を縫合して、将来の事象の予測を学習するために必要なデータの量を減少させるコントラッシブ予測符号化の時間差版を導入する。
目的条件付きRLの非政治アルゴリズムを導出するために,この表現学習手法を適用した。
論文 参考訳(メタデータ) (2023-10-31T03:16:32Z) - Prediction Model For Wordle Game Results With High Robustness [0.0]
本研究では,データ解析と機械学習を用いたWordleのダイナミクスに焦点を当てた。
単語の難易度を予測するために、私たちはバックプロパゲーションニューラルネットワークを採用し、機能工学によるオーバーフィッティングを克服した。
以上の結果から,2023年3月1日に約12,884件の結果が提出され,平均4.8回試みられ,最も難易度の高いクラスタに落下することが示唆された。
論文 参考訳(メタデータ) (2023-09-25T16:10:35Z) - Preserving Knowledge Invariance: Rethinking Robustness Evaluation of
Open Information Extraction [50.62245481416744]
実世界におけるオープン情報抽出モデルの評価をシミュレートする最初のベンチマークを示す。
我々は、それぞれの例が知識不変のcliqueである大規模なテストベッドを設計し、注釈付けする。
さらにロバスト性計量を解明することにより、その性能が全体の傾きに対して一貫して正確であるならば、モデルはロバストであると判断される。
論文 参考訳(メタデータ) (2023-05-23T12:05:09Z) - A data science and machine learning approach to continuous analysis of
Shakespeare's plays [0.0]
ウィリアム・シェイクスピアの作品に機械学習分析を適用した。
この分析は、時間の経過とともに書き方が大きく変化したことを示している。
機械学習を適用して演劇の年を幾何学的に予測すると、ピアソンの相関は0.71である。
論文 参考訳(メタデータ) (2023-01-15T06:25:50Z) - Query Expansion Using Contextual Clue Sampling with Language Models [69.51976926838232]
本稿では,実効的なフィルタリング戦略と検索した文書の融合の組み合わせを,各文脈の生成確率に基づいて提案する。
我々の語彙マッチングに基づくアプローチは、よく確立された高密度検索モデルDPRと比較して、同様のトップ5/トップ20検索精度と上位100検索精度を実現する。
エンド・ツー・エンドのQAでは、読者モデルも我々の手法の恩恵を受けており、いくつかの競争基準に対してエクサクト・マッチのスコアが最も高い。
論文 参考訳(メタデータ) (2022-10-13T15:18:04Z) - Narrative Text Generation with a Latent Discrete Plan [39.71663365273463]
本稿では,その生成過程の一環として,物語中の文ごとに1つのアンカー語列を最初にサンプリングする潜時変数モデルを提案する。
トレーニング中は、アンカー語の列を潜在変数として扱い、アンカーの列を誘導し、教師なしの方法で生成を誘導する。
我々は,本モデルで作成したストーリーが,ストーリープランを考慮しないベースラインと比較して評価が優れていることを示す,人間による評価を行う。
論文 参考訳(メタデータ) (2020-10-07T08:45:37Z) - Temporal Embeddings and Transformer Models for Narrative Text
Understanding [72.88083067388155]
キャラクタ関係モデリングのための物語テキスト理解のための2つのアプローチを提案する。
これらの関係の時間的進化は動的単語埋め込みによって説明され、時間とともに意味的変化を学ぶように設計されている。
最新の変換器モデルBERTに基づく教師付き学習手法を用いて文字間の静的な関係を検出する。
論文 参考訳(メタデータ) (2020-03-19T14:23:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。