論文の概要: Multiple regression techniques for modeling dates of first performances
of Shakespeare-era plays
- arxiv url: http://arxiv.org/abs/2104.05929v2
- Date: Wed, 14 Apr 2021 23:37:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-16 09:14:03.995439
- Title: Multiple regression techniques for modeling dates of first performances
of Shakespeare-era plays
- Title(参考訳): シェイクスピア時代劇の初演日時をモデル化するための多重回帰手法
- Authors: Pablo Moscato, Hugh Craig, Gabriel Egan, Mohammad Nazmul Haque, Kevin
Huang, Julia Sloan, Jon Corrales de Oliveira
- Abstract要約: 1585年から1610年にかけてシェイクスピア時代の戯曲(181曲)のセットを取り上げ、標準の参考作品からメタデータとしてベスト・ゲッズ・日を付け加えた。
80/20のトレーニング/テストスプリットでプレイの日時を予測するため,11の回帰手法を適用した。
100の独立した実行でモデルで最も一般的に発生する20の単語の詳細な分析は、言語学的および様式学的用語の傾向を説明するのに役立ちます。
- 参考スコア(独自算出の注目度): 2.1827922098806214
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The date of the first performance of a play of Shakespeare's time must
usually be guessed with reference to multiple indirect external sources, or to
some aspect of the content or style of the play. Identifying these dates is
important to literary history and to accounts of developing authorial styles,
such as Shakespeare's. In this study, we took a set of Shakespeare-era plays
(181 plays from the period 1585--1610), added the best-guess dates for them
from a standard reference work as metadata, and calculated a set of
probabilities of individual words in these samples. We applied 11 regression
methods to predict the dates of the plays at an 80/20 training/test split. We
withdrew one play at a time, used the best-guess date metadata with the
probabilities and weightings to infer its date, and thus built a model of
date-probabilities interaction. We introduced a memetic algorithm-based
Continued Fraction Regression (CFR) which delivered models using a small number
of variables, leading to an interpretable model and reduced dimensionality. An
in-depth analysis of the most commonly occurring 20 words in the CFR models in
100 independent runs helps explain the trends in linguistic and stylistic
terms. The analysis with the subset of words revealed an interesting
correlation of signature words with the Shakespeare-era play's genre.
- Abstract(参考訳): シェイクスピアの時代の戯曲の最初の上演日は、通常、複数の間接的な外部ソース、あるいは劇の内容や様式のいくつかの側面を参照して推測しなければならない。
これらの日付を特定することは文学史やシェイクスピアなどの著作様式の発展に重要である。
本研究では,シェークスピア時代の戯曲(181年,1585年~1610年)のセットを取り上げ,標準参考作品から最高のゲーミング日をメタデータとして追加し,それらのサンプル中の個々の単語の確率を計算した。
80/20のトレーニング/テストスプリットでプレイの日時を予測するため,11の回帰手法を適用した。
私たちは一度にひとつのプレーを削除し、確率と重み付けを備えた最高の日付メタデータを使用して、日付と確率の相互作用のモデルを構築しました。
我々は,少数の変数を用いてモデルを伝達し,解釈可能なモデルと次元の縮小をもたらす,メメティックアルゴリズムに基づく連続的フラクション回帰(CFR)を導入した。
100インディペンデントランにおけるcfrモデルで最も一般的に発生する20単語の詳細な分析は、言語的および様式的用語の傾向を説明するのに役立つ。
単語のサブセットによる分析は、シェイクスピア時代の劇のジャンルと署名語の興味深い相関関係を明らかにした。
関連論文リスト
- CAST: Corpus-Aware Self-similarity Enhanced Topic modelling [16.562349140796115]
CAST: Corpus-Aware Self-similarity Enhanced Topic modelling, a novel topic modelling methodを紹介する。
機能的単語が候補話題語として振る舞うのを防ぐための効果的な指標として自己相似性を見出した。
提案手法は,生成したトピックの一貫性と多様性,およびノイズの多いデータを扱うトピックモデルの能力を大幅に向上させる。
論文 参考訳(メタデータ) (2024-10-19T15:27:11Z) - Reverse-Engineering the Reader [43.26660964074272]
本稿では,線形回帰器のパラメータを暗黙的に最適化するために,言語モデルを微調整する新しいアライメント手法を提案する。
単語をテストケースとして使用し、複数のモデルサイズとデータセットにわたる手法を評価する。
ダウンストリームNLPタスクにおける心理測定パワーとモデルの性能の逆関係と、ホールドアウトテストデータにおけるその難易度を見出した。
論文 参考訳(メタデータ) (2024-10-16T23:05:01Z) - GIFT-Eval: A Benchmark For General Time Series Forecasting Model Evaluation [90.53485251837235]
時系列基礎モデルはゼロショット予測に優れ、明示的なトレーニングなしで多様なタスクを処理する。
GIFT-Evalは、多様なデータセットに対する評価を促進するための先駆的なベンチマークである。
GIFT-Evalには、144,000の時系列と17700万のデータポイントの23のデータセットが含まれている。
論文 参考訳(メタデータ) (2024-10-14T11:29:38Z) - Causal Micro-Narratives [62.47217054314046]
テキストから因果マイクロナラティブを分類する新しい手法を提案する。
これらの物語は、対象対象の因果関係と/または効果の文レベルの説明である。
論文 参考訳(メタデータ) (2024-10-07T17:55:10Z) - Deep Time Series Models: A Comprehensive Survey and Benchmark [74.28364194333447]
時系列データは、現実世界のシナリオにおいて非常に重要である。
近年、時系列コミュニティで顕著なブレークスルーが見られた。
多様な分析タスクのためのディープ時系列モデルの公正なベンチマークとして、時系列ライブラリ(TSLib)をリリースします。
論文 参考訳(メタデータ) (2024-07-18T08:31:55Z) - Contrastive Difference Predictive Coding [79.74052624853303]
本研究では、時系列データの断片を縫合して、将来の事象の予測を学習するために必要なデータの量を減少させるコントラッシブ予測符号化の時間差版を導入する。
目的条件付きRLの非政治アルゴリズムを導出するために,この表現学習手法を適用した。
論文 参考訳(メタデータ) (2023-10-31T03:16:32Z) - Prediction Model For Wordle Game Results With High Robustness [0.0]
本研究では,データ解析と機械学習を用いたWordleのダイナミクスに焦点を当てた。
単語の難易度を予測するために、私たちはバックプロパゲーションニューラルネットワークを採用し、機能工学によるオーバーフィッティングを克服した。
以上の結果から,2023年3月1日に約12,884件の結果が提出され,平均4.8回試みられ,最も難易度の高いクラスタに落下することが示唆された。
論文 参考訳(メタデータ) (2023-09-25T16:10:35Z) - Preserving Knowledge Invariance: Rethinking Robustness Evaluation of
Open Information Extraction [50.62245481416744]
実世界におけるオープン情報抽出モデルの評価をシミュレートする最初のベンチマークを示す。
我々は、それぞれの例が知識不変のcliqueである大規模なテストベッドを設計し、注釈付けする。
さらにロバスト性計量を解明することにより、その性能が全体の傾きに対して一貫して正確であるならば、モデルはロバストであると判断される。
論文 参考訳(メタデータ) (2023-05-23T12:05:09Z) - A data science and machine learning approach to continuous analysis of
Shakespeare's plays [0.0]
ウィリアム・シェイクスピアの作品に機械学習分析を適用した。
この分析は、時間の経過とともに書き方が大きく変化したことを示している。
機械学習を適用して演劇の年を幾何学的に予測すると、ピアソンの相関は0.71である。
論文 参考訳(メタデータ) (2023-01-15T06:25:50Z) - Query Expansion Using Contextual Clue Sampling with Language Models [69.51976926838232]
本稿では,実効的なフィルタリング戦略と検索した文書の融合の組み合わせを,各文脈の生成確率に基づいて提案する。
我々の語彙マッチングに基づくアプローチは、よく確立された高密度検索モデルDPRと比較して、同様のトップ5/トップ20検索精度と上位100検索精度を実現する。
エンド・ツー・エンドのQAでは、読者モデルも我々の手法の恩恵を受けており、いくつかの競争基準に対してエクサクト・マッチのスコアが最も高い。
論文 参考訳(メタデータ) (2022-10-13T15:18:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。