論文の概要: Computational Paremiology: Charting the temporal, ecological dynamics of
proverb use in books, news articles, and tweets
- arxiv url: http://arxiv.org/abs/2107.04929v1
- Date: Sat, 10 Jul 2021 23:41:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-13 16:04:16.670439
- Title: Computational Paremiology: Charting the temporal, ecological dynamics of
proverb use in books, news articles, and tweets
- Title(参考訳): 計算疫学:書籍、ニュース記事、ツイートにおける実証的利用の時間的、生態学的ダイナミクスのチャート化
- Authors: E. Davis, C. M. Danforth, W. Mieder, and P. S. Dodds
- Abstract要約: 本研究では,3つのコーパス内における証明の関連性について検討した。
何世紀にもわたって何百万もの本、20年間に何億ものニュース記事、そして10年間に何十億ものツイートがあった。
その結果,各会場にヘビーテール・オブ・ユース・ランク分布が存在することがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Proverbs are an essential component of language and culture, and though much
attention has been paid to their history and currency, there has been
comparatively little quantitative work on changes in the frequency with which
they are used over time. With wider availability of large corpora reflecting
many diverse genres of documents, it is now possible to take a broad and
dynamic view of the importance of the proverb. Here, we measure temporal
changes in the relevance of proverbs within three corpora, differing in kind,
scale, and time frame: Millions of books over centuries; hundreds of millions
of news articles over twenty years; and billions of tweets over a decade. We
find that proverbs present heavy-tailed frequency-of-usage rank distributions
in each venue; exhibit trends reflecting the cultural dynamics of the eras
covered; and have evolved into contemporary forms on social media.
- Abstract(参考訳): 弁証器は言語と文化の重要な要素であり、その歴史と通貨に多くの注意が払われているが、時間とともに使用される頻度の変化について、比較的定量的な研究は行われていない。
文書の様々なジャンルを反映した大規模なコーパスが広く利用可能になったことにより、この証明の重要性を広くダイナミックに見ることが可能になった。
ここでは、3つのコーパス内での証明の時間的変化、種類、規模、時間による違い、何世紀にもわたって何百万もの書籍、20年間で何億ものニュース記事、そして10年間で何十億ものツイートを測定します。
調査の結果,各会場において,使用頻度が重く,時代文化の動態を反映した傾向がみられ,ソーシャルメディア上の現代的形態へと進化してきた。
関連論文リスト
- Forgotten Knowledge: Examining the Citational Amnesia in NLP [63.13508571014673]
論文を引用するのにどれくらいの時間がかかったのか、どのようにして変化したのか、そしてこの引用的注意/記憶に相関する要因は何か。
引用論文の約62%が出版直前の5年間のものであり,約17%が10年以上前のものであることを示す。
1990年から2014年にかけて、引用論文の中央値と年齢の多様性は着実に増加してきたが、その後傾向が逆転し、現在のNLP論文は、時間的引用の多様性が極端に低い。
論文 参考訳(メタデータ) (2023-05-29T18:30:34Z) - A decomposition of book structure through ousiometric fluctuations in
cumulative word-time [1.181206257787103]
本書の本数ではなく,文数の関数として,文語がどのように変化するのかを考察する。
短い本は一般的な傾向を示すだけであり、長い本は一般的な傾向に加えて変動がある。
以上の結果から,長文は短文の拡張版ではなく,短文の連結構造に類似していることが示唆された。
論文 参考訳(メタデータ) (2022-08-19T18:17:27Z) - Language statistics at different spatial, temporal, and grammatical
scales [48.7576911714538]
Twitterのデータを使って、さまざまなスケールでランクの多様性を探求しています。
最も大きな変化は、文法的なスケールのバリエーションによる。
文法スケールが大きくなるにつれて、ランクの多様性曲線は時間スケールや空間スケールによって大きく変化する。
論文 参考訳(メタデータ) (2022-07-02T01:38:48Z) - Semantics of European poetry is shaped by conservative forces: The
relationship between poetic meter and meaning in accentual-syllabic verse [0.0]
我々は1819世紀のヨーロッパ文学において、詩のメーターと意味論の永続的な関連性を示す最初の大規模な公式な証拠を提供する。
本研究は,15万詩の抽象的意味的特徴を用いた一連のクラスタリング実験を通して,この関係を追究するものである。
論文 参考訳(メタデータ) (2021-09-15T08:20:01Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - Lexical semantic change for Ancient Greek and Latin [61.69697586178796]
歴史的文脈における単語の正しい意味の連想は、ダイアクロニック研究の中心的な課題である。
我々は、動的ベイズ混合モデルに基づくセマンティック変化に対する最近の計算的アプローチに基づいて構築する。
本研究では,動的ベイズ混合モデルと最先端埋め込みモデルとのセマンティックな変化を系統的に比較する。
論文 参考訳(メタデータ) (2021-01-22T12:04:08Z) - Analyzing Stylistic Variation across Different Political Regimes [2.233624388203002]
ルーマニアにおける共産主義期と民主主義期における文章の文体変化を分析した。
政治・文化環境の変化の影響は,その様式的変動を確実に確認するために,様々な様式的指標を時間とともに検討する。
また,2つのエポック間の話題の変動の分析を行い,スタイルレベルの変動と比較した。
論文 参考訳(メタデータ) (2020-12-02T16:16:46Z) - Gender bias in magazines oriented to men and women: a computational
approach [58.720142291102135]
女性指向の雑誌の内容と男性指向の雑誌の内容を比較する。
トピック・モデリングの手法により、雑誌で議論されている主要なテーマを特定し、これらのトピックの存在が時間とともに雑誌間でどの程度異なるかを定量化する。
以上の結果から,セクシュアオブジェクトとしての家族,ビジネス,女性の出現頻度は,時間とともに消失する傾向にあることが示唆された。
論文 参考訳(メタデータ) (2020-11-24T14:02:49Z) - Learning language variations in news corpora through differential
embeddings [0.0]
中心的な単語表現とスライスに依存したコントリビューションを持つモデルでは,異なるコーパスから単語埋め込みを同時に学習できることを示す。
各コーパスの年次スライスにおける時間的ダイナミクスと、米国英語と英国英語の言語変化をキュレートしたマルチソースコーパスで捉えることができることを示す。
論文 参考訳(メタデータ) (2020-11-13T14:50:08Z) - Cross-Media Keyphrase Prediction: A Unified Framework with
Multi-Modality Multi-Head Attention and Image Wordings [63.79979145520512]
マルチメディア投稿におけるキーワード予測におけるテキストと画像の併用効果について検討する。
複雑なマルチメディアインタラクションを捉えるために,M3H-Att(Multi-Modality Multi-Head Attention)を提案する。
我々のモデルは,従来の注目ネットワークに基づいて,過去の技術状況よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-11-03T08:44:18Z) - Storywrangler: A massive exploratorium for sociolinguistic, cultural,
socioeconomic, and political timelines using Twitter [0.9485862597874625]
リアルタイムでは、ソーシャルメディアのデータは世界の出来事、大衆文化、そして何百万人もの一般人の日々の会話を、ほとんど慣習化されず記録されていない規模で強く刻み込む。
ここでは、2008年から2021年までの約1兆1グラムを含む100億以上のツイートの日々のキュレーションを実行するために設計された自然言語処理機器であるStorywranglerについて説明する。
毎日、ツイートを100以上の言語にまたがるユニグラム、ビッグラム、トリグラムに分割します。n-gramの使用頻度を追跡し、単語、ハッシュタグ、ハンドルなどのZipf分布を生成します。
論文 参考訳(メタデータ) (2020-07-25T18:09:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。