論文の概要: Unveiling Temporal Trends in 19th Century Literature: An Information Retrieval Approach
- arxiv url: http://arxiv.org/abs/2501.06833v1
- Date: Sun, 12 Jan 2025 15:00:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-14 14:20:09.749426
- Title: Unveiling Temporal Trends in 19th Century Literature: An Information Retrieval Approach
- Title(参考訳): 19世紀の文学における時間的傾向の解明 : 情報検索的アプローチ
- Authors: Suchana Datta, Dwaipayan Roy, Derek Greene, Gerardine Meaney,
- Abstract要約: 英語文学において、19世紀はスタイル、テーマ、ジャンルに大きな変化を目撃した。
本稿では、情報検索のレンズを通して、19世紀の英語小説における用語使用の進化について考察する。
- 参考スコア(独自算出の注目度): 5.804963603084041
- License:
- Abstract: In English literature, the 19th century witnessed a significant transition in styles, themes, and genres. Consequently, the novels from this period display remarkable diversity. This paper explores these variations by examining the evolution of term usage in 19th century English novels through the lens of information retrieval. By applying a query expansion-based approach to a decade-segmented collection of fiction from the British Library, we examine how related terms vary over time. Our analysis employs multiple standard metrics including Kendall's tau, Jaccard similarity, and Jensen-Shannon divergence to assess overlaps and shifts in expanded query term sets. Our results indicate a significant degree of divergence in the related terms across decades as selected by the query expansion technique, suggesting substantial linguistic and conceptual changes throughout the 19th century novels.
- Abstract(参考訳): 英語文学において、19世紀はスタイル、テーマ、ジャンルに大きな変化を目撃した。
その結果、この時期の小説は顕著な多様性を示している。
本稿では、情報検索のレンズを通して、19世紀の英語小説における用語利用の進化を考察し、これらのバリエーションについて考察する。
大英図書館の10年にわたるフィクション集にクエリ拡張に基づくアプローチを適用することにより,関連用語が時間とともにどのように変化するかを検討する。
我々の分析では、拡張されたクエリ項集合の重複とシフトを評価するために、Kendall's tau、Jaccard類似性、Jensen-Shannon発散など、複数の標準メトリクスを使用している。
以上の結果から,19世紀小説の言語的,概念的な変化が示唆された。
関連論文リスト
- LFED: A Literary Fiction Evaluation Dataset for Large Language Models [58.85989777743013]
元々は中国語で書かれたか、中国語に翻訳された95の文学小説を収集し、数世紀にわたって幅広い話題を扱っている。
質問分類を8つのカテゴリーで定義し,1,304の質問の作成を導く。
我々は、小説の特定の属性(小説の種類、文字番号、出版年など)がLLMのパフォーマンスに与える影響を詳細に分析する。
論文 参考訳(メタデータ) (2024-05-16T15:02:24Z) - Understanding Cross-Lingual Alignment -- A Survey [52.572071017877704]
言語間アライメントは多言語言語モデルにおける言語間の表現の有意義な類似性である。
本研究は,言語間アライメントの向上,手法の分類,分野全体からの洞察の要約といった手法の文献を調査する。
論文 参考訳(メタデータ) (2024-04-09T11:39:53Z) - Syntactic Language Change in English and German: Metrics, Parsers, and Convergences [56.47832275431858]
本論文は,過去160年間の議会討論のコーパスを用いて,英語とドイツ語の統語的言語変化のダイアクロニックな傾向を考察する。
私たちは、広く使われているStanford Coreと、新しい4つの選択肢を含む5つの依存関係をベースとしています。
文長分布の尾部では,構文的尺度の変化が頻繁であることが明らかとなった。
論文 参考訳(メタデータ) (2024-02-18T11:46:16Z) - A Novel Method for Analysing Racial Bias: Collection of Person Level
References [6.345851712811529]
本稿では,2つのグループ間の表現の差異を分析する新しい手法を提案する。
我々は1850年から2000年にかけての書籍におけるアフリカ系アメリカ人と白人の表現を、Google Booksデータセットを用いて検討した。
論文 参考訳(メタデータ) (2023-10-24T14:00:01Z) - Query Expansion Using Contextual Clue Sampling with Language Models [69.51976926838232]
本稿では,実効的なフィルタリング戦略と検索した文書の融合の組み合わせを,各文脈の生成確率に基づいて提案する。
我々の語彙マッチングに基づくアプローチは、よく確立された高密度検索モデルDPRと比較して、同様のトップ5/トップ20検索精度と上位100検索精度を実現する。
エンド・ツー・エンドのQAでは、読者モデルも我々の手法の恩恵を受けており、いくつかの競争基準に対してエクサクト・マッチのスコアが最も高い。
論文 参考訳(メタデータ) (2022-10-13T15:18:04Z) - Temporal Analysis on Topics Using Word2Vec [0.0]
本研究では,トレンド検出と可視化の新しい手法を提案する。具体的には,話題の変化を時間とともにモデル化する。
この手法は、20のNews Groupsデータセットに存在する様々なメディアハウスの記事群でテストされた。
論文 参考訳(メタデータ) (2022-09-23T16:51:29Z) - A decomposition of book structure through ousiometric fluctuations in
cumulative word-time [1.181206257787103]
本書の本数ではなく,文数の関数として,文語がどのように変化するのかを考察する。
短い本は一般的な傾向を示すだけであり、長い本は一般的な傾向に加えて変動がある。
以上の結果から,長文は短文の拡張版ではなく,短文の連結構造に類似していることが示唆された。
論文 参考訳(メタデータ) (2022-08-19T18:17:27Z) - Textual Stylistic Variation: Choices, Genres and Individuals [0.8057441774248633]
この章では、テキストコレクションのスタイリスティックな変動の統計処理のためのより情報的なターゲットメトリクスを論じている。
本章ではジャンルごとの変奏について論じ、個々の選択による変奏と対比する。
論文 参考訳(メタデータ) (2022-05-01T16:39:49Z) - Semantics of European poetry is shaped by conservative forces: The
relationship between poetic meter and meaning in accentual-syllabic verse [0.0]
我々は1819世紀のヨーロッパ文学において、詩のメーターと意味論の永続的な関連性を示す最初の大規模な公式な証拠を提供する。
本研究は,15万詩の抽象的意味的特徴を用いた一連のクラスタリング実験を通して,この関係を追究するものである。
論文 参考訳(メタデータ) (2021-09-15T08:20:01Z) - Lexical semantic change for Ancient Greek and Latin [61.69697586178796]
歴史的文脈における単語の正しい意味の連想は、ダイアクロニック研究の中心的な課題である。
我々は、動的ベイズ混合モデルに基づくセマンティック変化に対する最近の計算的アプローチに基づいて構築する。
本研究では,動的ベイズ混合モデルと最先端埋め込みモデルとのセマンティックな変化を系統的に比較する。
論文 参考訳(メタデータ) (2021-01-22T12:04:08Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。