論文の概要: Methods, Data, and Conceptual Change: Reflections from Two Quantitative Diachronic Case Studies
- arxiv url: http://arxiv.org/abs/2605.02052v1
- Date: Sun, 03 May 2026 20:53:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.061904
- Title: Methods, Data, and Conceptual Change: Reflections from Two Quantitative Diachronic Case Studies
- Title(参考訳): 方法,データ,概念的変化:2つの定量ダイアクロニックケーススタディからの考察
- Authors: Catherine Wong, Bach Phan-Tat, Susan Fitzmaurice,
- Abstract要約: EEBO-TCP(約1470s-1690s, 765Mワード)における初期近代英語言説のクアッドベース概念モデリングとロイヤルソサエティコーパス6.0.4(1750-1799)における科学文章のSynFlow解析を用いた英語データについて検討する。
比較方法論反射は、純粋に語彙的、周波数に基づくアプローチの限界を明確にする。
- 参考スコア(独自算出の注目度): 0.7196517805648485
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This discussion paper reflects on how quantitative approaches to historical linguistics interact with dataset properties. Drawing on two worked examples, we examine English data using quad-based concept modelling of Early Modern English discourse in EEBO-TCP (c. 1470s-1690s; 765M words) alongside SynFlow analysis of scientific writing in Royal Society Corpus 6.0.4 (1750-1799; drawn from a 78.6M-token open corpus). Through parallel comparison, the paper explores how each approach operationalises concepts, the data assumptions they entail, and the diachronic interpretations they support. We argue that comparative methodological reflection clarifies the limits of purely lexical, frequency-based approaches and highlights how dataset structure shapes the kinds of semantic change that quantitative methods can reliably detect.
- Abstract(参考訳): 本稿では,歴史的言語学への定量的アプローチがデータセット特性とどのように相互作用するかを考察する。
本稿では,EEBO-TCP (約1470s-1690s, 765Mワード) における現代英語の言説をクアッドベースでモデル化した英語データと,王立協会コーパス6.0.4(1750-1799,78.6Mオープンコーパス)における科学文献のシンフロー解析を行った。
並列比較を通じて、各アプローチがどのように概念をどのように運用するか、それらが必要とするデータ仮定、そしてそれらがサポートするダイアクロニック解釈を考察する。
比較方法論反射は、純粋に語彙的かつ周波数に基づくアプローチの限界を明確にし、定量的手法が確実に検出できる意味変化の種類をデータセット構造がどのように形成するかを強調している。
関連論文リスト
- Computational Measurement of Political Positions: A Review of Text-Based Ideal Point Estimation Algorithms [0.0]
本稿では、教師なしおよび半教師付き計算テキストベース理想点推定(CT-IPE)アルゴリズムの体系的レビューを行う。
CT-IPEアルゴリズムは、議会演説、政党宣言、ソーシャルメディアからイデオロギー的嗜好を推定するために、政治科学、コミュニケーション、計算社会科学、コンピュータ科学で広く使われている。
論文 参考訳(メタデータ) (2025-11-17T11:01:09Z) - Unpacking Robustness in Inflectional Languages: Adversarial Evaluation and Mechanistic Insights [2.3224139967919974]
我々は、逆行攻撃が屈折言語でどのように作用するかを評価し、説明する。
We use a novel protocol inspired by mechanistic interpretability, based on Edge Attribution Patching (EAP) method。
タスク指向データセットMultiEmoに基づく新しいベンチマークを作成する。
論文 参考訳(メタデータ) (2025-05-08T08:00:03Z) - How Well Do Text Embedding Models Understand Syntax? [50.440590035493074]
テキスト埋め込みモデルが幅広い構文的文脈にまたがって一般化する能力は、まだ解明されていない。
その結果,既存のテキスト埋め込みモデルは,これらの構文的理解課題に十分対応していないことが明らかとなった。
多様な構文シナリオにおけるテキスト埋め込みモデルの一般化能力を高めるための戦略を提案する。
論文 参考訳(メタデータ) (2023-11-14T08:51:00Z) - Disco-Bench: A Discourse-Aware Evaluation Benchmark for Language
Modelling [70.23876429382969]
本研究では,多種多様なNLPタスクに対して,文内談話特性を評価できるベンチマークを提案する。
ディスコ・ベンチは文学領域における9つの文書レベルのテストセットから構成されており、豊富な談話現象を含んでいる。
また,言語分析のために,対象モデルが談話知識を学習するかどうかを検証できる診断テストスイートを設計する。
論文 参考訳(メタデータ) (2023-07-16T15:18:25Z) - Contextualized language models for semantic change detection: lessons
learned [4.436724861363513]
本稿では,ダイアクロニック・セマンティック・チェンジを検出する文脈的埋め込みに基づく手法の出力の質的分析を行う。
本研究の結果から,文脈化手法は,実際のダイアクロニック・セマンティック・シフトを行なわない単語に対して,高い変化スコアを予測できることが示唆された。
我々の結論は、事前学習された文脈化言語モデルは、語彙感覚の変化と文脈分散の変化を補う傾向にあるということである。
論文 参考訳(メタデータ) (2022-08-31T23:35:24Z) - Text analysis and deep learning: A network approach [0.0]
本稿では,変圧器モデルとネットワーク解析を併用して,言語使用の自己参照表現を生成する手法を提案する。
我々のアプローチは、基礎となるモデルと強く整合した言語関係と、それらに関する数学的に明確に定義された操作を生成する。
我々の知る限りでは、深層言語モデルから直接意味ネットワークを抽出する最初の教師なし手法である。
論文 参考訳(メタデータ) (2021-10-08T14:18:36Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - A computational model implementing subjectivity with the 'Room Theory'.
The case of detecting Emotion from Text [68.8204255655161]
本研究は,テキスト分析における主観性と一般的文脈依存性を考慮した新しい手法を提案する。
単語間の類似度を用いて、ベンチマーク中の要素の相対的関連性を抽出することができる。
この方法は、主観的評価がテキストの相対値や意味を理解するために関係しているすべてのケースに適用できる。
論文 参考訳(メタデータ) (2020-05-12T21:26:04Z) - Analysing Lexical Semantic Change with Contextualised Word
Representations [7.071298726856781]
本稿では,BERTニューラルネットワークモデルを用いて単語使用率の表現を求める手法を提案する。
我々は新しい評価データセットを作成し、モデル表現と検出された意味変化が人間の判断と正に相関していることを示す。
論文 参考訳(メタデータ) (2020-04-29T12:18:14Z) - How Far are We from Effective Context Modeling? An Exploratory Study on
Semantic Parsing in Context [59.13515950353125]
文法に基づく意味解析を行い,その上に典型的な文脈モデリング手法を適用する。
我々は,2つの大きなクロスドメインデータセットに対して,13のコンテキストモデリング手法を評価した。
論文 参考訳(メタデータ) (2020-02-03T11:28:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。