論文の概要: Characterizing Linguistic Shifts in Croatian News via Diachronic Word Embeddings
- arxiv url: http://arxiv.org/abs/2506.13569v1
- Date: Mon, 16 Jun 2025 14:54:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:48.707791
- Title: Characterizing Linguistic Shifts in Croatian News via Diachronic Word Embeddings
- Title(参考訳): Diachronic Word Embeddingsによるクロアチア語ニュースの言語変化の特徴付け
- Authors: David Dukić, Ana Barić, Marko Čuljak, Josip Jukić, Martin Tutek,
- Abstract要約: 950万のクロアチアのニュース記事のコーパスを用いて、5年間にトレーニングされたスキップグラムワード埋め込みを用いて意味変化を定量化する。
分析の結果,単語の埋め込みは,この時間帯における主要な話題に関連する用語の言語的変化を捉えていることがわかった。
また、2020年以降のエンコードによる埋め込みが感情分析タスクの肯定性を高めているという証拠も見出され、同時期に精神状態の低下が報告された研究とは対照的である。
- 参考スコア(独自算出の注目度): 1.2000346539649842
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Measuring how semantics of words change over time improves our understanding of how cultures and perspectives change. Diachronic word embeddings help us quantify this shift, although previous studies leveraged substantial temporally annotated corpora. In this work, we use a corpus of 9.5 million Croatian news articles spanning the past 25 years and quantify semantic change using skip-gram word embeddings trained on five-year periods. Our analysis finds that word embeddings capture linguistic shifts of terms pertaining to major topics in this timespan (COVID-19, Croatia joining the European Union, technological advancements). We also find evidence that embeddings from post-2020 encode increased positivity in sentiment analysis tasks, contrasting studies reporting a decline in mental health over the same period.
- Abstract(参考訳): 言葉の意味が時間とともにどのように変化するかを測定することで、文化や視点がどのように変化するかを理解することができます。
ダイアクロニック単語の埋め込みはこのシフトを定量化するのに役立つが、以前の研究では時間的に注釈付けされたコーパスを利用していた。
本研究では,過去25年間のクロアチアのニュース記事950万件のコーパスを用いて,5年間にわたって訓練されたスキップグラム語埋め込みを用いて意味変化を定量化する。
分析の結果, 単語の埋め込みは, この時代の主要な話題(新型コロナウイルス, クロアチアの欧州連合加盟, 技術進歩)に関連する用語の言語的変化を捉えていることがわかった。
また、2020年以降のエンコードによる埋め込みが感情分析タスクの肯定性を高めているという証拠も見出され、同時期に精神状態の低下が報告された研究とは対照的である。
関連論文リスト
- Historical Ink: Semantic Shift Detection for 19th Century Spanish [0.0]
本稿では,ラテンアメリカ・スペイン語を中心に,19世紀のスペイン語文における単語の意味の進化について考察する。
言語進化を理解する上で重要なセマンティックシフト検出(SSD)タスクに対処する。
論文 参考訳(メタデータ) (2024-07-08T16:49:34Z) - Syntactic Language Change in English and German: Metrics, Parsers, and Convergences [56.47832275431858]
本論文は,過去160年間の議会討論のコーパスを用いて,英語とドイツ語の統語的言語変化のダイアクロニックな傾向を考察する。
私たちは、広く使われているStanford Coreと、新しい4つの選択肢を含む5つの依存関係をベースとしています。
文長分布の尾部では,構文的尺度の変化が頻繁であることが明らかとなった。
論文 参考訳(メタデータ) (2024-02-18T11:46:16Z) - Neighboring Words Affect Human Interpretation of Saliency Explanations [65.29015910991261]
単語レベルのサリエンシの説明は、しばしばテキストベースのモデルで特徴属性を伝えるために使われる。
近年の研究では、単語の長さなどの表面的要因が、コミュニケーションされたサリエンシスコアの人間の解釈を歪めてしまうことが報告されている。
本研究では,単語の近傍にある単語のマーキングが,その単語の重要性に対する説明者の認識にどのように影響するかを検討する。
論文 参考訳(メタデータ) (2023-05-04T09:50:25Z) - The Problem of Semantic Shift in Longitudinal Monitoring of Social
Media: A Case Study on Mental Health During the COVID-19 Pandemic [15.002282686061905]
ソーシャルメディアは、研究者が言語分析ツールに基づいて、社会や文化の変化を時間とともに追跡することを可能にする。
これらのツールの多くは、特定の種類の言語に調整する必要がある統計アルゴリズムに依存している。
近年の研究では、セマンティックシフトの存在下では、適切なチューニングが存在しないことが、基礎となる手法の堅牢性を妨げることが示されている。
論文 参考訳(メタデータ) (2022-06-22T15:09:28Z) - Quantifying Cognitive Factors in Lexical Decline [2.4424095531386234]
我々は、語彙の減少を予測できる様々な心理言語学的要因(意味論、分布論、音韻論)を提案する。
その結果,提案する因子のほとんどが,各単語の硬化したセットと一致した安定な単語との予測方向に有意な差があることが判明した。
さらにダイアクロニック分析により、単語の減少は時間とともに語彙文脈の多様性を減少させ、徐々に「生態的ニッチ」を狭める傾向があることが明らかになった。
論文 参考訳(メタデータ) (2021-10-12T07:12:56Z) - Disambiguatory Signals are Stronger in Word-initial Positions [48.18148856974974]
単語の初期と後期のセグメントの情報を比較するための既存の手法の相違点を指摘する。
何百もの言語にまたがって、言葉で情報を読み込むという言語横断的な傾向があるという証拠が見つかりました。
論文 参考訳(メタデータ) (2021-02-03T18:19:16Z) - Where New Words Are Born: Distributional Semantic Analysis of Neologisms
and Their Semantic Neighborhoods [51.34667808471513]
分散意味論のパラダイムで定式化されたセマンティック隣人のセマンティック・スパシティと周波数成長率という2つの要因の重要性について検討する。
いずれの因子も単語の出現を予測できるが,後者の仮説はより支持される。
論文 参考訳(メタデータ) (2020-01-21T19:09:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。