論文の概要: The Problem of Semantic Shift in Longitudinal Monitoring of Social
Media: A Case Study on Mental Health During the COVID-19 Pandemic
- arxiv url: http://arxiv.org/abs/2206.11160v1
- Date: Wed, 22 Jun 2022 15:09:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-23 15:31:11.376787
- Title: The Problem of Semantic Shift in Longitudinal Monitoring of Social
Media: A Case Study on Mental Health During the COVID-19 Pandemic
- Title(参考訳): ソーシャルメディアの縦断モニタリングにおけるセマンティックシフトの問題--COVID-19パンデミック時のメンタルヘルスを事例として
- Authors: Keith Harrigian and Mark Dredze
- Abstract要約: ソーシャルメディアは、研究者が言語分析ツールに基づいて、社会や文化の変化を時間とともに追跡することを可能にする。
これらのツールの多くは、特定の種類の言語に調整する必要がある統計アルゴリズムに依存している。
近年の研究では、セマンティックシフトの存在下では、適切なチューニングが存在しないことが、基礎となる手法の堅牢性を妨げることが示されている。
- 参考スコア(独自算出の注目度): 15.002282686061905
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Social media allows researchers to track societal and cultural changes over
time based on language analysis tools. Many of these tools rely on statistical
algorithms which need to be tuned to specific types of language. Recent studies
have shown the absence of appropriate tuning, specifically in the presence of
semantic shift, can hinder robustness of the underlying methods. However,
little is known about the practical effect this sensitivity may have on
downstream longitudinal analyses. We explore this gap in the literature through
a timely case study: understanding shifts in depression during the course of
the COVID-19 pandemic. We find that inclusion of only a small number of
semantically-unstable features can promote significant changes in longitudinal
estimates of our target outcome. At the same time, we demonstrate that a
recently-introduced method for measuring semantic shift may be used to
proactively identify failure points of language-based models and, in turn,
improve predictive generalization.
- Abstract(参考訳): ソーシャルメディアによって、研究者は言語分析ツールに基づいて、時間とともに社会や文化の変化を追跡することができる。
これらのツールの多くは、特定の種類の言語に調整する必要がある統計アルゴリズムに依存している。
近年の研究では、セマンティックシフトの存在下で適切なチューニングが存在しないことが、基礎となる手法の堅牢性を妨げることが示されている。
しかし、この感度が下流の縦断解析に与える影響についてはほとんど分かっていない。
我々は、新型コロナウイルスのパンデミックに伴ううつ病の変化を理解するためのタイムリーなケーススタディを通じて、このギャップを文献の中で検討する。
少数の意味的に不安定な特徴しか含まないことは、目的とする結果の縦断的な推定において大きな変化をもたらす可能性がある。
同時に,最近導入された意味的変化を測定する手法が,言語ベースのモデルの障害点を積極的に識別し,予測一般化を改善できることを実証する。
関連論文リスト
- Devising a Set of Compact and Explainable Spoken Language Feature for Screening Alzheimer's Disease [52.46922921214341]
アルツハイマー病(AD)は高齢化社会において最も重要な健康問題の一つとなっている。
我々は,大言語モデル(LLM)とTF-IDFモデルの視覚的機能を活用する,説明可能な効果的な機能セットを考案した。
当社の新機能は、自動ADスクリーニングの解釈可能性を高めるステップバイステップで説明し、解釈することができる。
論文 参考訳(メタデータ) (2024-11-28T05:23:22Z) - A Systematic Analysis on the Temporal Generalization of Language Models in Social Media [12.035331011654078]
本稿では,ソーシャルメディア,特にTwitterの時間的変化に注目した。
本研究では,言語モデル(LM)の性能を時間的シフトで評価するための統一評価手法を提案する。
論文 参考訳(メタデータ) (2024-05-15T05:41:06Z) - CausalGym: Benchmarking causal interpretability methods on linguistic
tasks [52.61917615039112]
CausalGymを使って、モデル動作に因果的に影響を及ぼす解釈可能性手法のベンチマークを行う。
ピチアモデル (14M--6.9B) について検討し, 幅広い解釈可能性手法の因果効果について検討した。
DASは他の手法よりも優れており、2つの困難な言語現象の学習軌跡の研究に利用している。
論文 参考訳(メタデータ) (2024-02-19T21:35:56Z) - Syntactic Language Change in English and German: Metrics, Parsers, and Convergences [56.47832275431858]
本論文は,過去160年間の議会討論のコーパスを用いて,英語とドイツ語の統語的言語変化のダイアクロニックな傾向を考察する。
私たちは、広く使われているStanford Coreと、新しい4つの選択肢を含む5つの依存関係をベースとしています。
文長分布の尾部では,構文的尺度の変化が頻繁であることが明らかとなった。
論文 参考訳(メタデータ) (2024-02-18T11:46:16Z) - A Simple and Flexible Modeling for Mental Disorder Detection by Learning
from Clinical Questionnaires [0.2580765958706853]
そこで本研究では,テキストから直接意味を抽出し,症状に関連する記述と比較する手法を提案する。
詳細な分析により,提案モデルがドメイン知識の活用,他の精神疾患への伝達,解釈可能な検出結果の提供に有効であることが示唆された。
論文 参考訳(メタデータ) (2023-06-05T15:23:55Z) - Contextualized language models for semantic change detection: lessons
learned [4.436724861363513]
本稿では,ダイアクロニック・セマンティック・チェンジを検出する文脈的埋め込みに基づく手法の出力の質的分析を行う。
本研究の結果から,文脈化手法は,実際のダイアクロニック・セマンティック・シフトを行なわない単語に対して,高い変化スコアを予測できることが示唆された。
我々の結論は、事前学習された文脈化言語モデルは、語彙感覚の変化と文脈分散の変化を補う傾向にあるということである。
論文 参考訳(メタデータ) (2022-08-31T23:35:24Z) - Quantifying Cognitive Factors in Lexical Decline [2.4424095531386234]
我々は、語彙の減少を予測できる様々な心理言語学的要因(意味論、分布論、音韻論)を提案する。
その結果,提案する因子のほとんどが,各単語の硬化したセットと一致した安定な単語との予測方向に有意な差があることが判明した。
さらにダイアクロニック分析により、単語の減少は時間とともに語彙文脈の多様性を減少させ、徐々に「生態的ニッチ」を狭める傾向があることが明らかになった。
論文 参考訳(メタデータ) (2021-10-12T07:12:56Z) - Combating Temporal Drift in Crisis with Adapted Embeddings [58.4558720264897]
言語の使用は時間とともに変化し、NLPシステムの有効性に影響を与える可能性がある。
本研究は,危機時の言論変化に対応する方法を検討する。
論文 参考訳(メタデータ) (2021-04-17T13:11:41Z) - Semantic coordinates analysis reveals language changes in the AI field [19.878987032985634]
本研究では,分野の出版物における言語の変化を明らかにする意味変化に基づく手法を提案する。
複数の視点からシフト方向と範囲を定量化するために,GloVe方式の確率比を用いる。
セマンティック・コーディネート分析は,研究関心の変化を反映した変化を検出できることを示す。
論文 参考訳(メタデータ) (2020-11-01T15:59:24Z) - Amnesic Probing: Behavioral Explanation with Amnesic Counterfactuals [53.484562601127195]
調査結果から行動学的結論を推測できない点を指摘する。
我々は、どの情報がエンコードされているかではなく、その情報がどのように使われているかに焦点を当てた代替手段を提供する。
論文 参考訳(メタデータ) (2020-06-01T15:00:11Z) - Where New Words Are Born: Distributional Semantic Analysis of Neologisms
and Their Semantic Neighborhoods [51.34667808471513]
分散意味論のパラダイムで定式化されたセマンティック隣人のセマンティック・スパシティと周波数成長率という2つの要因の重要性について検討する。
いずれの因子も単語の出現を予測できるが,後者の仮説はより支持される。
論文 参考訳(メタデータ) (2020-01-21T19:09:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。