論文の概要: How COVID-19 Is Changing Our Language : Detecting Semantic Shift in
Twitter Word Embeddings
- arxiv url: http://arxiv.org/abs/2102.07836v1
- Date: Mon, 15 Feb 2021 20:29:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-17 15:07:54.988013
- Title: How COVID-19 Is Changing Our Language : Detecting Semantic Shift in
Twitter Word Embeddings
- Title(参考訳): 新型コロナウイルスが言語をどう変えるか : Twitterの単語埋め込みにおける意味的変化の検出
- Authors: Yanzhu Guo, Christos Xypolopoulos and Michalis Vazirgiannis
- Abstract要約: 研究は、健康危機によって引き起こされるソーシャルメディア言語の意味的変化を検出することを目指しています。
新型コロナウイルス関連ビッグデータをTwitterから抽出し、流行後、異なる期間に別々の単語埋め込みモデルをトレーニングします。
前後回転アライメントに基づく安定性測定により、グローバルセマンティックシフトの大きさを定量化します。
- 参考スコア(独自算出の注目度): 16.520392870150797
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Words are malleable objects, influenced by events that are reflected in
written texts. Situated in the global outbreak of COVID-19, our research aims
at detecting semantic shifts in social media language triggered by the health
crisis. With COVID-19 related big data extracted from Twitter, we train
separate word embedding models for different time periods after the outbreak.
We employ an alignment-based approach to compare these embeddings with a
general-purpose Twitter embedding unrelated to COVID-19. We also compare our
trained embeddings among them to observe diachronic evolution. Carrying out
case studies on a set of words chosen by topic detection, we verify that our
alignment approach is valid. Finally, we quantify the size of global semantic
shift by a stability measure based on back-and-forth rotational alignment.
- Abstract(参考訳): 単語は、テキストに反映されるイベントに影響される可搬オブジェクトです。
新型コロナウイルス(COVID-19)の世界的な流行にある私たちの研究は、健康危機によって引き起こされるソーシャルメディア言語のセマンティックシフトを検出することを目指しています。
新型コロナウイルス関連ビッグデータをTwitterから抽出し、流行後、異なる期間に別々の単語埋め込みモデルをトレーニングします。
これらの埋め込みを、COVID-19とは無関係な汎用的なTwitter埋め込みと比較するために、アライメントベースのアプローチを採用しています。
また、トレーニング済みの埋め込みをダイアクロニックな進化を観察するために比較します。
トピック検出によって選択された単語群についてケーススタディを実施し,アライメントアプローチが有効であることを検証した。
最後に, 前後回転アライメントに基づく安定性尺度を用いて, グローバルセマンティクスシフトの大きさを定量化する。
関連論文リスト
- Revealing COVID-19's Social Dynamics: Diachronic Semantic Analysis of Vaccine and Symptom Discourse on Twitter [12.75089285888253]
本稿では,あらかじめ定義されたアンカー語を使わずに,ソーシャルメディアデータ中の縦長的な意味変化を捉えるために,教師なしの動的単語埋め込み手法を提案する。
新型コロナウイルス(COVID-19)の大規模なTwitterデータセットに基づいて評価されたこの手法は、異なるパンデミック段階におけるワクチンおよび症状関連エンティティのセマンティックな進化パターンを明らかにする。
論文 参考訳(メタデータ) (2024-10-10T20:15:28Z) - Syntactic Language Change in English and German: Metrics, Parsers, and Convergences [56.47832275431858]
本論文は,過去160年間の議会討論のコーパスを用いて,英語とドイツ語の統語的言語変化のダイアクロニックな傾向を考察する。
私たちは、広く使われているStanford Coreと、新しい4つの選択肢を含む5つの依存関係をベースとしています。
文長分布の尾部では,構文的尺度の変化が頻繁であることが明らかとなった。
論文 参考訳(メタデータ) (2024-02-18T11:46:16Z) - Semantic Change Detection for the Romanian Language [0.5202524136984541]
実世界のデータセット上に静的および文脈的単語埋め込みモデルを作成するための様々な戦略を分析する。
まず,英語データセット (SEMEVAL-CCOHA) とルーマニア語データセット (SEMEVAL-CCOHA) で単語埋め込みモデルの評価を行った。
実験結果から,コーパスによっては,モデルの選択と,意味的変化を検出するためのスコアを計算するための距離が最も重要な要因であることが示唆された。
論文 参考訳(メタデータ) (2023-08-23T13:37:02Z) - Relational Sentence Embedding for Flexible Semantic Matching [86.21393054423355]
文埋め込みの可能性を明らかにするための新しいパラダイムとして,文埋め込み(Sentence Embedding, RSE)を提案する。
RSEは文関係のモデル化に有効で柔軟性があり、一連の最先端の埋め込み手法より優れている。
論文 参考訳(メタデータ) (2022-12-17T05:25:17Z) - Twitter-COMMs: Detecting Climate, COVID, and Military Multimodal
Misinformation [83.2079454464572]
本稿では,DARPAセマンティック・フォレスティクス(SemaFor)プログラムにおける画像テキスト不整合検出へのアプローチについて述べる。
Twitter-COMMsは大規模マルチモーダルデータセットで、884万のツイートが気候変動、新型コロナウイルス、軍用車両のトピックに関連する。
我々は、最先端のCLIPモデルに基づいて、自動生成されたランダムとハードのネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガ
論文 参考訳(メタデータ) (2021-12-16T03:37:20Z) - SLUA: A Super Lightweight Unsupervised Word Alignment Model via
Cross-Lingual Contrastive Learning [79.91678610678885]
超軽量非教師付き単語アライメントモデル(SLUA)を提案する。
いくつかの公開ベンチマークによる実験結果から,我々のモデルは性能が向上しても競争力を発揮することが示された。
特に、我々のモデルはバイリンガル単語の埋め込みと単語のアライメントを統一する先駆的な試みであると認識している。
論文 参考訳(メタデータ) (2021-02-08T05:54:11Z) - Fake it Till You Make it: Self-Supervised Semantic Shifts for
Monolingual Word Embedding Tasks [58.87961226278285]
語彙意味変化をモデル化するための自己教師付きアプローチを提案する。
本手法は,任意のアライメント法を用いて意味変化の検出に利用できることを示す。
3つの異なるデータセットに対する実験結果を用いて,本手法の有用性について述べる。
論文 参考訳(メタデータ) (2021-01-30T18:59:43Z) - Detecting Emerging Symptoms of COVID-19 using Context-based Twitter
Embeddings [11.12401987552366]
新型コロナウイルスの症状を反復的に検出するためのグラフベースのアプローチを提案する。
私たちは、Twitterデータに適用されたアプローチが、CDC(Centers for Disease Control)によって報告される前に、症状の言及を著しく検出できることに気付きました。
論文 参考訳(メタデータ) (2020-11-08T13:56:05Z) - SST-BERT at SemEval-2020 Task 1: Semantic Shift Tracing by Clustering in
BERT-based Embedding Spaces [63.17308641484404]
本稿では,異なる単語の意味の表現として,各単語の異なる事象のクラスタを特定することを提案する。
得られたクラスタの分解は、自然に4つのターゲット言語において、各ターゲットワードごとの意味的シフトのレベルを定量化することができる。
当社のアプローチは,提供されたすべてのSemEvalベースラインを抜いて,個別(言語毎)と全体の両方で良好に動作します。
論文 参考訳(メタデータ) (2020-10-02T08:38:40Z) - Covid-Transformer: Detecting COVID-19 Trending Topics on Twitter Using
Universal Sentence Encoder [7.305019142196582]
新型コロナウイルス感染症(COVID-19)がパンデミックを引き起こし、世界200カ国以上に感染した。
新型コロナウイルス(COVID-19)の世界的な影響により、ほぼ至る所で人々の大きな関心事となっている。
われわれは、ツイートを分析し、トレンドトピックやTwitter上の人々の関心事を検出する。
論文 参考訳(メタデータ) (2020-09-08T19:00:38Z) - CORD19STS: COVID-19 Semantic Textual Similarity Dataset [17.333108123527783]
オープンリサーチデータセット(CORD-19チャレンジ)から収集した13,710の注釈付き文対を含むCORD19STSデータセットを紹介する。
それぞれの文対は5人のAmazon Mechanical Turk (AMT) の群衆労働者によって注釈付けされ、それぞれのラベルは文対の間に異なる意味的類似度レベルを表す。
収集したアノテーションの検証に厳格な資格タスクを使用した後、最後のCORD19STSデータセットは13,710対の文対を含む。
論文 参考訳(メタデータ) (2020-07-05T22:23:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。