論文の概要: How COVID-19 Is Changing Our Language : Detecting Semantic Shift in
Twitter Word Embeddings
- arxiv url: http://arxiv.org/abs/2102.07836v1
- Date: Mon, 15 Feb 2021 20:29:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-17 15:07:54.988013
- Title: How COVID-19 Is Changing Our Language : Detecting Semantic Shift in
Twitter Word Embeddings
- Title(参考訳): 新型コロナウイルスが言語をどう変えるか : Twitterの単語埋め込みにおける意味的変化の検出
- Authors: Yanzhu Guo, Christos Xypolopoulos and Michalis Vazirgiannis
- Abstract要約: 研究は、健康危機によって引き起こされるソーシャルメディア言語の意味的変化を検出することを目指しています。
新型コロナウイルス関連ビッグデータをTwitterから抽出し、流行後、異なる期間に別々の単語埋め込みモデルをトレーニングします。
前後回転アライメントに基づく安定性測定により、グローバルセマンティックシフトの大きさを定量化します。
- 参考スコア(独自算出の注目度): 16.520392870150797
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Words are malleable objects, influenced by events that are reflected in
written texts. Situated in the global outbreak of COVID-19, our research aims
at detecting semantic shifts in social media language triggered by the health
crisis. With COVID-19 related big data extracted from Twitter, we train
separate word embedding models for different time periods after the outbreak.
We employ an alignment-based approach to compare these embeddings with a
general-purpose Twitter embedding unrelated to COVID-19. We also compare our
trained embeddings among them to observe diachronic evolution. Carrying out
case studies on a set of words chosen by topic detection, we verify that our
alignment approach is valid. Finally, we quantify the size of global semantic
shift by a stability measure based on back-and-forth rotational alignment.
- Abstract(参考訳): 単語は、テキストに反映されるイベントに影響される可搬オブジェクトです。
新型コロナウイルス(COVID-19)の世界的な流行にある私たちの研究は、健康危機によって引き起こされるソーシャルメディア言語のセマンティックシフトを検出することを目指しています。
新型コロナウイルス関連ビッグデータをTwitterから抽出し、流行後、異なる期間に別々の単語埋め込みモデルをトレーニングします。
これらの埋め込みを、COVID-19とは無関係な汎用的なTwitter埋め込みと比較するために、アライメントベースのアプローチを採用しています。
また、トレーニング済みの埋め込みをダイアクロニックな進化を観察するために比較します。
トピック検出によって選択された単語群についてケーススタディを実施し,アライメントアプローチが有効であることを検証した。
最後に, 前後回転アライメントに基づく安定性尺度を用いて, グローバルセマンティクスシフトの大きさを定量化する。
関連論文リスト
- Relational Sentence Embedding for Flexible Semantic Matching [86.21393054423355]
文埋め込みの可能性を明らかにするための新しいパラダイムとして,文埋め込み(Sentence Embedding, RSE)を提案する。
RSEは文関係のモデル化に有効で柔軟性があり、一連の最先端の埋め込み手法より優れている。
論文 参考訳(メタデータ) (2022-12-17T05:25:17Z) - Adversarial Learning-based Stance Classifier for COVID-19-related Health
Policies [14.558584240713154]
本研究では、新型コロナウイルス関連健康政策に対する公衆の態度を自動的に識別する対人学習に基づくスタンス分類器を提案する。
モデルをより深く理解するために、モデルに外部知識としてポリシー記述を組み込む。
新型コロナウイルス関連健康政策のスタンス検出タスクにおいて,幅広い基準線の性能を評価する。
論文 参考訳(メタデータ) (2022-09-10T10:27:21Z) - Twitter-COMMs: Detecting Climate, COVID, and Military Multimodal
Misinformation [83.2079454464572]
本稿では,DARPAセマンティック・フォレスティクス(SemaFor)プログラムにおける画像テキスト不整合検出へのアプローチについて述べる。
Twitter-COMMsは大規模マルチモーダルデータセットで、884万のツイートが気候変動、新型コロナウイルス、軍用車両のトピックに関連する。
我々は、最先端のCLIPモデルに基づいて、自動生成されたランダムとハードのネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガ
論文 参考訳(メタデータ) (2021-12-16T03:37:20Z) - Misleading the Covid-19 vaccination discourse on Twitter: An exploratory
study of infodemic around the pandemic [0.45593531937154413]
我々は7ヶ月(2020年9月~2021年3月)のコビッドウイルスワクチン接種に関連する中規模のツイートコーパス(20万件)を収集する。
Transfer Learningのアプローチに従えば、事前訓練されたTransformerベースのXLNetモデルを使用して、ツイートをミスリーディングまたは非ミスリーディングに分類する。
我々は、自然に誤解を招くコーパスのツイートの特徴と非誤解を招くツイートの特徴を調査・対比するためにこの手法を構築した。
いくつかのMLモデルは、最大90%の精度で予測に使用され、各特徴の重要性は、SHAP Explainable AI (X)を用いて説明される。
論文 参考訳(メタデータ) (2021-08-16T17:02:18Z) - Combating Temporal Drift in Crisis with Adapted Embeddings [58.4558720264897]
言語の使用は時間とともに変化し、NLPシステムの有効性に影響を与える可能性がある。
本研究は,危機時の言論変化に対応する方法を検討する。
論文 参考訳(メタデータ) (2021-04-17T13:11:41Z) - SLUA: A Super Lightweight Unsupervised Word Alignment Model via
Cross-Lingual Contrastive Learning [79.91678610678885]
超軽量非教師付き単語アライメントモデル(SLUA)を提案する。
いくつかの公開ベンチマークによる実験結果から,我々のモデルは性能が向上しても競争力を発揮することが示された。
特に、我々のモデルはバイリンガル単語の埋め込みと単語のアライメントを統一する先駆的な試みであると認識している。
論文 参考訳(メタデータ) (2021-02-08T05:54:11Z) - Fake it Till You Make it: Self-Supervised Semantic Shifts for
Monolingual Word Embedding Tasks [58.87961226278285]
語彙意味変化をモデル化するための自己教師付きアプローチを提案する。
本手法は,任意のアライメント法を用いて意味変化の検出に利用できることを示す。
3つの異なるデータセットに対する実験結果を用いて,本手法の有用性について述べる。
論文 参考訳(メタデータ) (2021-01-30T18:59:43Z) - Detecting Emerging Symptoms of COVID-19 using Context-based Twitter
Embeddings [11.12401987552366]
新型コロナウイルスの症状を反復的に検出するためのグラフベースのアプローチを提案する。
私たちは、Twitterデータに適用されたアプローチが、CDC(Centers for Disease Control)によって報告される前に、症状の言及を著しく検出できることに気付きました。
論文 参考訳(メタデータ) (2020-11-08T13:56:05Z) - SST-BERT at SemEval-2020 Task 1: Semantic Shift Tracing by Clustering in
BERT-based Embedding Spaces [63.17308641484404]
本稿では,異なる単語の意味の表現として,各単語の異なる事象のクラスタを特定することを提案する。
得られたクラスタの分解は、自然に4つのターゲット言語において、各ターゲットワードごとの意味的シフトのレベルを定量化することができる。
当社のアプローチは,提供されたすべてのSemEvalベースラインを抜いて,個別(言語毎)と全体の両方で良好に動作します。
論文 参考訳(メタデータ) (2020-10-02T08:38:40Z) - Covid-Transformer: Detecting COVID-19 Trending Topics on Twitter Using
Universal Sentence Encoder [7.305019142196582]
新型コロナウイルス感染症(COVID-19)がパンデミックを引き起こし、世界200カ国以上に感染した。
新型コロナウイルス(COVID-19)の世界的な影響により、ほぼ至る所で人々の大きな関心事となっている。
われわれは、ツイートを分析し、トレンドトピックやTwitter上の人々の関心事を検出する。
論文 参考訳(メタデータ) (2020-09-08T19:00:38Z) - CORD19STS: COVID-19 Semantic Textual Similarity Dataset [17.333108123527783]
オープンリサーチデータセット(CORD-19チャレンジ)から収集した13,710の注釈付き文対を含むCORD19STSデータセットを紹介する。
それぞれの文対は5人のAmazon Mechanical Turk (AMT) の群衆労働者によって注釈付けされ、それぞれのラベルは文対の間に異なる意味的類似度レベルを表す。
収集したアノテーションの検証に厳格な資格タスクを使用した後、最後のCORD19STSデータセットは13,710対の文対を含む。
論文 参考訳(メタデータ) (2020-07-05T22:23:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。