論文の概要: Changes in European Solidarity Before and During COVID-19: Evidence from
a Large Crowd- and Expert-Annotated Twitter Dataset
- arxiv url: http://arxiv.org/abs/2108.01042v1
- Date: Mon, 2 Aug 2021 17:03:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-03 17:57:17.296190
- Title: Changes in European Solidarity Before and During COVID-19: Evidence from
a Large Crowd- and Expert-Annotated Twitter Dataset
- Title(参考訳): 新型コロナウイルス(covid-19)前後における欧州連帯の変遷--大群衆と専門家によるtwitterデータから
- Authors: Alexandra Ils and Dan Liu and Daniela Grunow and Steffen Eger
- Abstract要約: 我々は,NLPにおける教師付き機械学習の新たな課題として,社会的連帯という社会科学的概念とその競争,反連帯の概念を導入する。
我々は,複数のアノテータと2つのアノテーションアプローチ(専門家対群衆)を利用して,(反)整合性表現のための2.3kの英語とドイツ語のつぶやきを注釈する。
今回の結果は、新型コロナウイルス危機で連帯がますます健全になり、競争が激化したことを示している。
- 参考スコア(独自算出の注目度): 77.27709662210363
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce the well-established social scientific concept of social
solidarity and its contestation, anti-solidarity, as a new problem setting to
supervised machine learning in NLP to assess how European solidarity discourses
changed before and after the COVID-19 outbreak was declared a global pandemic.
To this end, we annotate 2.3k English and German tweets for (anti-)solidarity
expressions, utilizing multiple human annotators and two annotation approaches
(experts vs.\ crowds). We use these annotations to train a BERT model with
multiple data augmentation strategies. Our augmented BERT model that combines
both expert and crowd annotations outperforms the baseline BERT classifier
trained with expert annotations only by over 25 points, from 58\% macro-F1 to
almost 85\%. We use this high-quality model to automatically label over 270k
tweets between September 2019 and December 2020. We then assess the
automatically labeled data for how statements related to European
(anti-)solidarity discourses developed over time and in relation to one
another, before and during the COVID-19 crisis. Our results show that
solidarity became increasingly salient and contested during the crisis. While
the number of solidarity tweets remained on a higher level and dominated the
discourse in the scrutinized time frame, anti-solidarity tweets initially
spiked, then decreased to (almost) pre-COVID-19 values before rising to a
stable higher level until the end of 2020.
- Abstract(参考訳): 我々は、新型コロナウイルスの感染拡大が世界的なパンデミックであると宣言された後、欧州の連帯言論がどのように変化したかを評価するため、NLPにおける機械学習を監督する新たな問題として、社会的連帯という確立した社会科学的概念と、その競争、反連帯(anti-solidarity)を紹介した。
この目的のために、私たちは2.3kの英語とドイツ語のつぶやきに、複数の人間の注釈と2つのアノテーションアプローチ(専門家 vs.\ crowds)を利用して、(アンチ)連帯表現を注釈します。
これらのアノテーションを使って、複数のデータ拡張戦略でBERTモデルをトレーニングします。
エキスパートアノテーションとクラウドアノテーションを組み合わせた拡張BERTモデルは、エキスパートアノテーションでトレーニングされたベースラインBERT分類器を58\%のマクロF1から85\%の25ポイントで上回ります。
この高品質なモデルを使って、2019年9月から2020年12月までに270万以上のツイートを自動的にラベル付けします。
次に、covid-19危機の前後において、ヨーロッパ(反連帯)の言論に関連する言論が、時間とともに相互にどのように発展していくかに関する、自動ラベル付きデータを評価する。
我々の結果は、連帯がますます健全になり、危機の間に争われたことを示している。
連帯ツイートの数は高い水準にとどまり、精査された時間枠の会話を支配していたが、反連帯ツイートは当初急増し、2020年末まで安定した高水準に上昇する前に(ほぼ)covid-19以前の値に低下した。
関連論文リスト
- Understanding writing style in social media with a supervised
contrastively pre-trained transformer [57.48690310135374]
オンラインソーシャルネットワークは、ヘイトスピーチから偽情報の拡散まで、有害な行動の場として機能している。
本稿では, 4.5 x 106テキストの公開資料から得られた大規模コーパスに基づいて学習したStyle Transformer for Authorship Representations (STAR)を紹介する。
512個のトークンからなる8つのドキュメントからなるサポートベースを使用して、著者を最大1616人の著者のセットから、少なくとも80%の精度で識別することができる。
論文 参考訳(メタデータ) (2023-10-17T09:01:17Z) - CTC-based Non-autoregressive Speech Translation [51.37920141751813]
非自己回帰音声翻訳における接続性時間分類の可能性について検討する。
我々は、CTCによって誘導される2つのエンコーダからなるモデルを構築し、ソースおよびターゲットテキストを予測する。
MuST-Cベンチマークの実験では、我々のNASTモデルは平均BLEUスコアが29.5であり、スピードアップは5.67$times$である。
論文 参考訳(メタデータ) (2023-05-27T03:54:09Z) - Fine-Grained Detection of Solidarity for Women and Migrants in 155 Years of German Parliamentary Debates [16.382860418871804]
我々は1867年から2022年にかけてのドイツ議会の議論において、女性や移民に対する連帯性について研究した。
2,864個の注釈付きテキストスニペットを用いて,Llama 3, GPT-3.5, GPT-4などの大規模言語モデル(LLM)を評価する。
GPT-4を使用して、155年間で18k以上のインスタンス(約500ユーロ)を自動的に注釈付けします。
論文 参考訳(メタデータ) (2022-10-09T22:02:58Z) - Twitter conversations predict the daily confirmed COVID-19 cases [0.2320417845168326]
パンデミック特有の談話は、TwitterやWeiboのようなマイクロブログプラットフォーム上では、今も続いている。
本稿では、新型コロナウイルス関連Twitter会話から複数の時系列を設計するための感情関連トピックベースの方法論を提案する。
モデリングにソーシャルメディア変数を組み込むことで、RMSEのベースラインモデルよりも48.83-51.38%の改善がもたらされることが示されている。
論文 参考訳(メタデータ) (2022-06-21T15:31:06Z) - COVID-19 Tweets Analysis through Transformer Language Models [0.0]
本研究では、COVID-19におけるツイートの詳細な感情分析を行う。
訓練されたトランスフォーマーモデルは、ツイートのトーンを高精度で正確に予測することができる。
次にこのモデルを利用して、covid-19の20万ツイートのトーンを予測する。
論文 参考訳(メタデータ) (2021-02-27T12:06:33Z) - Learning from History for Byzantine Robust Optimization [52.68913869776858]
分散学習の重要性から,ビザンチンの堅牢性が近年注目されている。
既存のロバストアグリゲーションルールの多くは、ビザンチンの攻撃者がいなくても収束しない可能性がある。
論文 参考訳(メタデータ) (2020-12-18T16:22:32Z) - Robust Pre-Training by Adversarial Contrastive Learning [120.33706897927391]
近年の研究では、敵の訓練と統合されると、自己監督型事前訓練が最先端の堅牢性につながることが示されている。
我々は,データ強化と対向的摂動の両面に整合した学習表現により,ロバストネスを意識した自己指導型事前学習を改善する。
論文 参考訳(メタデータ) (2020-10-26T04:44:43Z) - Not-NUTs at W-NUT 2020 Task 2: A BERT-based System in Identifying
Informative COVID-19 English Tweets [0.0]
本稿では、英語のつぶやきを前提として、そのツイートがCOVID-19に関する情報的内容を持つかどうかを自動的に識別するモデルを提案する。
インフォメーションクラスにおけるF1スコアの約1%は、トップパフォーマンスチームによる結果にしか影響しない競争的な結果を達成しました。
論文 参考訳(メタデータ) (2020-09-14T15:49:16Z) - SenWave: Monitoring the Global Sentiments under the COVID-19 Pandemic [26.109661374693935]
SenWaveは105万以上のツイートとWeiboメッセージを使って、感情分析を行う。
SenWaveは、新型コロナウイルスに関する6つの言語でグローバルな会話の感情を明らかにしている。
全体として、SenWaveは楽観的かつ肯定的な感情が時間とともに増加し、新型コロナウイルス(COVID-19)の世界を改良するためのリセットを欲しがっていることを示している。
論文 参考訳(メタデータ) (2020-06-18T20:33:41Z) - Cross-lingual Transfer Learning for COVID-19 Outbreak Alignment [90.12602012910465]
われわれは、Twitterを通じてイタリアの新型コロナウイルス感染症(COVID-19)の早期流行を訓練し、他のいくつかの国に移る。
実験の結果,クロスカントリー予測において最大0.85のスピアマン相関が得られた。
論文 参考訳(メタデータ) (2020-06-05T02:04:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。