論文の概要: Covid-Transformer: Detecting COVID-19 Trending Topics on Twitter Using
Universal Sentence Encoder
- arxiv url: http://arxiv.org/abs/2009.03947v3
- Date: Sat, 19 Sep 2020 21:10:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 20:38:41.294172
- Title: Covid-Transformer: Detecting COVID-19 Trending Topics on Twitter Using
Universal Sentence Encoder
- Title(参考訳): covid-transformer:ユニバーサル文エンコーダを用いたtwitter上のcovid-19トレンドトピックの検出
- Authors: Meysam Asgari-Chenaghlu, Narjes Nikzad-Khasmakhi, Shervin Minaee
- Abstract要約: 新型コロナウイルス感染症(COVID-19)がパンデミックを引き起こし、世界200カ国以上に感染した。
新型コロナウイルス(COVID-19)の世界的な影響により、ほぼ至る所で人々の大きな関心事となっている。
われわれは、ツイートを分析し、トレンドトピックやTwitter上の人々の関心事を検出する。
- 参考スコア(独自算出の注目度): 7.305019142196582
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The novel corona-virus disease (also known as COVID-19) has led to a
pandemic, impacting more than 200 countries across the globe. With its global
impact, COVID-19 has become a major concern of people almost everywhere, and
therefore there are a large number of tweets coming out from every corner of
the world, about COVID-19 related topics. In this work, we try to analyze the
tweets and detect the trending topics and major concerns of people on Twitter,
which can enable us to better understand the situation, and devise better
planning. More specifically we propose a model based on the universal sentence
encoder to detect the main topics of Tweets in recent months. We used universal
sentence encoder in order to derive the semantic representation and the
similarity of tweets. We then used the sentence similarity and their
embeddings, and feed them to K-means clustering algorithm to group similar
tweets (in semantic sense). After that, the cluster summary is obtained using a
text summarization algorithm based on deep learning, which can uncover the
underlying topics of each cluster. Through experimental results, we show that
our model can detect very informative topics, by processing a large number of
tweets on sentence level (which can preserve the overall meaning of the
tweets). Since this framework has no restriction on specific data distribution,
it can be used to detect trending topics from any other social media and any
other context rather than COVID-19. Experimental results show superiority of
our proposed approach to other baselines, including TF-IDF, and latent
Dirichlet allocation (LDA).
- Abstract(参考訳): 新型コロナウイルス(covid-19)はパンデミックにつながり、世界200カ国以上に影響を及ぼしている。
世界的な影響により、covid-19はほとんど至るところで人々の大きな関心事となっているため、covid-19関連のトピックについて、世界中から大量のツイートが寄せられている。
この研究では、ツイートを分析し、トレンドトピックやTwitter上の人々の大きな関心事を検出することで、状況をよりよく理解し、より良い計画を立てることができます。
より具体的には、最近のツイートのメイントピックを検出するユニバーサル・センテンス・エンコーダに基づくモデルを提案する。
ツイートの意味表現と類似性を導出するために,普遍文エンコーダを用いた。
その後、文の類似性と埋め込みを使い、k-meansクラスタリングアルゴリズムにフィードし、類似したツイートをグループ化する(意味的に)。
その後、ディープラーニングに基づくテキスト要約アルゴリズムを使用してクラスタサマリーを取得し、各クラスタの基盤となるトピックを明らかにする。
実験結果から,本モデルでは,大量のツイートを文レベルで処理することで,非常に有意義なトピックを検出できることを示した。
このフレームワークは特定のデータ分布に制限がないため、covid-19ではなく、他のソーシャルメディアや他のコンテキストからトレンドトピックを検出するために使用できる。
実験の結果,TF-IDFや潜在ディリクレ割り当て(LDA)など,他のベースラインに対する提案手法の優位性が確認された。
関連論文リスト
- Understanding writing style in social media with a supervised
contrastively pre-trained transformer [57.48690310135374]
オンラインソーシャルネットワークは、ヘイトスピーチから偽情報の拡散まで、有害な行動の場として機能している。
本稿では, 4.5 x 106テキストの公開資料から得られた大規模コーパスに基づいて学習したStyle Transformer for Authorship Representations (STAR)を紹介する。
512個のトークンからなる8つのドキュメントからなるサポートベースを使用して、著者を最大1616人の著者のセットから、少なくとも80%の精度で識別することができる。
論文 参考訳(メタデータ) (2023-10-17T09:01:17Z) - Twitter-COMMs: Detecting Climate, COVID, and Military Multimodal
Misinformation [83.2079454464572]
本稿では,DARPAセマンティック・フォレスティクス(SemaFor)プログラムにおける画像テキスト不整合検出へのアプローチについて述べる。
Twitter-COMMsは大規模マルチモーダルデータセットで、884万のツイートが気候変動、新型コロナウイルス、軍用車両のトピックに関連する。
我々は、最先端のCLIPモデルに基づいて、自動生成されたランダムとハードのネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガ
論文 参考訳(メタデータ) (2021-12-16T03:37:20Z) - Extracting Feelings of People Regarding COVID-19 by Social Network
Mining [0.0]
英語における新型コロナウイルス関連ツイートのデータセットが収集される。
2020年3月23日から6月23日までに200万件以上のツイートが分析されている。
論文 参考訳(メタデータ) (2021-10-12T16:45:33Z) - A Case Study to Reveal if an Area of Interest has a Trend in Ongoing
Tweets Using Word and Sentence Embeddings [0.0]
我々は、デイリー平均類似度スコアが日々のツイートコーパスとターゲット語との類似性を示す、容易に適用可能な自動化手法を提案する。
デイリー平均類似度スコアは主にコサイン類似度と単語/文埋め込みに基づいている。
また,提案手法を適用しながら単語と文の埋め込みの有効性を比較し,ほぼ同じ結果が得られることを認識した。
論文 参考訳(メタデータ) (2021-10-02T18:44:55Z) - Exploiting BERT For Multimodal Target SentimentClassification Through
Input Space Translation [75.82110684355979]
オブジェクト認識変換器を用いて入力空間内の画像を変換する2ストリームモデルを提案する。
次に、翻訳を利用して、言語モデルに多モーダル情報を提供する補助文を構築する。
2つのマルチモーダルTwitterデータセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-08-03T18:02:38Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - Understanding Information Spreading Mechanisms During COVID-19 Pandemic
by Analyzing the Impact of Tweet Text and User Features for Retweet
Prediction [6.658785818853953]
新型コロナウイルスは世界の経済や、ほぼすべての人々の日常生活に影響を与えている。
ソーシャルメディアプラットフォームは、情報を共有できる他のユーザーと情報を共有できる。
CNNとRNNをベースとした2つのモデルを提案し、これらのモデルの性能を公開のTweetsCOV19データセットで評価する。
論文 参考訳(メタデータ) (2021-05-26T15:55:58Z) - ComStreamClust: a communicative multi-agent approach to text clustering
in streaming data [1.9949261242626626]
本稿では,より広範なトピック内でのサブトピックをクラスタリングするための,ComStreamClustと呼ばれる新しいクラスタリング手法を提案する。
提案手法は並列化可能で,複数のデータポイントを同時に処理できる。
ComStreamClustは、COVID-19とFA CUPの2つのデータセットで評価されている。
論文 参考訳(メタデータ) (2020-10-11T21:19:19Z) - Tweet to News Conversion: An Investigation into Unsupervised
Controllable Text Generation [46.74654716230366]
本稿では,災害領域のツイートの集合からコヒーレントな段落を構築するタスクを定義する。
パイプライン内に2つのシステムを構築することでこの問題に対処する。最初のシステムは教師なしスタイル転送に焦点を当て、個々のつぶやきをニュース文に変換する。
第2のシステムは、第1のシステムからの出力を縫合してコヒーレントニュース段落を形成する。
論文 参考訳(メタデータ) (2020-08-21T06:56:57Z) - Sequential Sentence Matching Network for Multi-turn Response Selection
in Retrieval-based Chatbots [45.920841134523286]
本稿では,文レベルの意味情報を用いて問題に対処する,逐次文マッチングネットワーク(S2M)を提案する。
まず、文レベルの意味情報を用いて、ネットワークが問題に対処し、マッチングを大幅に改善し、その結果、最先端のパフォーマンスが得られることがわかった。
論文 参考訳(メタデータ) (2020-05-16T09:47:19Z) - Exploratory Analysis of Covid-19 Tweets using Topic Modeling, UMAP, and
DiGraphs [36.33347149799959]
本稿では,Covid19 ツイートのトピック,キーワード,特徴,情報拡散の速度,ネットワーク行動の5つの異なる評価手法について述べる。
米国のケースに特有なトピックは、ホワイトハウスのコロナウイルス対策部隊のブリーフィングの後すぐに上昇し始めるだろう。
この分析の最も単純な特徴の1つは、正規表現のような初期記述的手法がハイレベルなテーマをうまく識別できることである。
論文 参考訳(メタデータ) (2020-05-06T19:16:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。