論文の概要: Topic Modeling and Progression of American Digital News Media During the
Onset of the COVID-19 Pandemic
- arxiv url: http://arxiv.org/abs/2106.09572v1
- Date: Tue, 25 May 2021 14:27:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-20 16:03:36.889659
- Title: Topic Modeling and Progression of American Digital News Media During the
Onset of the COVID-19 Pandemic
- Title(参考訳): 新型コロナウイルス(covid-19)パンデミック発生時におけるアメリカのデジタルニュースメディアの話題モデリングと進展
- Authors: Xiangpeng Wan, Michael C. Lucic, Hakim Ghazzai, Yehia Massoud
- Abstract要約: 現在、世界は深刻な世界的なパンデミックの真っ最中にあり、人々の生活のあらゆる側面に影響を与えている。
パンデミックの影響で、米国では新型コロナウイルス関連のデジタルメディア記事が大量に掲載されている。
本研究では, 各種デジタル物品を自動抽出して, 管理可能な情報に抽出する自然言語処理パイプラインを開発した。
- 参考スコア(独自算出の注目度): 2.798697306330988
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Currently, the world is in the midst of a severe global pandemic, which has
affected all aspects of people's lives. As a result, there is a deluge of
COVID-related digital media articles published in the United States, due to the
disparate effects of the pandemic. This large volume of information is
difficult to consume by the audience in a reasonable amount of time. In this
paper, we develop a Natural Language Processing (NLP) pipeline that is capable
of automatically distilling various digital articles into manageable pieces of
information, while also modelling the progression topics discussed over time in
order to aid readers in rapidly gaining holistic perspectives on pressing
issues (i.e., the COVID-19 pandemic) from a diverse array of sources. We
achieve these goals by first collecting a large corpus of COVID-related
articles during the onset of the pandemic. After, we apply unsupervised and
semi-supervised learning procedures to summarize articles, then cluster them
based on their similarities using the community detection methods. Next, we
identify the topic of each cluster of articles using the BART algorithm.
Finally, we provide a detailed digital media analysis based on the NLP-pipeline
outputs and show how the conversation surrounding COVID-19 evolved over time.
- Abstract(参考訳): 現在、世界は深刻な世界的なパンデミックの最中にあり、人々の生活のあらゆる側面に影響を与えている。
その結果、パンデミックの影響の相違により、米国では新型コロナウイルス関連のデジタルメディア記事が大量に掲載されている。
この大量の情報は、十分な時間内にオーディエンスによって消費されることは困難である。
本稿では,様々なデジタル物品を自動で管理可能な情報に抽出できる自然言語処理(NLP)パイプラインを開発した。また,様々なソースからのプッシュ問題(すなわち,COVID-19パンデミック)の包括的視点を読者に迅速に得るために,時間とともに議論される話題をモデル化する。
パンデミックの開始時に、まず大量の新型コロナウイルス関連記事を集めることで、これらの目標を達成する。
その後,非教師なし,半教師なしの学習手順を要約に応用し,コミュニティ検出手法を用いて類似度に基づいて分類した。
次に,BARTアルゴリズムを用いて記事群ごとのトピックを特定する。
最後に、NLP-ピペリン出力に基づく詳細なデジタルメディア分析を行い、COVID-19を取り巻く会話が時間とともにどのように発展していくかを示す。
関連論文リスト
- GPT-4V(ision) as A Social Media Analysis Engine [77.23394183063238]
本稿では,GPT-4Vのソーシャルマルチメディア分析能力について考察する。
我々は、感情分析、ヘイトスピーチ検出、フェイクニュース識別、人口推定、政治的イデオロギー検出を含む5つの代表的なタスクを選択する。
GPT-4Vはこれらのタスクにおいて顕著な効果を示し、画像とテキストのペアの理解、文脈と文化の認識、広義のコモンセンス知識などの強みを示している。
論文 参考訳(メタデータ) (2023-11-13T18:36:50Z) - Exploring the evolution of research topics during the COVID-19 pandemic [3.234641429290768]
我々は,CORD-19 Topic Visualizer (CORToViz)について紹介する。
提案手法は,最新の技術(大規模言語モデルを含む)の選択と時間的トピックマイニングのための抽出技術に基づく。
トピックインスペクションはインタラクティブなダッシュボードによってサポートされており、単語クラウドやトピックトレンドを時系列として高速でワンクリックで可視化することができる。
論文 参考訳(メタデータ) (2023-10-05T22:16:41Z) - Embrace Divergence for Richer Insights: A Multi-document Summarization
Benchmark and a Case Study on Summarizing Diverse Information from News
Articles [142.7366365876213]
同一イベントを含む複数のニュース記事において遭遇する多様な情報を要約する新しい課題を提案する。
この作業を容易にするために、多様な情報を特定するためのデータ収集スキーマの概要と、DiverseSummというデータセットをキュレートした。
データセットには245のニュース記事が含まれており、各ストーリーは10のニュース記事からなり、人間公認の参照と組み合わせられる。
論文 参考訳(メタデータ) (2023-09-17T20:28:17Z) - Measuring COVID-19 Related Media Consumption on Twitter [2.746705315038595]
ソーシャルメディアプラットフォームはパンデミックに関して重要なアップデートを提供している。
メディアとのオンラインコミュニケーションは、国際規模ではまだ探索されていない。
この論文は、各国における新型コロナウイルスのメディア消費に関する初めての研究である。
論文 参考訳(メタデータ) (2023-09-16T04:01:45Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on
Social Media [53.51665032295087]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - COVID-19 and Big Data: Multi-faceted Analysis for Spatio-temporal
Understanding of the Pandemic with Social Media Conversations [4.07452542897703]
ソーシャルメディアプラットフォームは、新型コロナウイルス(COVID-19)に関する世界的な会話の手段として機能している。
本稿では,パンデミックを取り巻くソーシャルメディア会話の重要コンテンツと特徴の分析,マイニング,追跡のための枠組みを提案する。
論文 参考訳(メタデータ) (2021-04-22T00:45:50Z) - Fake news agenda in the era of COVID-19: Identifying trends through
fact-checking content [0.8594140167290099]
ツイート中のトピックを識別するためのマルコフに着想を得た新しい計算手法を提案する。
ブラジルの2つのファクトチェック機関のTwitterアカウントからデータを収集した。
提案手法は,幅広いシナリオでトピックをクラスタリングする重要な手法となった。
論文 参考訳(メタデータ) (2020-12-20T19:35:25Z) - VMSMO: Learning to Generate Multimodal Summary for Video-based News
Articles [63.32111010686954]
マルチモーダル出力(VMSMO)を用いたビデオベースマルチモーダル要約の課題を提案する。
このタスクの主な課題は、ビデオの時間的依存性と記事の意味を共同でモデル化することである。
本稿では,デュアルインタラクションモジュールとマルチモーダルジェネレータからなるDual-Interaction-based Multimodal Summarizer (DIMS)を提案する。
論文 参考訳(メタデータ) (2020-10-12T02:19:16Z) - Understanding the Spatio-temporal Topic Dynamics of Covid-19 using
Nonnegative Tensor Factorization: A Case Study [1.6328866317851185]
本稿では、ソーシャルメディアデータにおける話題を特定するために、ソーシャルメディアデータと非負因子化(NTF)の表現を提案する。
オーストラリアのTwitterスフィアに関するケーススタディでは、Covid-19のトピックのダイナミクスを視覚化する。
論文 参考訳(メタデータ) (2020-09-19T15:16:28Z) - A System for Worldwide COVID-19 Information Aggregation [92.60866520230803]
我々は、トピックによって分類された7言語10の地域から信頼できる記事を含む世界的な新型コロナウイルス情報収集システムを構築した。
ニューラルマシン翻訳モジュールは、他言語の論文を日本語と英語に翻訳する。
記事とトピックのペアデータセットに基づいてトレーニングされたBERTベースのトピック分類器は、ユーザが興味のある情報を効率的に見つけるのに役立つ。
論文 参考訳(メタデータ) (2020-07-28T01:33:54Z) - SummPip: Unsupervised Multi-Document Summarization with Sentence Graph
Compression [61.97200991151141]
SummPipはマルチドキュメント要約のための教師なしの手法である。
元の文書を文グラフに変換し、言語表現と深層表現の両方を考慮に入れます。
次に、スペクトルクラスタリングを適用して複数の文のクラスタを取得し、最後に各クラスタを圧縮して最終的な要約を生成する。
論文 参考訳(メタデータ) (2020-07-17T13:01:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。