論文の概要: Topic Modeling and Progression of American Digital News Media During the
Onset of the COVID-19 Pandemic
- arxiv url: http://arxiv.org/abs/2106.09572v1
- Date: Tue, 25 May 2021 14:27:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-20 16:03:36.889659
- Title: Topic Modeling and Progression of American Digital News Media During the
Onset of the COVID-19 Pandemic
- Title(参考訳): 新型コロナウイルス(covid-19)パンデミック発生時におけるアメリカのデジタルニュースメディアの話題モデリングと進展
- Authors: Xiangpeng Wan, Michael C. Lucic, Hakim Ghazzai, Yehia Massoud
- Abstract要約: 現在、世界は深刻な世界的なパンデミックの真っ最中にあり、人々の生活のあらゆる側面に影響を与えている。
パンデミックの影響で、米国では新型コロナウイルス関連のデジタルメディア記事が大量に掲載されている。
本研究では, 各種デジタル物品を自動抽出して, 管理可能な情報に抽出する自然言語処理パイプラインを開発した。
- 参考スコア(独自算出の注目度): 2.798697306330988
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Currently, the world is in the midst of a severe global pandemic, which has
affected all aspects of people's lives. As a result, there is a deluge of
COVID-related digital media articles published in the United States, due to the
disparate effects of the pandemic. This large volume of information is
difficult to consume by the audience in a reasonable amount of time. In this
paper, we develop a Natural Language Processing (NLP) pipeline that is capable
of automatically distilling various digital articles into manageable pieces of
information, while also modelling the progression topics discussed over time in
order to aid readers in rapidly gaining holistic perspectives on pressing
issues (i.e., the COVID-19 pandemic) from a diverse array of sources. We
achieve these goals by first collecting a large corpus of COVID-related
articles during the onset of the pandemic. After, we apply unsupervised and
semi-supervised learning procedures to summarize articles, then cluster them
based on their similarities using the community detection methods. Next, we
identify the topic of each cluster of articles using the BART algorithm.
Finally, we provide a detailed digital media analysis based on the NLP-pipeline
outputs and show how the conversation surrounding COVID-19 evolved over time.
- Abstract(参考訳): 現在、世界は深刻な世界的なパンデミックの最中にあり、人々の生活のあらゆる側面に影響を与えている。
その結果、パンデミックの影響の相違により、米国では新型コロナウイルス関連のデジタルメディア記事が大量に掲載されている。
この大量の情報は、十分な時間内にオーディエンスによって消費されることは困難である。
本稿では,様々なデジタル物品を自動で管理可能な情報に抽出できる自然言語処理(NLP)パイプラインを開発した。また,様々なソースからのプッシュ問題(すなわち,COVID-19パンデミック)の包括的視点を読者に迅速に得るために,時間とともに議論される話題をモデル化する。
パンデミックの開始時に、まず大量の新型コロナウイルス関連記事を集めることで、これらの目標を達成する。
その後,非教師なし,半教師なしの学習手順を要約に応用し,コミュニティ検出手法を用いて類似度に基づいて分類した。
次に,BARTアルゴリズムを用いて記事群ごとのトピックを特定する。
最後に、NLP-ピペリン出力に基づく詳細なデジタルメディア分析を行い、COVID-19を取り巻く会話が時間とともにどのように発展していくかを示す。
関連論文リスト
- Automating the Analysis of Public Saliency and Attitudes towards Biodiversity from Digital Media [0.5175667614430115]
野生生物に対する公衆の態度を測定することは、自然との関係に重要な洞察を与え、グローバル生物多様性フレームワークの目標に向けた進捗を監視するのに役立ちます。
我々は,現代の自然言語処理(NLP)ツールを活用することで,これらの課題を克服することを目指している。
本稿では,検索語生成の改善のための民生分類法を導入し,用語頻度-逆文書頻度ベクトルのコサイン類似性を利用して,シンジケートされた記事のフィルタリングを行う。
また、教師なし学習を用いて共通のトピックを明らかにする関連フィルタリングパイプラインを導入し、続いてオープンソースのLarge Language Model(LLM)を用いてトピックをニュース記事のタイトルに割り当てる。
論文 参考訳(メタデータ) (2024-05-02T08:28:25Z) - Recent Advances in Hate Speech Moderation: Multimodality and the Role of Large Models [52.24001776263608]
この包括的調査は、HSモデレーションの最近の歩みを掘り下げている。
大型言語モデル(LLM)と大規模マルチモーダルモデル(LMM)の急成長する役割を強調した。
研究における既存のギャップを、特に表現不足言語や文化の文脈で特定する。
論文 参考訳(メタデータ) (2024-01-30T03:51:44Z) - GPT-4V(ision) as A Social Media Analysis Engine [77.23394183063238]
本稿では,GPT-4Vのソーシャルマルチメディア分析能力について考察する。
我々は、感情分析、ヘイトスピーチ検出、フェイクニュース識別、人口推定、政治的イデオロギー検出を含む5つの代表的なタスクを選択する。
GPT-4Vはこれらのタスクにおいて顕著な効果を示し、画像とテキストのペアの理解、文脈と文化の認識、広義のコモンセンス知識などの強みを示している。
論文 参考訳(メタデータ) (2023-11-13T18:36:50Z) - Exploring the evolution of research topics during the COVID-19 pandemic [3.234641429290768]
我々は,CORD-19 Topic Visualizer (CORToViz)について紹介する。
提案手法は,最新の技術(大規模言語モデルを含む)の選択と時間的トピックマイニングのための抽出技術に基づく。
トピックインスペクションはインタラクティブなダッシュボードによってサポートされており、単語クラウドやトピックトレンドを時系列として高速でワンクリックで可視化することができる。
論文 参考訳(メタデータ) (2023-10-05T22:16:41Z) - Measuring COVID-19 Related Media Consumption on Twitter [2.746705315038595]
ソーシャルメディアプラットフォームはパンデミックに関して重要なアップデートを提供している。
メディアとのオンラインコミュニケーションは、国際規模ではまだ探索されていない。
この論文は、各国における新型コロナウイルスのメディア消費に関する初めての研究である。
論文 参考訳(メタデータ) (2023-09-16T04:01:45Z) - Computational Assessment of Hyperpartisanship in News Titles [55.92100606666497]
われわれはまず、超党派ニュースタイトル検出のための新しいデータセットを開発するために、人間の誘導する機械学習フレームワークを採用する。
全体的に右派メディアは比例的に超党派的なタイトルを使う傾向にある。
我々は、外国問題、政治システム、ニュースタイトルにおける過党主義を示唆する社会問題を含む3つの主要なトピックを識別する。
論文 参考訳(メタデータ) (2023-01-16T05:56:58Z) - COVID-19 and Big Data: Multi-faceted Analysis for Spatio-temporal
Understanding of the Pandemic with Social Media Conversations [4.07452542897703]
ソーシャルメディアプラットフォームは、新型コロナウイルス(COVID-19)に関する世界的な会話の手段として機能している。
本稿では,パンデミックを取り巻くソーシャルメディア会話の重要コンテンツと特徴の分析,マイニング,追跡のための枠組みを提案する。
論文 参考訳(メタデータ) (2021-04-22T00:45:50Z) - VMSMO: Learning to Generate Multimodal Summary for Video-based News
Articles [63.32111010686954]
マルチモーダル出力(VMSMO)を用いたビデオベースマルチモーダル要約の課題を提案する。
このタスクの主な課題は、ビデオの時間的依存性と記事の意味を共同でモデル化することである。
本稿では,デュアルインタラクションモジュールとマルチモーダルジェネレータからなるDual-Interaction-based Multimodal Summarizer (DIMS)を提案する。
論文 参考訳(メタデータ) (2020-10-12T02:19:16Z) - Understanding the Spatio-temporal Topic Dynamics of Covid-19 using
Nonnegative Tensor Factorization: A Case Study [1.6328866317851185]
本稿では、ソーシャルメディアデータにおける話題を特定するために、ソーシャルメディアデータと非負因子化(NTF)の表現を提案する。
オーストラリアのTwitterスフィアに関するケーススタディでは、Covid-19のトピックのダイナミクスを視覚化する。
論文 参考訳(メタデータ) (2020-09-19T15:16:28Z) - A System for Worldwide COVID-19 Information Aggregation [92.60866520230803]
我々は、トピックによって分類された7言語10の地域から信頼できる記事を含む世界的な新型コロナウイルス情報収集システムを構築した。
ニューラルマシン翻訳モジュールは、他言語の論文を日本語と英語に翻訳する。
記事とトピックのペアデータセットに基づいてトレーニングされたBERTベースのトピック分類器は、ユーザが興味のある情報を効率的に見つけるのに役立つ。
論文 参考訳(メタデータ) (2020-07-28T01:33:54Z) - SummPip: Unsupervised Multi-Document Summarization with Sentence Graph
Compression [61.97200991151141]
SummPipはマルチドキュメント要約のための教師なしの手法である。
元の文書を文グラフに変換し、言語表現と深層表現の両方を考慮に入れます。
次に、スペクトルクラスタリングを適用して複数の文のクラスタを取得し、最後に各クラスタを圧縮して最終的な要約を生成する。
論文 参考訳(メタデータ) (2020-07-17T13:01:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。