論文の概要: Exploring the evolution of research topics during the COVID-19 pandemic
- arxiv url: http://arxiv.org/abs/2310.03928v1
- Date: Thu, 5 Oct 2023 22:16:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-10 06:15:06.178202
- Title: Exploring the evolution of research topics during the COVID-19 pandemic
- Title(参考訳): 新型コロナウイルスパンデミックにおける研究トピックの進化を探る
- Authors: Francesco Invernici, Anna Bernasconi, Stefano Ceri
- Abstract要約: 我々は,CORD-19 Topic Visualizer (CORToViz)について紹介する。
提案手法は,最新の技術(大規模言語モデルを含む)の選択と時間的トピックマイニングのための抽出技術に基づく。
トピックインスペクションはインタラクティブなダッシュボードによってサポートされており、単語クラウドやトピックトレンドを時系列として高速でワンクリックで可視化することができる。
- 参考スコア(独自算出の注目度): 3.234641429290768
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The COVID-19 pandemic has changed the research agendas of most scientific
communities, resulting in an overwhelming production of research articles in a
variety of domains, including medicine, virology, epidemiology, economy,
psychology, and so on. Several open-access corpora and literature hubs were
established; among them, the COVID-19 Open Research Dataset (CORD-19) has
systematically gathered scientific contributions for 2.5 years, by collecting
and indexing over one million articles. Here, we present the CORD-19 Topic
Visualizer (CORToViz), a method and associated visualization tool for
inspecting the CORD-19 textual corpus of scientific abstracts. Our method is
based upon a careful selection of up-to-date technologies (including large
language models), resulting in an architecture for clustering articles along
orthogonal dimensions and extraction techniques for temporal topic mining.
Topic inspection is supported by an interactive dashboard, providing fast,
one-click visualization of topic contents as word clouds and topic trends as
time series, equipped with easy-to-drive statistical testing for analyzing the
significance of topic emergence along arbitrarily selected time windows. The
processes of data preparation and results visualization are completely general
and virtually applicable to any corpus of textual documents - thus suited for
effective adaptation to other contexts.
- Abstract(参考訳): 新型コロナウイルス(COVID-19)のパンデミックは、ほとんどの科学コミュニティの研究課題を変え、医学、ウイルス学、疫学、経済、心理学など様々な分野の研究論文が圧倒的に生産された。
新型コロナウイルスのオープンリサーチデータセット(CORD-19)は、100万以上の論文の収集と索引付けによって2.5年間、体系的に科学的貢献を集めてきた。
本稿では,CORD-19 Topic Visualizer (CORToViz)について紹介する。
提案手法は,最新の技術(大規模言語モデルを含む)を慎重に選択し,直交次元に沿って記事をクラスタリングするアーキテクチャと時間的トピックマイニングのための抽出技術を実現する。
トピックインスペクションは、対話型ダッシュボードによってサポートされ、単語クラウドとしてのトピック内容の高速かつワンクリック可視化と時系列としてのトピックトレンドを提供し、任意に選択された時間ウィンドウに沿ったトピックの出現の重要性を分析するための、容易に駆動可能な統計テストを備えている。
データ準備と結果の可視化のプロセスは、完全に汎用的で、テキスト文書のコーパスに事実上適用可能であるため、他のコンテキストへの効果的な適応に適している。
関連論文リスト
- SciRIFF: A Resource to Enhance Language Model Instruction-Following over Scientific Literature [80.49349719239584]
SciRIFF(Scientific Resource for Instruction-Following and Finetuning, SciRIFF)は、54のタスクに対して137Kの命令追従デモのデータセットである。
SciRIFFは、幅広い科学分野の研究文献から情報を抽出し、合成することに焦点を当てた最初のデータセットである。
論文 参考訳(メタデータ) (2024-06-10T21:22:08Z) - Textual Knowledge Matters: Cross-Modality Co-Teaching for Generalized
Visual Class Discovery [69.91441987063307]
Generalized Category Discovery (GCD)は、既知のカテゴリと未知のカテゴリの両方からラベルのないデータをクラスタすることを目的としている。
現在のGCD法は、新しい視覚カテゴリーを発見する際に、人間の認知過程の多様性知覚性を無視する視覚的手がかりのみに依存している。
マルチモーダルなGCDを実現するための2段階のTextGCDフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-12T07:06:50Z) - SciMMIR: Benchmarking Scientific Multi-modal Information Retrieval [64.03631654052445]
科学領域内の画像テキストペアリングにおけるMMIR性能を評価するための最新のベンチマークは、顕著なギャップを示している。
オープンアクセス用紙コレクションを利用した特殊な科学的MMIRベンチマークを開発する。
このベンチマークは、科学的文書に詳細なキャプションのある数字や表から抽出された、530Kの精巧にキュレートされた画像テキストペアからなる。
論文 参考訳(メタデータ) (2024-01-24T14:23:12Z) - An Information Retrieval and Extraction Tool for Covid-19 Related Papers [0.0]
本論文の主な焦点は、研究者に新型コロナウイルス関連論文のより良い検索ツールを提供することである。
我々は,CORD-19論文のトピックベースの検索を自動化し,研究者を支援する可能性を示した。
論文 参考訳(メタデータ) (2024-01-20T01:34:50Z) - Neural Content Extraction for Poster Generation of Scientific Papers [84.30128728027375]
科学論文のポスター生成の問題は未解明である。
これまでの研究は主にポスターレイアウトとパネル構成に重点を置いていたが、コンテンツ抽出の重要性は無視された。
ポスターパネルのテキスト要素と視覚要素の両方を得るために,紙セクションのテキスト,図形,テーブルを同時に抽出するニューラル抽出モデルを提案する。
論文 参考訳(メタデータ) (2021-12-16T01:19:37Z) - COVID-19 Multidimensional Kaggle Literature Organization [3.201839066679614]
因子化は文書コーパスに隠されたパターンを発見できる強力な教師なし学習手法であることを示す。
コーパスの高次表現により,類似記事,関連雑誌,類似研究論文の執筆者,話題キーワードの同時グループ化が可能となることを示す。
論文 参考訳(メタデータ) (2021-07-17T06:16:36Z) - CovidExplorer: A Multi-faceted AI-based Search and Visualization Engine
for COVID-19 Information [0.0]
我々は、多面的なAIベースの検索および可視化エンジンであるCovidExplorerを紹介する。
本システムの目的は、現在最先端の新型コロナウイルス研究の理解、ドメインに関する研究論文の特定、および新型コロナウイルス患者のリアルタイムトレンドと統計の可視化を支援することである。
他の既存のシステムとは対照的に、CovidExplorerは、インド固有のソーシャルメディアに関するトピックに関する議論を、COVID-19のさまざまな側面を研究するためにもたらしている。
論文 参考訳(メタデータ) (2020-11-30T08:42:13Z) - Navigating the landscape of COVID-19 research through literature
analysis: A bird's eye view [11.362549790802483]
我々は、2020年5月15日時点でPubMedで見つかった13,369のCOVID-19関連記事、LitCovidコレクションを分析した。
我々は、最先端のエンティティ認識、分類、クラスタリング、その他のNLP技術を適用する。
クラスタリングアルゴリズムは,関連用語群で表されるトピックを識別し,関連する文書に対応するクラスタを算出する。
論文 参考訳(メタデータ) (2020-08-07T23:39:29Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z) - Automatic Text Summarization of COVID-19 Medical Research Articles using
BERT and GPT-2 [8.223517872575712]
我々は,既存のNLPモデルであるBERTとOpenAI GPT-2の最近の進歩を活用している。
本モデルは,原文から抽出したキーワードに基づいて,抽象的かつ包括的情報を提供する。
我々の研究は、要約がまだ手に入らない記事の簡潔な要約を提供することで、医療コミュニティに役立てることができる。
論文 参考訳(メタデータ) (2020-06-03T00:54:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。