論文の概要: Automatic Text Summarization of COVID-19 Medical Research Articles using
BERT and GPT-2
- arxiv url: http://arxiv.org/abs/2006.01997v1
- Date: Wed, 3 Jun 2020 00:54:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-25 17:19:04.905851
- Title: Automatic Text Summarization of COVID-19 Medical Research Articles using
BERT and GPT-2
- Title(参考訳): BERT と GPT-2 を用いたCOVID-19 医学研究項目の自動要約
- Authors: Virapat Kieuvongngam, Bowen Tan, Yiming Niu
- Abstract要約: 我々は,既存のNLPモデルであるBERTとOpenAI GPT-2の最近の進歩を活用している。
本モデルは,原文から抽出したキーワードに基づいて,抽象的かつ包括的情報を提供する。
我々の研究は、要約がまだ手に入らない記事の簡潔な要約を提供することで、医療コミュニティに役立てることができる。
- 参考スコア(独自算出の注目度): 8.223517872575712
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the COVID-19 pandemic, there is a growing urgency for medical community
to keep up with the accelerating growth in the new coronavirus-related
literature. As a result, the COVID-19 Open Research Dataset Challenge has
released a corpus of scholarly articles and is calling for machine learning
approaches to help bridging the gap between the researchers and the rapidly
growing publications. Here, we take advantage of the recent advances in
pre-trained NLP models, BERT and OpenAI GPT-2, to solve this challenge by
performing text summarization on this dataset. We evaluate the results using
ROUGE scores and visual inspection. Our model provides abstractive and
comprehensive information based on keywords extracted from the original
articles. Our work can help the the medical community, by providing succinct
summaries of articles for which the abstract are not already available.
- Abstract(参考訳): 新型コロナウイルス(covid-19)のパンデミックにより、医療コミュニティは新型コロナウイルス関連文献の成長の加速に追随する緊急性が高まっている。
その結果、COVID-19 Open Research Dataset Challengeは学術論文のコーパスをリリースし、研究者と急速に成長する出版物のギャップを埋めるための機械学習アプローチを求めている。
本稿では,このデータセット上でテキスト要約を行うことにより,既存のNLPモデルであるBERTとOpenAI GPT-2の最近の進歩を活用する。
ROUGEスコアと視覚検査を用いて評価を行った。
本モデルは,原文から抽出したキーワードに基づく抽象的・包括的情報を提供する。
我々の研究は、要約がまだ入手できない記事の簡潔な要約を提供することで、医療コミュニティを支援することができる。
関連論文リスト
- Exploring the evolution of research topics during the COVID-19 pandemic [3.234641429290768]
我々は,CORD-19 Topic Visualizer (CORToViz)について紹介する。
提案手法は,最新の技術(大規模言語モデルを含む)の選択と時間的トピックマイニングのための抽出技術に基づく。
トピックインスペクションはインタラクティブなダッシュボードによってサポートされており、単語クラウドやトピックトレンドを時系列として高速でワンクリックで可視化することができる。
論文 参考訳(メタデータ) (2023-10-05T22:16:41Z) - covLLM: Large Language Models for COVID-19 Biomedical Literature [0.0]
新型コロナウイルス(COVID-19)のパンデミックは、新型コロナウイルス研究の爆発にもかかわらず、米国で11万人の死者を出した。
一つの理由は、患者に圧倒された臨床医が、新型コロナウイルスの感染率を抑えるのに苦労しているからだ。
潜在的な解決策は、大規模な言語モデルを用いて、新型コロナウイルスの文献を評価するツールを開発することである。
論文 参考訳(メタデータ) (2023-06-08T04:08:32Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - Does Synthetic Data Generation of LLMs Help Clinical Text Mining? [51.205078179427645]
臨床テキストマイニングにおけるOpenAIのChatGPTの可能性を検討する。
本稿では,高品質な合成データを大量に生成する新たな学習パラダイムを提案する。
提案手法により,下流タスクの性能が大幅に向上した。
論文 参考訳(メタデータ) (2023-03-08T03:56:31Z) - COVID-19 Multidimensional Kaggle Literature Organization [3.201839066679614]
因子化は文書コーパスに隠されたパターンを発見できる強力な教師なし学習手法であることを示す。
コーパスの高次表現により,類似記事,関連雑誌,類似研究論文の執筆者,話題キーワードの同時グループ化が可能となることを示す。
論文 参考訳(メタデータ) (2021-07-17T06:16:36Z) - An Analysis of a BERT Deep Learning Strategy on a Technology Assisted
Review Task [91.3755431537592]
文書検診はEvidenced Based Medicineにおける中心的な課題である。
本稿では,BERT や PubMedBERT を組み込んだ DL 文書分類手法と DL 類似性検索経路を提案する。
2017年と2018年のCLEF eHealth コレクションにおいて,私の DL 戦略の検索の有効性を検証し,評価した。
論文 参考訳(メタデータ) (2021-04-16T19:45:27Z) - FLOP: Federated Learning on Medical Datasets using Partial Networks [84.54663831520853]
新型コロナウイルスの感染拡大で医療資源が不足している。
新型コロナウイルスの診断を緩和するために、さまざまなデータ駆動型ディープラーニングモデルが開発されている。
患者のプライバシー上の懸念から、データそのものはまだ乏しい。
我々は、textbfPartial Networks (FLOP) を用いた、シンプルで効果的な textbfFederated textbfL textbfon Medical データセットを提案する。
論文 参考訳(メタデータ) (2021-02-10T01:56:58Z) - COVID-19 therapy target discovery with context-aware literature mining [5.839799877302573]
本稿では,エンティティ間の関係を近似することで,経験的表現データの文脈化を行うシステムを提案する。
トランスファーラーニングによりより大きな科学的文脈を活用するために,新しい埋め込み生成手法を提案する。
論文 参考訳(メタデータ) (2020-07-30T18:37:36Z) - CO-Search: COVID-19 Information Retrieval with Semantic Search, Question
Answering, and Abstractive Summarization [53.67205506042232]
CO-Searchは、新型コロナウイルスの文献上の複雑なクエリを処理するように設計された、レトリバーランサーセマンティック検索エンジンである。
ドメイン固有の比較的限られたデータセットを考慮し、文書の段落と引用の2部グラフを生成する。
TREC-COVID情報検索課題のデータに基づいて,本システムの評価を行った。
論文 参考訳(メタデータ) (2020-06-17T01:32:48Z) - Visualising COVID-19 Research [4.664989082015335]
そこで我々は,新しいテーマベース可視化手法を開発した。
大規模なコーパスの高度なデータモデリング、情報マッピング、トレンド分析を組み合わせる。
トップダウンでボトムアップのブラウジングと検索インターフェースを提供し、トピックや研究リソースを素早く発見する。
論文 参考訳(メタデータ) (2020-05-13T15:45:14Z) - Mapping the Landscape of Artificial Intelligence Applications against
COVID-19 [59.30734371401316]
世界保健機関(WHO)は、SARS-CoV-2ウイルスによる新型コロナウイルスの感染をパンデミックと宣言した。
我々は、機械学習と、より広範に、人工知能を用いた最近の研究の概要を、新型コロナウイルス危機の多くの側面に取り組むために提示する。
論文 参考訳(メタデータ) (2020-03-25T12:30:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。