論文の概要: Repurposing TREC-COVID Annotations to Answer the Key Questions of
CORD-19
- arxiv url: http://arxiv.org/abs/2008.12353v1
- Date: Thu, 27 Aug 2020 19:51:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-24 07:27:12.045191
- Title: Repurposing TREC-COVID Annotations to Answer the Key Questions of
CORD-19
- Title(参考訳): CORD-19の重要課題に対するTREC-COVIDアノテーションの再検討
- Authors: Connor T. Heaton, Prasenjit Mitra
- Abstract要約: 新型コロナウイルス感染症(COVID-19)は2019年後半に中国武漢で発生し、これまでに全世界で1400万人以上が感染している。
ホワイトハウスは、さまざまな新型コロナウイルスに関連する20万件以上の雑誌をまとめ、コーパスに関する重要な質問に回答するようコミュニティに指示した。
我々は, TREC-COVIDタスクの関連アノテーションを再利用して, CORD-19が提起する重要な問題に関連するCORD-19のジャーナル記事を特定することにした。
- 参考スコア(独自算出の注目度): 4.847073702809032
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The novel coronavirus disease 2019 (COVID-19) began in Wuhan, China in late
2019 and to date has infected over 14M people worldwide, resulting in over
750,000 deaths. On March 10, 2020 the World Health Organization (WHO) declared
the outbreak a global pandemic. Many academics and researchers, not restricted
to the medical domain, began publishing papers describing new discoveries.
However, with the large influx of publications, it was hard for these
individuals to sift through the large amount of data and make sense of the
findings. The White House and a group of industry research labs, lead by the
Allen Institute for AI, aggregated over 200,000 journal articles related to a
variety of coronaviruses and tasked the community with answering key questions
related to the corpus, releasing the dataset as CORD-19. The information
retrieval (IR) community repurposed the journal articles within CORD-19 to more
closely resemble a classic TREC-style competition, dubbed TREC-COVID, with
human annotators providing relevancy judgements at the end of each round of
competition. Seeing the related endeavors, we set out to repurpose the
relevancy annotations for TREC-COVID tasks to identify journal articles in
CORD-19 which are relevant to the key questions posed by CORD-19. A BioBERT
model trained on this repurposed dataset prescribes relevancy annotations for
CORD-19 tasks that have an overall agreement of 0.4430 with majority human
annotations in terms of Cohen's kappa. We present the methodology used to
construct the new dataset and describe the decision process used throughout.
- Abstract(参考訳): 新型コロナウイルス感染症(COVID-19)は2019年後半に中国武漢で発生し、これまでに全世界で1400万人以上が感染し、75万人以上が死亡した。
2020年3月10日、世界保健機関(WHO)は世界的なパンデミックを宣言した。
医学領域に限定されない多くの学者や研究者が、新たな発見に関する論文を出版し始めた。
しかし、大量の出版物が流入する中、これらの個人が大量のデータを精査し、その発見を理解することは困難であった。
ホワイトハウスとallen institute for ai率いる業界研究機関は、さまざまな新型コロナウイルスに関する20万以上のジャーナル記事を収集し、コーパスに関連する重要な質問に答え、データセットをcord-19として公開するようコミュニティに指示した。
情報検索(IR)コミュニティは、CORD-19内のジャーナル記事を再利用し、TREC-COVIDと呼ばれる古典的なTRECスタイルのコンペティションに近づいた。
関連する取り組みとして, TREC-COVID タスクの関連アノテーションを再利用し, CORD-19 の重要課題に関連する CORD-19 のジャーナル記事の特定を行った。
この再利用データセットに基づいてトレーニングされたBioBERTモデルは、Cohenのkappaという観点で、一般的な人間のアノテーションと0.4430の合意を持つCORD-19タスクの関連アノテーションを規定している。
本稿では,新しいデータセットの構築に使用する方法論と,その全体的決定過程について述べる。
関連論文リスト
- COVID-19 Literature Mining and Retrieval using Text Mining Approaches [0.0]
新型コロナウイルス感染症(COVID-19)は2019年後半に武漢で発生し、これまでに全世界で1億4800万人以上が感染している。
多くの学者や研究者が、covid-19に関する最新の発見を説明する論文を公表し始めた。
提案モデルでは,研究論文の大規模コーパスから残酷なタイトルを抽出しようと試みている。
論文 参考訳(メタデータ) (2022-05-29T22:34:19Z) - Unsupervised Text Mining of COVID-19 Records [0.0]
Twitterは、研究者が新型コロナウイルス(COVID-19)に反応して公衆衛生を測定するのに役立つ強力なツールだ。
本稿は、CORD-19と命名された新型コロナウイルスに関する既存の医療データセットを前処理し、教師付き分類タスクのためのデータセットを注釈付けした。
論文 参考訳(メタデータ) (2021-09-08T05:57:22Z) - Global Tweet Mentions of COVID-19 [3.3043776328952226]
われわれは、2020年1月から現在まで毎週更新されている190万件のキーワード選択されたTwitter投稿のオープンソースデータセットを提示する。
ダッシュボードには、キーワードやハッシュタグを含むジオタグ付きツイートの100%が表示される。
新型コロナウイルスの新たな変種が出現する一方で、ワクチンの根絶と耐性が進行中であるため、このデータセットは研究者によって新型コロナウイルスのさまざまな側面を研究するために使われる可能性がある。
論文 参考訳(メタデータ) (2021-08-13T20:21:29Z) - Artificial Intelligence (AI) and Big Data for Coronavirus (COVID-19)
Pandemic: A Survey on the State-of-the-Arts [10.741018907229927]
2019年12月に中国・湖北省で初めて感染した新型コロナウイルス(COVID-19)が発見された。
新型コロナウイルス(COVID-19)のパンデミックは世界の214か国に広がり、私たちの日常生活のあらゆる側面に大きな影響を与えている。
近年の人工知能(AI)の進歩と、さまざまな分野におけるビッグデータの応用に触発され、新型コロナウイルスの感染拡大に対応することの重要性を強調した。
論文 参考訳(メタデータ) (2021-07-17T13:12:30Z) - Denmark's Participation in the Search Engine TREC COVID-19 Challenge:
Lessons Learned about Searching for Precise Biomedical Scientific Information
on COVID-19 [22.96824848167245]
コペンハーゲン大学とアルボーグ大学は2020年のTREC-COVID Challengeに参加した。
競争の目的は、新型コロナウイルスの正確な生医学的な情報を取得するための検索エンジン戦略を見つけることであった。
論文 参考訳(メタデータ) (2020-11-25T12:30:38Z) - Understanding the temporal evolution of COVID-19 research through
machine learning and natural language processing [66.63200823918429]
重症急性呼吸器症候群2号(SARS-CoV-2)による新型コロナウイルス感染症(COVID-19)の流行は、世界中の人々の生活や社会に影響を与え続けている。
私たちは複数のデータソース、すなわちPubMedとArXivを使用し、現在のCOVID-19研究の風景を特徴づけるために、いくつかの機械学習モデルを構築しました。
調査の結果,PubMedとArXivで利用可能な研究の種類は異なることが確認された。
論文 参考訳(メタデータ) (2020-07-22T18:02:39Z) - A Survey on Applications of Artificial Intelligence in Fighting Against
COVID-19 [75.84689958489724]
SARS-CoV-2ウイルスによる新型コロナウイルスのパンデミックは世界中で急速に広がり、世界的な感染拡大につながっている。
新型コロナウイルス対策の強力なツールとして、人工知能(AI)技術はこのパンデミックに対抗するために広く利用されている。
この調査では、新型コロナウイルス対策におけるAIテクノロジの既存および潜在的応用に関する包括的見解を、医療とAI研究者に提示する。
論文 参考訳(メタデータ) (2020-07-04T22:48:15Z) - TICO-19: the Translation Initiative for Covid-19 [112.5601530395345]
COvid-19の翻訳イニシアチブ(TICO-19)は、テストおよび開発データを、35の異なる言語でAIおよびMT研究者に提供した。
同じデータが表現されているすべての言語に変換されるため、テストや開発は、セット内の任意の言語のペアリングに対して行うことができる。
論文 参考訳(メタデータ) (2020-07-03T16:26:17Z) - CO-Search: COVID-19 Information Retrieval with Semantic Search, Question
Answering, and Abstractive Summarization [53.67205506042232]
CO-Searchは、新型コロナウイルスの文献上の複雑なクエリを処理するように設計された、レトリバーランサーセマンティック検索エンジンである。
ドメイン固有の比較的限られたデータセットを考慮し、文書の段落と引用の2部グラフを生成する。
TREC-COVID情報検索課題のデータに基づいて,本システムの評価を行った。
論文 参考訳(メタデータ) (2020-06-17T01:32:48Z) - A Study of Knowledge Sharing related to Covid-19 Pandemic in Stack
Overflow [69.5231754305538]
主に2020年2月と3月に投稿された464のStack Overflowに関する質問と、テキストマイニングの力を活用した調査。
事実、この世界的な危機はStack Overflowにおける活動の激化を招き、ほとんどのトピックは、Covid-19データ分析に対する強い関心を反映している。
論文 参考訳(メタデータ) (2020-04-18T08:19:46Z) - Mapping the Landscape of Artificial Intelligence Applications against
COVID-19 [59.30734371401316]
世界保健機関(WHO)は、SARS-CoV-2ウイルスによる新型コロナウイルスの感染をパンデミックと宣言した。
我々は、機械学習と、より広範に、人工知能を用いた最近の研究の概要を、新型コロナウイルス危機の多くの側面に取り組むために提示する。
論文 参考訳(メタデータ) (2020-03-25T12:30:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。