論文の概要: CAiRE-COVID: A Question Answering and Query-focused Multi-Document
Summarization System for COVID-19 Scholarly Information Management
- arxiv url: http://arxiv.org/abs/2005.03975v3
- Date: Tue, 8 Dec 2020 11:30:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 00:19:26.330087
- Title: CAiRE-COVID: A Question Answering and Query-focused Multi-Document
Summarization System for COVID-19 Scholarly Information Management
- Title(参考訳): caire-covid:covid-19学術情報管理のための質問応答とクエリ指向のマルチドキュメント要約システム
- Authors: Dan Su, Yan Xu, Tiezheng Yu, Farhad Bin Siddique, Elham J. Barezi,
Pascale Fung
- Abstract要約: 我々は、リアルタイム質問応答(QA)とマルチドキュメント要約システムであるCAiRE-COVIDを紹介し、Kaggle COVID-19 Open Researchデータセットチャレンジで10のタスクのうちの1つを勝ち取った。
本システムの目的は,コミュニティからの優先度の高い質問に答えることによって,新型コロナウイルスに関する数多くの学術論文をマイニングすることにある。
- 参考スコア(独自算出の注目度): 48.251211691263514
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present CAiRE-COVID, a real-time question answering (QA) and
multi-document summarization system, which won one of the 10 tasks in the
Kaggle COVID-19 Open Research Dataset Challenge, judged by medical experts. Our
system aims to tackle the recent challenge of mining the numerous scientific
articles being published on COVID-19 by answering high priority questions from
the community and summarizing salient question-related information. It combines
information extraction with state-of-the-art QA and query-focused
multi-document summarization techniques, selecting and highlighting evidence
snippets from existing literature given a query. We also propose query-focused
abstractive and extractive multi-document summarization methods, to provide
more relevant information related to the question. We further conduct
quantitative experiments that show consistent improvements on various metrics
for each module. We have launched our website CAiRE-COVID for broader use by
the medical community, and have open-sourced the code for our system, to
bootstrap further study by other researches.
- Abstract(参考訳): 医療専門家が判断したKaggle COVID-19 Open Research Dataset Challengeの10つのタスクのうちの1つに、リアルタイム質問応答(QA)とマルチドキュメント要約システムであるCAiRE-COVIDを紹介した。
本システムの目的は,コミュニティからの優先度の高い質問に回答し,有能な質問関連情報を要約することで,新型コロナウイルスに関する数多くの学術論文をマイニングすることにある。
情報抽出と最先端のQAとクエリ中心のマルチドキュメント要約技術を組み合わせて、クエリが与えられた既存の文献からエビデンスススニペットを選択してハイライトする。
また,質問に焦点をあてた抽象的かつ抽出的な多文書要約手法を提案し,質問に関するより関連性の高い情報を提供する。
さらに,各モジュールの各種指標について一貫した改善を示す定量的実験を行う。
私たちは、医療コミュニティが広く利用するためのウェブサイトCAiRE-COVIDをローンチし、我々のシステムのコードをオープンソース化し、他の研究者によるさらなる研究をブートストラップしました。
関連論文リスト
- SPIQA: A Dataset for Multimodal Question Answering on Scientific Papers [43.18330795060871]
SPIQAは、科学研究論文の文脈内で複雑な図形や表を解釈するために設計されたデータセットである。
データセット作成には自動および手動のキュレーションを使用します。
SPIQAは270Kの質問をトレーニング、検証、3つの異なる評価分割に分割する。
論文 参考訳(メタデータ) (2024-07-12T16:37:59Z) - Improving Health Question Answering with Reliable and Time-Aware Evidence Retrieval [5.69361786082969]
本研究は,オープンドメインのQA設定に焦点をあて,重要な課題は,まず大きな知識ベースで関連する証拠を明らかにすることである。
一般的な検索対象QAパイプラインとPubMedを信頼できる医療研究資料のコレクションとして活用することにより、3つの多様なデータセットからの健康問題に答える。
以上の結果から,検索した文書の量を削減し,最近かつ高度に引用された文書を優先することで,最終マクロF1スコアを最大10%向上させることができることがわかった。
論文 参考訳(メタデータ) (2024-04-12T09:56:12Z) - Clinfo.ai: An Open-Source Retrieval-Augmented Large Language Model
System for Answering Medical Questions using Scientific Literature [44.715854387549605]
我々はClinfo.aiをリリースした。Clinfo.aiはオープンソースのWebアプリケーションで、動的に検索された科学的文献に基づいて臨床上の質問に答える。
我々は PubMedRS-200 上で Clinfo.ai および他の公開 OpenQA システムのベンチマーク結果を報告する。
論文 参考訳(メタデータ) (2023-10-24T19:43:39Z) - Embrace Divergence for Richer Insights: A Multi-document Summarization Benchmark and a Case Study on Summarizing Diverse Information from News Articles [136.84278943588652]
同一イベントを含む複数のニュース記事において遭遇する多様な情報を要約する新しい課題を提案する。
この作業を容易にするために、多様な情報を特定するためのデータ収集スキーマの概要と、DiverseSummというデータセットをキュレートした。
データセットには245のニュース記事が含まれており、各ストーリーは10のニュース記事からなり、人間公認の参照と組み合わせられる。
論文 参考訳(メタデータ) (2023-09-17T20:28:17Z) - Enhancing Human-like Multi-Modal Reasoning: A New Challenging Dataset
and Comprehensive Framework [51.44863255495668]
マルチモーダル推論は、人間のような知性を示す人工知能システムの追求において重要な要素である。
提案するマルチモーダル推論(COCO-MMR)データセットは,オープンエンド質問の集合を包含する新しいデータセットである。
画像とテキストエンコーダを強化するために,マルチホップ・クロスモーダル・アテンションや文レベルのコントラスト学習などの革新的な手法を提案する。
論文 参考訳(メタデータ) (2023-07-24T08:58:25Z) - QuOTeS: Query-Oriented Technical Summarization [0.2936007114555107]
提案するQuOTeSは,潜在的参照の集合から研究の要約に関連する文章を検索するインタラクティブシステムである。
QuOTeS は Query-Focused Extractive Summarization と High-Recall Information Retrieval の技法を統合し、科学文書のインタラクティブなクエリ-Focused Summarization を提供する。
結果から,QuOTeSは肯定的なユーザエクスペリエンスを提供し,関連する,簡潔かつ完全なクエリ中心の要約を一貫して提供することが明らかになった。
論文 参考訳(メタデータ) (2023-06-20T18:43:24Z) - Large-Scale Knowledge Synthesis and Complex Information Retrieval from
Biomedical Documents [0.33249867230903685]
医療産業の最近の進歩は、構造化されていないデータが豊富に蓄積されている。
我々の研究は、大規模研究文書から複雑な情報を抽出し、探索するためのオールインワンのスケーラブルなソリューションを提供する。
論文 参考訳(メタデータ) (2023-02-14T06:03:43Z) - MQAG: Multiple-choice Question Answering and Generation for Assessing
Information Consistency in Summarization [55.60306377044225]
最先端の要約システムは高度に流動的な要約を生成することができる。
しかし、これらの要約には、情報源に存在しない事実上の矛盾や情報が含まれている可能性がある。
本稿では,ソース情報と要約情報を直接比較する,標準的な情報理論に基づく代替手法を提案する。
論文 参考訳(メタデータ) (2023-01-28T23:08:25Z) - A Dataset of Information-Seeking Questions and Answers Anchored in
Research Papers [66.11048565324468]
1,585の自然言語処理論文に関する5,049の質問のデータセットを提示する。
各質問は、対応する論文のタイトルと要約のみを読むNLP実践者によって書かれ、質問は全文に存在する情報を求めます。
他のQAタスクでうまく機能する既存のモデルは、これらの質問に答える上ではうまく機能せず、論文全体から回答する際には、少なくとも27 F1ポイントパフォーマンスが低下します。
論文 参考訳(メタデータ) (2021-05-07T00:12:34Z) - Interpretable Multi-Step Reasoning with Knowledge Extraction on Complex
Healthcare Question Answering [89.76059961309453]
HeadQAデータセットには、公衆医療専門試験で認可された複数の選択質問が含まれている。
これらの質問は、現在のQAシステムにとって最も難しいものです。
知識抽出フレームワーク(MurKe)を用いた多段階推論を提案する。
市販の事前訓練モデルを完全に活用しようと努力しています。
論文 参考訳(メタデータ) (2020-08-06T02:47:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。