論文の概要: An Information Retrieval and Extraction Tool for Covid-19 Related Papers
- arxiv url: http://arxiv.org/abs/2401.16430v1
- Date: Sat, 20 Jan 2024 01:34:50 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-04 05:36:27.989077
- Title: An Information Retrieval and Extraction Tool for Covid-19 Related Papers
- Title(参考訳): Covid-19関連紙の情報検索・抽出ツール
- Authors: Marcos V. L. Pivetta
- Abstract要約: 本論文の主な焦点は、研究者に新型コロナウイルス関連論文のより良い検索ツールを提供することである。
我々は,CORD-19論文のトピックベースの検索を自動化し,研究者を支援する可能性を示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Background: The COVID-19 pandemic has caused severe impacts on health systems
worldwide. Its critical nature and the increased interest of individuals and
organizations to develop countermeasures to the problem has led to a surge of
new studies in scientific journals. Objetive: We sought to develop a tool that
incorporates, in a novel way, aspects of Information Retrieval (IR) and
Extraction (IE) applied to the COVID-19 Open Research Dataset (CORD-19). The
main focus of this paper is to provide researchers with a better search tool
for COVID-19 related papers, helping them find reference papers and hightlight
relevant entities in text. Method: We applied Latent Dirichlet Allocation (LDA)
to model, based on research aspects, the topics of all English abstracts in
CORD-19. Relevant named entities of each abstract were extracted and linked to
the corresponding UMLS concept. Regular expressions and the K-Nearest Neighbors
algorithm were used to rank relevant papers. Results: Our tool has shown the
potential to assist researchers by automating a topic-based search of CORD-19
papers. Nonetheless, we identified that more fine-tuned topic modeling
parameters and increased accuracy of the research aspect classifier model could
lead to a more accurate and reliable tool. Conclusion: We emphasize the need of
new automated tools to help researchers find relevant COVID-19 documents, in
addition to automatically extracting useful information contained in them. Our
work suggests that combining different algorithms and models could lead to new
ways of browsing COVID-19 paper data.
- Abstract(参考訳): 背景:新型コロナウイルスのパンデミックは世界中の医療システムに深刻な影響を与えている。
その批判的な性質と、この問題に対する対策を開発する個人や組織の関心の高まりは、科学雑誌に新しい研究が急増した。
Objetive: COVID-19 Open Research Dataset (CORD-19) に適用される情報検索(IR)と抽出(IE)の側面を取り入れたツールの開発を試みた。
本論文の主な焦点は、研究者に新型コロナウイルス関連論文のより優れた検索ツールを提供することであり、参照論文の発見とテキスト中の高照度関連エンティティの検索を支援することである。
方法: CORD-19における全英抽象論のトピックである研究の側面に基づいて,LDA(Latent Dirichlet Allocation)をモデル化した。
各抽象概念の関連エンティティを抽出し、対応するUMLS概念と関連づけた。
正規表現とk-nearest neighborsアルゴリズムは関連する論文のランク付けに用いられた。
結果: CORD-19 論文のトピックベース検索を自動化し,研究者を支援する可能性を示した。
それにもかかわらず、より微調整されたトピックモデリングパラメータと研究アスペクト分類器モデルの精度が向上すると、より正確で信頼性の高いツールが生まれる可能性がある。
結論: 研究者が関連するcovid-19文書を見つけるのに役立つ、新しい自動化ツールの必要性を強調し、それらに含まれる有用な情報を自動的に抽出する。
私たちの研究は、さまざまなアルゴリズムとモデルを組み合わせることで、新型コロナウイルス(COVID-19)の紙データを閲覧する新たな方法が生まれることを示唆しています。
関連論文リスト
- SciER: An Entity and Relation Extraction Dataset for Datasets, Methods, and Tasks in Scientific Documents [49.54155332262579]
我々は,科学論文のデータセット,メソッド,タスクに関連するエンティティに対して,新たなエンティティと関係抽出データセットをリリースする。
我々のデータセットには、24k以上のエンティティと12kの関係を持つ106の注釈付きフルテキストの科学出版物が含まれています。
論文 参考訳(メタデータ) (2024-10-28T15:56:49Z) - Are Large Language Models Good Classifiers? A Study on Edit Intent Classification in Scientific Document Revisions [62.12545440385489]
大規模言語モデル(LLM)は、テキスト生成の大幅な進歩をもたらしたが、分類タスクの強化の可能性はまだ未検討である。
生成と符号化の両方のアプローチを含む分類のための微調整LDMを徹底的に研究するためのフレームワークを提案する。
我々はこのフレームワークを編集意図分類(EIC)においてインスタンス化する。
論文 参考訳(メタデータ) (2024-10-02T20:48:28Z) - CRAFT Your Dataset: Task-Specific Synthetic Dataset Generation Through Corpus Retrieval and Augmentation [51.2289822267563]
合成データセットを生成するCRAFT(Corpus Retrieval and Augmentation for Fine-Tuning)を提案する。
我々は、大規模な公開ウェブクローラコーパスと類似性に基づく文書検索を用いて、他の関連する人文文書を検索する。
我々は,CRAFTが4つのタスクに対して,大規模タスク固有のトレーニングデータセットを効率的に生成できることを実証した。
論文 参考訳(メタデータ) (2024-09-03T17:54:40Z) - SciRIFF: A Resource to Enhance Language Model Instruction-Following over Scientific Literature [80.49349719239584]
SciRIFF(Scientific Resource for Instruction-Following and Finetuning, SciRIFF)は、54のタスクに対して137Kの命令追従デモのデータセットである。
SciRIFFは、幅広い科学分野の研究文献から情報を抽出し、合成することに焦点を当てた最初のデータセットである。
論文 参考訳(メタデータ) (2024-06-10T21:22:08Z) - Exploring the evolution of research topics during the COVID-19 pandemic [3.234641429290768]
我々は,CORD-19 Topic Visualizer (CORToViz)について紹介する。
提案手法は,最新の技術(大規模言語モデルを含む)の選択と時間的トピックマイニングのための抽出技術に基づく。
トピックインスペクションはインタラクティブなダッシュボードによってサポートされており、単語クラウドやトピックトレンドを時系列として高速でワンクリックで可視化することができる。
論文 参考訳(メタデータ) (2023-10-05T22:16:41Z) - An approach based on Open Research Knowledge Graph for Knowledge
Acquisition from scientific papers [4.8951183832371]
Open Research Knowledge Graph (ORKG)は、研究論文から抽出されたキーインサイトを整理するコンピュータ支援ツールである。
現在、"食品情報工学"、"知識グラフマッチングへのタブラリデータ"、"クエストアンサーリング"研究問題、"Neuro-symbolic AI"ドメインの文書化に使用されている。
論文 参考訳(メタデータ) (2023-08-23T20:05:42Z) - Good Data, Large Data, or No Data? Comparing Three Approaches in
Developing Research Aspect Classifiers for Biomedical Papers [19.1408856831043]
クラウドアノテートされたCODA-19研究アスペクト分類タスクにおいて,異なるデータセットがモデル性能に与える影響について検討した。
その結果,PubMed 200K RCTデータセットではCODA-19タスクの性能が向上しないことがわかった。
論文 参考訳(メタデータ) (2023-06-07T22:56:53Z) - COVID-19 Multidimensional Kaggle Literature Organization [3.201839066679614]
因子化は文書コーパスに隠されたパターンを発見できる強力な教師なし学習手法であることを示す。
コーパスの高次表現により,類似記事,関連雑誌,類似研究論文の執筆者,話題キーワードの同時グループ化が可能となることを示す。
論文 参考訳(メタデータ) (2021-07-17T06:16:36Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - Extracting a Knowledge Base of Mechanisms from COVID-19 Papers [50.17242035034729]
我々はメカニズムの知識ベース(KB)の構築を追求する。
我々は、妥当性と幅のバランスをとる広範で統一されたスキーマを開発する。
実験は、新型コロナウイルスの文献に関する学際的な科学的検索を支援するためのKBの有用性を実証する。
論文 参考訳(メタデータ) (2020-10-08T07:54:14Z) - COVID-19 Knowledge Graph: Accelerating Information Retrieval and
Discovery for Scientific Literature [23.279540233851993]
新型コロナウイルス(COVID-19)の感染者は35万人を超え、全世界で600万人以上が感染している。
新型コロナウイルス(COVID-19)で急速に成長しているコーパスから情報を見つけ出すための追加のツールを研究者に提供するために、いくつかの検索エンジンが浮上した。
我々は、COVID-19の記事間の複雑な関係を抽出し視覚化するための異種グラフである、CKG(COVID-19 Knowledge Graph)を提示する。
論文 参考訳(メタデータ) (2020-07-24T18:29:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。