論文の概要: Using Text Analytics for Health to Get Meaningful Insights from a Corpus
of COVID Scientific Papers
- arxiv url: http://arxiv.org/abs/2110.15453v1
- Date: Thu, 28 Oct 2021 22:14:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-01 14:41:18.315678
- Title: Using Text Analytics for Health to Get Meaningful Insights from a Corpus
of COVID Scientific Papers
- Title(参考訳): 医学論文のコーパスから有意義な洞察を得るためのテキスト分析の利用
- Authors: Dmitry Soshnikov and Vickie Soshnikova
- Abstract要約: 新型コロナウイルスのパンデミックの開始以来、約70万件の科学論文が公表されている。
人間の研究者は、そのような巨大なテキストコーパスに慣れることはできません。
Text Analytics for Healthの事前トレーニングサービスと、いくつかのクラウドツールを使って、科学論文からいくつかの知識を抽出します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Since the beginning of COVID pandemic, there have been around 700000
scientific papers published on the subject. A human researcher cannot possibly
get acquainted with such a huge text corpus -- and therefore developing
AI-based tools to help navigating this corpus and deriving some useful insights
from it is highly needed. In this paper, we will use Text Analytics for Health
pre-trained service together with some cloud tools to extract some knowledge
from scientific papers, gain insights, and build a tool to help researcher
navigate the paper collection in a meaningful way.
- Abstract(参考訳): 新型コロナウイルスのパンデミックの開始以来、約70万件の科学論文が公表されている。
人間の研究者は、このような巨大なテキストコーパスを知ることは不可能であり、そのため、このコーパスをナビゲートし、そこから有用な洞察を得るのに役立つAIベースのツールを開発する必要がある。
本稿では,学術論文からいくつかの知識を抽出し,洞察を得て,研究者が有意義な方法で論文コレクションをナビゲートするツールを構築するために,Text Analytics for Healthとクラウドツールを併用する。
関連論文リスト
- SciDMT: A Large-Scale Corpus for Detecting Scientific Mentions [52.35520385083425]
SciDMTは,科学的言及検出のための拡張および拡張されたコーパスである。
コーパスは,1)SciDMTの主コーパスは8万4千件の科学的論文と8百万件以上の弱い注釈付き言及アノテーションと,2)評価目的のために手作業で注釈付けされた100件の科学的論文からなる評価セットから構成される。
論文 参考訳(メタデータ) (2024-06-20T22:03:21Z) - MatNexus: A Comprehensive Text Mining and Analysis Suite for Materials
Discover [6.60663354161893]
MatNexusは科学論文からのテキストの自動収集、処理、分析のための専用ソフトウェアである。
MatNexusは、膨大な量の科学出版物とともに、物質科学の科学的文献から洞察を得るための、エンドツーエンドのツールとして注目されている。
論文 参考訳(メタデータ) (2023-11-07T14:14:36Z) - GAIA Search: Hugging Face and Pyserini Interoperability for NLP Training
Data Exploration [97.68234051078997]
我々はPyseriniを、オープンソースのAIライブラリとアーティファクトのHugging Faceエコシステムに統合する方法について論じる。
Jupyter NotebookベースのウォークスルーがGitHubで公開されている。
GAIA Search - 前述した原則に従って構築された検索エンジンで、人気の高い4つの大規模テキストコレクションへのアクセスを提供する。
論文 参考訳(メタデータ) (2023-06-02T12:09:59Z) - EasyNER: A Customizable Easy-to-Use Pipeline for Deep Learning- and
Dictionary-based Named Entity Recognition from Medical Text [32.73124984242397]
我々は、ディープラーニングと辞書に基づく名前付きエンティティ認識のための、使い易いエンドツーエンドパイプラインを開発した。
パイプラインは、大規模な医学研究論文収集(CORD-19)や生テキストにアクセスし、処理することができる。
出力は、検出されたエンティティと注釈付きテキストを含むファイルの公開可能なランクリストとグラフで構成されている。
論文 参考訳(メタデータ) (2023-04-16T15:17:56Z) - The Semantic Scholar Open Data Platform [79.4493235243312]
セマンティック・スカラー(Semantic Scholar、S2)は、学術文献の発見と理解を支援することを目的としたオープンデータプラットフォームおよびウェブサイトである。
我々は、学術的なPDFコンテンツ抽出と知識グラフの自動構築のための最先端技術を用いて、パブリックおよびプロプライエタリなデータソースを組み合わせる。
このグラフには、構造解析されたテキスト、自然言語要約、ベクトル埋め込みなどの高度な意味的特徴が含まれている。
論文 参考訳(メタデータ) (2023-01-24T17:13:08Z) - DeepShovel: An Online Collaborative Platform for Data Extraction in
Geoscience Literature with AI Assistance [48.55345030503826]
地質学者は、関連する結果やデータを発見、抽出、集約するために膨大な量の文献を読む必要がある。
DeepShovelは、彼らのニーズをサポートするAI支援データ抽出システムである。
14人の研究者によるユーザ評価の結果、DeepShovelは科学データベース構築のためのデータ抽出の効率を改善した。
論文 参考訳(メタデータ) (2022-02-21T12:18:08Z) - DRIFT: A Toolkit for Diachronic Analysis of Scientific Literature [0.7349727826230862]
DRIFTをオープンソースとして公開し、研究者が長年の研究動向と開発を追跡できるようにしました。
分析手法は、よく暗唱された研究成果と照合され、我々のいくつかの方法が良い測定のために追加されている。
本ツールの有用性と有効性を示すため,arXivリポジトリのcs.CLコーパスのケーススタディを行い,解析手法から推論を行う。
論文 参考訳(メタデータ) (2021-07-02T17:33:25Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - PubSqueezer: A Text-Mining Web Tool to Transform Unstructured Documents
into Structured Data [0.0]
テキストマイニング戦略を用いて非構造化バイオメディカル物品を構造化データに変換するウェブツールを提案する。
生成された結果は、明らかに報告されていない情報を示す可能性のある、複雑なトピックに関する簡単な概要を提供する。
PubSqueezer を用いた文献分析により,SARS-CoV-2 に関する既知の事実を記述できることを示す。
論文 参考訳(メタデータ) (2020-11-05T22:23:18Z) - A Corpus for Large-Scale Phonetic Typology [112.19288631037055]
本稿では,VoxClamantis v1.0について紹介する。
635言語にまたがる690の音素レベルラベルと690の音素レベルラベルと母音とシビラントの音響・音韻測定を行った。
論文 参考訳(メタデータ) (2020-05-28T13:03:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。