論文の概要: COVID-19 therapy target discovery with context-aware literature mining
- arxiv url: http://arxiv.org/abs/2007.15681v2
- Date: Mon, 9 Nov 2020 20:19:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-05 14:43:09.334817
- Title: COVID-19 therapy target discovery with context-aware literature mining
- Title(参考訳): コンテキスト認識型文献マイニングによる新型コロナウイルス治療ターゲット発見
- Authors: Matej Martinc, Bla\v{z} \v{S}krlj, Sergej Pirkmajer, Nada Lavra\v{c},
Bojan Cestnik, Martin Marzidov\v{s}ek, Senja Pollak
- Abstract要約: 本稿では,エンティティ間の関係を近似することで,経験的表現データの文脈化を行うシステムを提案する。
トランスファーラーニングによりより大きな科学的文脈を活用するために,新しい埋め込み生成手法を提案する。
- 参考スコア(独自算出の注目度): 5.839799877302573
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The abundance of literature related to the widespread COVID-19 pandemic is
beyond manual inspection of a single expert. Development of systems, capable of
automatically processing tens of thousands of scientific publications with the
aim to enrich existing empirical evidence with literature-based associations is
challenging and relevant. We propose a system for contextualization of
empirical expression data by approximating relations between entities, for
which representations were learned from one of the largest COVID-19-related
literature corpora. In order to exploit a larger scientific context by transfer
learning, we propose a novel embedding generation technique that leverages
SciBERT language model pretrained on a large multi-domain corpus of scientific
publications and fine-tuned for domain adaptation on the CORD-19 dataset. The
conducted manual evaluation by the medical expert and the quantitative
evaluation based on therapy targets identified in the related work suggest that
the proposed method can be successfully employed for COVID-19 therapy target
discovery and that it outperforms the baseline FastText method by a large
margin.
- Abstract(参考訳): 新型コロナウイルス(COVID-19)のパンデミックに関連する文献の豊富さは、1人の専門家の手作業による検査を超えている。
何万もの学術出版物を自動処理して、既存の実証的証拠を文献に基づく協会に集約するシステムの開発は、困難かつ重要である。
本研究では,covid-19関連文献のコーパスから表現を学ぶエンティティ間の関係を近似し,経験的表現データの文脈化システムを提案する。
本研究では,学術出版物の多分野に事前学習したSciBERT言語モデルを利用して,CORD-19データセット上でのドメイン適応を微調整した新しい埋め込み生成手法を提案する。
本手法は, 医療専門家による手作業による評価と, 関連研究で特定された治療対象に基づく定量的評価により, 新型コロナウイルス治療対象の発見に成功し, ベースラインのFastText法よりも高い成績を示した。
関連論文リスト
- SciRIFF: A Resource to Enhance Language Model Instruction-Following over Scientific Literature [80.49349719239584]
SciRIFF(Scientific Resource for Instruction-Following and Finetuning, SciRIFF)は、54のタスクに対して137Kの命令追従デモのデータセットである。
SciRIFFは、幅広い科学分野の研究文献から情報を抽出し、合成することに焦点を当てた最初のデータセットである。
論文 参考訳(メタデータ) (2024-06-10T21:22:08Z) - PathLDM: Text conditioned Latent Diffusion Model for Histopathology [62.970593674481414]
そこで我々は,高品質な病理像を生成するためのテキスト条件付き遅延拡散モデルPathLDMを紹介した。
提案手法は画像とテキストデータを融合して生成プロセスを強化する。
我々は,TCGA-BRCAデータセット上でのテキスト・ツー・イメージ生成において,SoTA FIDスコア7.64を達成し,FID30.1と最も近いテキスト・コンディショナブル・コンペティタを著しく上回った。
論文 参考訳(メタデータ) (2023-09-01T22:08:32Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - Natural Language Inference with Self-Attention for Veracity Assessment
of Pandemic Claims [54.93898455714295]
まず、COVID-19に関する異質なクレームからなる新しいPANACEAデータセットの構築について述べる。
そこで我々は,自然言語推論に基づく自動妥当性評価のための新しい手法を提案する。
論文 参考訳(メタデータ) (2022-05-05T12:11:31Z) - Prioritization of COVID-19-related literature via unsupervised keyphrase
extraction and document representation learning [1.8374319565577157]
新型コロナウイルス(COVID-19)のパンデミックは、手作業で適切な時間枠で検査や研究が不可能な、新しい科学文献の波を引き起こした。
現在の機械学習手法では、類似した文書が互いに近接しているベクトル空間にそのような文献を投影する。
本システムでは, ウイルス関連文献の現在の体は, 教師なしキーフレーズ抽出を用いて注釈付けされている。
このソリューションは、対話型検索、用語ランキング、潜在的に興味深い文献の探索が可能なWebサーバを通じてアクセス可能である。
論文 参考訳(メタデータ) (2021-10-17T17:35:09Z) - Impact of detecting clinical trial elements in exploration of COVID-19
literature [29.027162080682643]
本稿では, 標準検索エンジンによる検索結果と臨床関連概念を用いたフィルタリング結果と, その関連性について比較する。
関係性の概念選択は、元の検索したコレクションを、未判断の文書の割合を減少させる方法でフィルタリングする。
論文 参考訳(メタデータ) (2021-05-25T23:41:24Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - Improving Clinical Document Understanding on COVID-19 Research with
Spark NLP [0.0]
世界的な新型コロナウイルスのパンデミックの後、ウイルスを研究する科学論文の数は大幅に増加しました。
これまでの取り組みを3つの方法で改善する臨床テキストマイニングシステムを紹介します。
まず、健康、解剖学、リスクファクター、有害事象の社会的決定要因を含む100以上の異なるエンティティタイプを認識することができます。
第2に、テキスト処理パイプラインは、アサーション状態検出を含み、患者以外の誰かの存在、欠如、条件付き、または、患者に関する臨床事実を区別する。
論文 参考訳(メタデータ) (2020-12-07T19:17:05Z) - Extracting a Knowledge Base of Mechanisms from COVID-19 Papers [50.17242035034729]
我々はメカニズムの知識ベース(KB)の構築を追求する。
我々は、妥当性と幅のバランスをとる広範で統一されたスキーマを開発する。
実験は、新型コロナウイルスの文献に関する学際的な科学的検索を支援するためのKBの有用性を実証する。
論文 参考訳(メタデータ) (2020-10-08T07:54:14Z) - Automatic Text Summarization of COVID-19 Medical Research Articles using
BERT and GPT-2 [8.223517872575712]
我々は,既存のNLPモデルであるBERTとOpenAI GPT-2の最近の進歩を活用している。
本モデルは,原文から抽出したキーワードに基づいて,抽象的かつ包括的情報を提供する。
我々の研究は、要約がまだ手に入らない記事の簡潔な要約を提供することで、医療コミュニティに役立てることができる。
論文 参考訳(メタデータ) (2020-06-03T00:54:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。