論文の概要: Drug and Disease Interpretation Learning with Biomedical Entity
Representation Transformer
- arxiv url: http://arxiv.org/abs/2101.09311v1
- Date: Fri, 22 Jan 2021 20:01:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-20 17:22:20.016741
- Title: Drug and Disease Interpretation Learning with Biomedical Entity
Representation Transformer
- Title(参考訳): 生体組織表現トランスフォーマを用いた薬物・疾患解釈学習
- Authors: Zulfat Miftahutdinov, Artur Kadurin, Roman Kudrin, and Elena
Tutubalina
- Abstract要約: 自由形式のテキストにおける概念正規化は、あらゆるテキストマイニングパイプラインにおいて重要なステップです。
微調整BERTアーキテクチャに基づくシンプルで効果的な2段階のニューラルアプローチを提案する。
- 参考スコア(独自算出の注目度): 9.152161078854146
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Concept normalization in free-form texts is a crucial step in every
text-mining pipeline. Neural architectures based on Bidirectional Encoder
Representations from Transformers (BERT) have achieved state-of-the-art results
in the biomedical domain. In the context of drug discovery and development,
clinical trials are necessary to establish the efficacy and safety of drugs. We
investigate the effectiveness of transferring concept normalization from the
general biomedical domain to the clinical trials domain in a zero-shot setting
with an absence of labeled data. We propose a simple and effective two-stage
neural approach based on fine-tuned BERT architectures. In the first stage, we
train a metric learning model that optimizes relative similarity of mentions
and concepts via triplet loss. The model is trained on available labeled
corpora of scientific abstracts to obtain vector embeddings of concept names
and entity mentions from texts. In the second stage, we find the closest
concept name representation in an embedding space to a given clinical mention.
We evaluated several models, including state-of-the-art architectures, on a
dataset of abstracts and a real-world dataset of trial records with
interventions and conditions mapped to drug and disease terminologies.
Extensive experiments validate the effectiveness of our approach in knowledge
transfer from the scientific literature to clinical trials.
- Abstract(参考訳): 自由形式のテキストにおける概念正規化は、すべてのテキストマイニングパイプラインにおいて重要なステップである。
変換器(BERT)からの双方向エンコーダ表現に基づくニューラルアーキテクチャは、バイオメディカル領域において最先端の結果を得た。
創薬・開発の分野では、医薬品の有効性と安全性を確立するために臨床試験が必要である。
ラベル付きデータがないゼロショット設定において,一般バイオメディカル領域から臨床試験領域への概念正規化の移行の有効性を検討した。
本稿では,微調整bertアーキテクチャに基づく,単純かつ効果的な2段階ニューラルアプローチを提案する。
最初の段階では、三重項損失による言及や概念の相対的類似性を最適化する計量学習モデルを訓練する。
このモデルは、概念名のベクトル埋め込みとテキストからの実体参照を得るために、利用可能なラベル付き科学抽象のコーパスに基づいて訓練される。
第2段階では, 埋め込み空間において, 特定の臨床文献に最も近い概念名表現を見いだす。
我々は,抽象のデータセットや,薬物や疾患の用語にマッピングされた介入や条件を伴う実世界の治験記録データセット上で,最先端のアーキテクチャを含むいくつかのモデルを評価した。
科学的文献から臨床試験への知識伝達における我々のアプローチの有効性を検証する。
関連論文リスト
- Ontology-Based and Weakly Supervised Rare Disease Phenotyping from
Clinical Notes [13.096008602034086]
機械学習やドメインの専門家によるデータアノテーションの必要性から、希少な疾患の特定は困難である。
本稿では、二方向変換器(BERTなど)からの事前学習した文脈表現を用いたパイプラインと弱い監視手法を提案する。
本研究は,米国と英国にある2つの機関の退院サマリーと放射線学報告の3つの臨床データセットに対するアプローチについて検討した。
論文 参考訳(メタデータ) (2022-05-11T17:38:24Z) - Improving the Factual Accuracy of Abstractive Clinical Text
Summarization using Multi-Objective Optimization [3.977582258550673]
本稿では,知識誘導多目的最適化を用いた臨床テキストの抽象的要約の事実的精度向上のためのフレームワークを提案する。
本研究では,知識誘導多目的最適化を用いた臨床テキストの抽象的要約の事実的精度向上のための枠組みを提案する。
論文 参考訳(メタデータ) (2022-04-02T07:59:28Z) - Semantic Search for Large Scale Clinical Ontologies [63.71950996116403]
本稿では,大規模臨床語彙検索システムを構築するための深層学習手法を提案する。
本稿では,意味学習データに基づくトレーニングデータを生成するTriplet-BERTモデルを提案する。
このモデルは,5つの実ベンチマークデータセットを用いて評価され,提案手法は自由テキストから概念,概念まで,概念語彙の検索において高い結果が得られることを示す。
論文 参考訳(メタデータ) (2022-01-01T05:15:42Z) - Towards more patient friendly clinical notes through language models and
ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。
我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。
本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文 参考訳(メタデータ) (2021-12-23T16:11:19Z) - Automated tabulation of clinical trial results: A joint entity and
relation extraction approach with transformer-based language representations [5.825190876052148]
本稿では,2つの言語処理タスク間で問題を分解し,エビデンス表の自動生成について検討する。
本稿では,実践成果を報告するRCT要約文の自動集計に着目する。
これらのモデルを訓練し、試験するために、6つの疾患領域から600近い結果文を含む新しいゴールドスタンダードコーパスが開発された。
論文 参考訳(メタデータ) (2021-12-10T15:26:43Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z) - Clinical Named Entity Recognition using Contextualized Token
Representations [49.036805795072645]
本稿では,各単語の意味的意味をより正確に把握するために,文脈型単語埋め込み手法を提案する。
言語モデル(C-ELMo)とC-Flair(C-Flair)の2つの深い文脈型言語モデル(C-ELMo)を事前訓練する。
明示的な実験により、静的単語埋め込みとドメインジェネリック言語モデルの両方と比較して、我々のモデルは劇的に改善されている。
論文 参考訳(メタデータ) (2021-06-23T18:12:58Z) - CBLUE: A Chinese Biomedical Language Understanding Evaluation Benchmark [51.38557174322772]
中国初のバイオメディカル言語理解評価ベンチマークを提示する。
名前付きエンティティ認識、情報抽出、臨床診断正規化、単文/文対分類を含む自然言語理解タスクのコレクションである。
本研究は,現在の11種類の中国モデルによる実験結果について報告し,その実験結果から,現在最先端のニューラルモデルがヒトの天井よりもはるかに悪い性能を示すことが示された。
論文 参考訳(メタデータ) (2021-06-15T12:25:30Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - A Practical Approach towards Causality Mining in Clinical Text using
Active Transfer Learning [2.6125458645126907]
因果関係マイニングは、最先端の自然言語処理技術の応用を必要とする活発な研究領域である。
この研究は、臨床テキストを因果知識に変換するフレームワークを作成することを目的としている。
論文 参考訳(メタデータ) (2020-12-10T06:51:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。