論文の概要: PhenoTagger: A Hybrid Method for Phenotype Concept Recognition using
Human Phenotype Ontology
- arxiv url: http://arxiv.org/abs/2009.08478v2
- Date: Mon, 25 Jan 2021 16:08:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 09:09:17.836962
- Title: PhenoTagger: A Hybrid Method for Phenotype Concept Recognition using
Human Phenotype Ontology
- Title(参考訳): PhenoTagger:ヒト現象型オントロジーを用いた現象型概念認識のためのハイブリッド手法
- Authors: Ling Luo, Shankai Yan, Po-Ting Lai, Daniel Veltri, Andrew Oler,
Sandhya Xirasagar, Rajarshi Ghosh, Morgan Similuk, Peter N. Robinson, Zhiyong
Lu
- Abstract要約: PhenoTaggerは、辞書と機械学習に基づく手法を組み合わせて、構造化されていないテキストの概念を認識するハイブリッド手法である。
提案手法は2つのHPOコーパスを用いて検証し,PhenoTaggerが従来の手法と比較した。
- 参考スコア(独自算出の注目度): 6.165755812152143
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic phenotype concept recognition from unstructured text remains a
challenging task in biomedical text mining research. Previous works that
address the task typically use dictionary-based matching methods, which can
achieve high precision but suffer from lower recall. Recently, machine
learning-based methods have been proposed to identify biomedical concepts,
which can recognize more unseen concept synonyms by automatic feature learning.
However, most methods require large corpora of manually annotated data for
model training, which is difficult to obtain due to the high cost of human
annotation. In this paper, we propose PhenoTagger, a hybrid method that
combines both dictionary and machine learning-based methods to recognize Human
Phenotype Ontology (HPO) concepts in unstructured biomedical text. We first use
all concepts and synonyms in HPO to construct a dictionary, which is then used
to automatically build a distantly supervised training dataset for machine
learning. Next, a cutting-edge deep learning model is trained to classify each
candidate phrase (n-gram from input sentence) into a corresponding concept
label. Finally, the dictionary and machine learning-based prediction results
are combined for improved performance. Our method is validated with two HPO
corpora, and the results show that PhenoTagger compares favorably to previous
methods. In addition, to demonstrate the generalizability of our method, we
retrained PhenoTagger using the disease ontology MEDIC for disease concept
recognition to investigate the effect of training on different ontologies.
Experimental results on the NCBI disease corpus show that PhenoTagger without
requiring manually annotated training data achieves competitive performance as
compared with state-of-the-art supervised methods.
- Abstract(参考訳): 非構造化テキストからの自動表現型概念認識は、バイオメディカルテキストマイニング研究において難しい課題である。
タスクに対処する以前の作業では、辞書ベースのマッチング手法が一般的に用いられており、精度は高いがリコールは少ない。
近年,自動特徴量学習によって認識できない概念シノニムを認識できる生体医学的概念を識別するために,機械学習に基づく手法が提案されている。
しかし、ほとんどの手法では、モデルトレーニングのために大量の手作業による注釈データを必要とするため、人的アノテーションのコストが高いため取得が困難である。
本稿では,非構造化バイオメディカルテキストにおけるヒト現象型オントロジー(HPO)の概念を認識するために,辞書と機械学習を併用したハイブリッド手法であるPhenoTaggerを提案する。
我々はまずHPOのすべての概念とシノニムを使用して辞書を構築し、機械学習のための遠隔教師付きトレーニングデータセットを自動構築する。
次に、最先端のディープラーニングモデルを訓練し、各候補句(入力文からn-gram)を対応する概念ラベルに分類する。
最後に、辞書と機械学習に基づく予測結果を組み合わせて性能を向上させる。
提案手法は2つのHPOコーパスを用いて検証し,PhenoTaggerが従来の手法と比較した。
また,本手法の一般化性を示すため,病的概念認識のための病的オントロジーMEDICを用いてPhenoTaggerを再訓練し,異なるオントロジーに対するトレーニングの効果を検討した。
NCBI 病的コーパスの実験結果から,手動でアノテートしたトレーニングデータを必要としない PhenoTagger は,最先端の教師付き手法と比較して,競争性能が向上することが示された。
関連論文リスト
- Bi-Encoders based Species Normalization -- Pairwise Sentence Learning to
Rank [0.0]
本稿では、名前付きエンティティ正規化のための新しい深層学習手法を提案し、問題をランク付けするペアワイズ学習として扱う。
本研究は,種の実体型に関する実験を行い,その手法を最先端技術に対して評価する。
論文 参考訳(メタデータ) (2023-10-22T17:30:16Z) - Biomedical Named Entity Recognition via Dictionary-based Synonym
Generalization [51.89486520806639]
本研究では,入力テキストに含まれる生物医学的概念をスパンベース予測を用いて認識する,新しいSynGenフレームワークを提案する。
提案手法を広範囲のベンチマークで広範囲に評価し,SynGenが従来の辞書ベースモデルよりも顕著なマージンで優れていることを確認した。
論文 参考訳(メタデータ) (2023-05-22T14:36:32Z) - Few-Shot Meta Learning for Recognizing Facial Phenotypes of Genetic
Disorders [55.41644538483948]
分類の自動化と類似性検索は、医師が可能な限り早期に遺伝状態の診断を行うための意思決定を支援する。
従来の研究は分類問題としてこの問題に対処し、深層学習法を用いてきた。
本研究では,健常人の大規模なコーパスで訓練した顔認識モデルを用いて,顔の表情認識に移行した。
論文 参考訳(メタデータ) (2022-10-23T11:52:57Z) - Generative Biomedical Entity Linking via Knowledge Base-Guided
Pre-training and Synonyms-Aware Fine-tuning [0.8154691566915505]
バイオメディカル・エンティティ・リンク(EL)のモデル化のための生成的アプローチを提案する。
そこで本研究では,KBの同義語と定義を用いた合成サンプルの構築により,KB指導による事前学習を提案する。
また、学習のための概念名を選択するためのシノニム対応の微調整を提案し、推論のためにデコーダプロンプトとマルチシンノニム制約付きプレフィックスツリーを提案する。
論文 参考訳(メタデータ) (2022-04-11T14:50:51Z) - BERT WEAVER: Using WEight AVERaging to enable lifelong learning for
transformer-based models in biomedical semantic search engines [49.75878234192369]
We present WEAVER, a simple, yet efficient post-processing method that infuse old knowledge into the new model。
WEAVERを逐次的に適用すると、同じ単語の埋め込み分布が、一度にすべてのデータに対する総合的なトレーニングとして得られることを示す。
論文 参考訳(メタデータ) (2022-02-21T10:34:41Z) - Semantic Search for Large Scale Clinical Ontologies [63.71950996116403]
本稿では,大規模臨床語彙検索システムを構築するための深層学習手法を提案する。
本稿では,意味学習データに基づくトレーニングデータを生成するTriplet-BERTモデルを提案する。
このモデルは,5つの実ベンチマークデータセットを用いて評価され,提案手法は自由テキストから概念,概念まで,概念語彙の検索において高い結果が得られることを示す。
論文 参考訳(メタデータ) (2022-01-01T05:15:42Z) - Self-Supervised Detection of Contextual Synonyms in a Multi-Class
Setting: Phenotype Annotation Use Case [11.912581294872767]
文脈的単語埋め込みは文脈的同義語を検出する強力なツールである。
本研究では,浅部マッチングによって生成されたデータに基づいて,概念の文脈的同義性を検出できる自己教師付き事前学習手法を提案する。
論文 参考訳(メタデータ) (2021-09-04T21:35:01Z) - End-to-end Biomedical Entity Linking with Span-based Dictionary Matching [5.273138059454523]
病名認識と正常化は、生物医学的なテキストマイニングの基本的なプロセスです。
本研究では,スパン表現と辞書マッチング機能を組み合わせた新しいエンドツーエンドアプローチを提案する。
我々のモデルは、ニューラルネットワークモデルの性能を維持しながら辞書を参照することで、目に見えない概念を扱う。
論文 参考訳(メタデータ) (2021-04-21T12:24:12Z) - Hierarchical Learning Using Deep Optimum-Path Forest [55.60116686945561]
バグオブビジュアルワード(bovw)やディープラーニング技術は、コンピュータ支援医療診断を含むいくつかの領域で広く使われている。
本研究では機械学習とBoVWの概念を用いたパーキンソン病の自動同定ツールの開発に興味を持っている。
論文 参考訳(メタデータ) (2021-02-18T13:02:40Z) - Mechanisms for Handling Nested Dependencies in Neural-Network Language
Models and Humans [75.15855405318855]
我々は,「深層学習」手法で訓練された現代人工ニューラルネットワークが,人間の文処理の中心的な側面を模倣するかどうかを検討した。
ネットワークは、大きなコーパスで次の単語を予測するためにのみ訓練されたが、分析の結果、局所的および長距離の構文合意をうまく処理する特別なユニットが出現した。
我々は,複数の名詞の単数/複数状態における体系的な変化を伴う文中の数一致の違反を人間が検出する行動実験において,モデルの予測を検証した。
論文 参考訳(メタデータ) (2020-06-19T12:00:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。