論文の概要: Unsupervised Numerical Reasoning to Extract Phenotypes from Clinical
Text by Leveraging External Knowledge
- arxiv url: http://arxiv.org/abs/2204.10202v1
- Date: Tue, 19 Apr 2022 12:44:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-23 07:38:58.949051
- Title: Unsupervised Numerical Reasoning to Extract Phenotypes from Clinical
Text by Leveraging External Knowledge
- Title(参考訳): 外部知識の活用による臨床テキストからの表現型抽出のための教師なし数値推論
- Authors: Ashwani Tanwar, Jingqing Zhang, Julia Ive, Vibhor Gupta, Yike Guo
- Abstract要約: 現在の表現型モデルでは、一般的な表現型を検出できるが、数値的な推論を必要とする表現型を検出すると性能が低下する。
本稿では,外部知識と文脈的単語埋め込みを利用した新規な教師なし手法について紹介する。
これは、一般化されたリコールとF1のスコアがそれぞれ79%、F1のスコアが71%という、大幅なパフォーマンス向上を示している。
- 参考スコア(独自算出の注目度): 11.91707762836693
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Extracting phenotypes from clinical text has been shown to be useful for a
variety of clinical use cases such as identifying patients with rare diseases.
However, reasoning with numerical values remains challenging for phenotyping in
clinical text, for example, temperature 102F representing Fever. Current
state-of-the-art phenotyping models are able to detect general phenotypes, but
perform poorly when they detect phenotypes requiring numerical reasoning. We
present a novel unsupervised methodology leveraging external knowledge and
contextualized word embeddings from ClinicalBERT for numerical reasoning in a
variety of phenotypic contexts. Comparing against unsupervised benchmarks, it
shows a substantial performance improvement with absolute gains on generalized
Recall and F1 scores up to 79% and 71%, respectively. In the supervised
setting, it also surpasses the performance of alternative approaches with
absolute gains on generalized Recall and F1 scores up to 70% and 44%,
respectively.
- Abstract(参考訳): 臨床テキストから表現型を抽出することは、稀な疾患の患者を特定するなど、様々な臨床応用例に有用であることが示されている。
しかし, 臨床テキストでは, 温度102Fがフェバーを表すなど, 数値的推論が困難である。
現在の最先端の表現型モデルは一般的な表現型を検出することができるが、数値的な推論を必要とする表現型を検出すると性能が低下する。
本稿では,様々な表現型文脈における数値推論のために,外部知識と文脈的単語埋め込みを利用した新しい教師なし手法を提案する。
教師なしベンチマークと比較すると、一般化リコールとf1スコアがそれぞれ79%と71%という、実質的なパフォーマンス改善が見られた。
教師付き設定では、一般化されたリコールとF1のスコアが最大70%と44%の絶対ゲインを持つ代替手法のパフォーマンスを上回ります。
関連論文リスト
- Deep State-Space Generative Model For Correlated Time-to-Event Predictions [54.3637600983898]
そこで本研究では,様々な種類の臨床イベント間の相互作用を捉えるために,潜伏状態空間生成モデルを提案する。
また,死亡率と臓器不全の関連性について有意な知見が得られた。
論文 参考訳(メタデータ) (2024-07-28T02:42:36Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - An evaluation of GPT models for phenotype concept recognition [0.4715973318447338]
臨床表現型および表現型アノテーションのためのGPT(Generative Pre-trained Transformer)モデルの性能について検討した。
その結果、適切な設定で、これらのモデルが芸術的パフォーマンスの状態を達成できることが示されている。
論文 参考訳(メタデータ) (2023-09-29T12:06:55Z) - T-Phenotype: Discovering Phenotypes of Predictive Temporal Patterns in
Disease Progression [82.85825388788567]
我々は、ラベル付き時系列データから予測時相パターンの表現型を発見するために、新しい時間的クラスタリング手法T-Phenotypeを開発した。
T-フェノタイプは, 評価ベースラインのすべてに対して, 最良の表現型発見性能を示す。
論文 参考訳(メタデータ) (2023-02-24T13:30:35Z) - A cost-based multi-layer network approach for the discovery of patient
phenotypes [2.816539638885011]
コミュニティ検出手法を用いて表現型を検出するためのコストベース層セレクタモデルを提案する。
私たちのゴールは、その品質を維持しながら、これらの表現型を構築するのに使用される機能の数を最小化することです。
いくつかの後処理変数では、COBALTの表現型を特徴とする予測子は、従来のクラスタリング法で検出された表現型よりも優れていた。
論文 参考訳(メタデータ) (2022-09-19T14:07:10Z) - Unsupervised EHR-based Phenotyping via Matrix and Tensor Decompositions [0.6875312133832078]
本稿では,低ランク近似に基づく計算表現法について概観する。
近年,様々な制約を組み込んだ低ランクデータ近似手法が開発され,解釈可能性の向上が図られている。
論文 参考訳(メタデータ) (2022-09-01T09:47:27Z) - Cross-Lingual Knowledge Transfer for Clinical Phenotyping [55.92262310716537]
本稿では,英語を使わないクリニックに対して,このタスクを実行するための言語間知識伝達戦略について検討する。
ギリシャ語とスペイン語のクリニックに対して,異なる臨床領域のクリニカルノートを活用して,これらの戦略を評価する。
以上の結果から,多言語データを用いることで,臨床表現型モデルが改善され,データの疎度を補うことが可能であることが示唆された。
論文 参考訳(メタデータ) (2022-08-03T08:33:21Z) - Assessment of contextualised representations in detecting outcome
phrases in clinical trials [14.584741378279316]
本稿では,300 PubMed の要約を専門的に注釈付けしたデータセット "EBM-COMET" を紹介する。
結果の抽出には,事前学習した文脈表現を微調整する。
ベストモデル(BioBERT)は81.5%のF1、81.3%の感度、98.0%の特異性を達成している。
論文 参考訳(メタデータ) (2022-02-13T15:08:00Z) - Clinical Utility of the Automatic Phenotype Annotation in Unstructured
Clinical Notes: ICU Use Cases [11.22817749252584]
本研究は,集中治療室における結果を予測するための重要な情報を取得する方法として,臨床ノートから表現型の自動アノテーションを提案する。
In-hospital death,physiological decompensation and length of stay in the ICU set。
論文 参考訳(メタデータ) (2021-07-24T17:55:55Z) - Bayesian prognostic covariate adjustment [59.75318183140857]
疾患の結果に関する歴史的データは、様々な方法で臨床試験の分析に組み込むことができる。
我々は, 予測モデルからの予後スコアを用いて, 治療効果推定の効率を向上する既存の文献に基づいて構築する。
論文 参考訳(メタデータ) (2020-12-24T05:19:03Z) - Tracking disease outbreaks from sparse data with Bayesian inference [55.82986443159948]
新型コロナウイルス(COVID-19)のパンデミックは、感染発生時の感染率を推定する新たな動機を与える。
標準的な手法は、より細かいスケールで共通する部分的な観測可能性とスパースなデータに対応するのに苦労する。
原理的に部分観測可能なベイズ的枠組みを提案する。
論文 参考訳(メタデータ) (2020-09-12T20:37:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。