論文の概要: An artificial intelligence framework for end-to-end rare disease phenotyping from clinical notes using large language models
- arxiv url: http://arxiv.org/abs/2602.20324v1
- Date: Mon, 23 Feb 2026 20:20:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-25 17:34:53.514554
- Title: An artificial intelligence framework for end-to-end rare disease phenotyping from clinical notes using large language models
- Title(参考訳): 大規模言語モデルを用いた臨床ノートからのエンド・ツー・エンドレア疾患表現のための人工知能フレームワーク
- Authors: Cathy Shyr, Yan Hu, Rory J. Tinker, Thomas A. Cassini, Kevin W. Byram, Rizwan Hamid, Daniel V. Fabbri, Adam Wright, Josh F. Peterson, Lisa Bastarache, Hua Xu,
- Abstract要約: RARE-PHENIXは、まれな疾患表現のためのエンドツーエンドのAIフレームワークである。
大規模な言語モデルに基づく表現型抽出、ヒトフェノタイプオントロジーの標準化、診断に有用な表現型ランキングの監督などを統合する。
最先端のディープラーニングベースライン(PhenoBERT)をオントロジーに基づく類似性と、エンドツーエンド評価における精度-リコール-F1メトリクスで一貫して上回った。
- 参考スコア(独自算出の注目度): 19.80670818473776
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Phenotyping is fundamental to rare disease diagnosis, but manual curation of structured phenotypes from clinical notes is labor-intensive and difficult to scale. Existing artificial intelligence approaches typically optimize individual components of phenotyping but do not operationalize the full clinical workflow of extracting features from clinical text, standardizing them to Human Phenotype Ontology (HPO) terms, and prioritizing diagnostically informative HPO terms. We developed RARE-PHENIX, an end-to-end AI framework for rare disease phenotyping that integrates large language model-based phenotype extraction, ontology-grounded standardization to HPO terms, and supervised ranking of diagnostically informative phenotypes. We trained RARE-PHENIX using data from 2,671 patients across 11 Undiagnosed Diseases Network clinical sites, and externally validated it on 16,357 real-world clinical notes from Vanderbilt University Medical Center. Using clinician-curated HPO terms as the gold standard, RARE-PHENIX consistently outperformed a state-of-the-art deep learning baseline (PhenoBERT) across ontology-based similarity and precision-recall-F1 metrics in end-to-end evaluation (i.e., ontology-based similarity of 0.70 vs. 0.58). Ablation analyses demonstrated performance improvements with the addition of each module in RARE-PHENIX (extraction, standardization, and prioritization), supporting the value of modeling the full clinical phenotyping workflow. By modeling phenotyping as a clinically aligned workflow rather than a single extraction task, RARE-PHENIX provides structured, ranked phenotypes that are more concordant with clinician curation and has the potential to support human-in-the-loop rare disease diagnosis in real-world settings.
- Abstract(参考訳): Phenotypingは稀な疾患診断の基本であるが、臨床ノートから構造化された表現型を手作業でキュレーションすることは、労働集約的で、スケールが困難である。
既存の人工知能アプローチは、通常、表現型の個々のコンポーネントを最適化するが、臨床テキストから特徴を抽出し、それらをHuman Phenotype Ontology(HPO)用語に標準化し、診断的に有益なHPO用語を優先する完全な臨床ワークフローを運用しない。
我々は,大規模な言語モデルに基づく表現型抽出とHPO用語へのオントロジー的標準化を統合し,診断に有用な表現型ランキングを監督する,希少な疾患表現型検索のためのエンドツーエンドAIフレームワークであるRARE-PHENIXを開発した。
当科におけるRARE-PHENIX(RARE-PHENIX)は,11の未診断疾患ネットワーク(undiagnosed Diseases Network)クリニカルサイトから2,671人のデータを用いて訓練し,ヴァンダービルト大学医療センターから16,357件の実際の臨床ノートに外部から検証した。
RARE-PHENIXは、臨床計算されたHPO用語を金の標準として、オントロジーに基づく類似度と高精度リコール-F1メトリクス(オントロジーに基づく類似度0.70対0.58)で、最先端のディープラーニングベースライン(PhenoBERT)を一貫して上回った。
その結果,RARE-PHENIX (Extract, Standardization, Prioritization) における各モジュールの追加による性能改善が得られた。
RARE-PHENIXは、単一の抽出タスクではなく、臨床的に整合したワークフローとして表現型をモデル化することにより、臨床キュレーションとより一致し、現実世界の環境でヒト・イン・ザ・ループのレアな疾患診断をサポートする可能性がある構造化された、ランク付けされた表現型を提供する。
関連論文リスト
- PhenoLIP: Integrating Phenotype Ontology Knowledge into Medical Vision-Language Pretraining [71.60950593762719]
PhenoLIPは、構造化表現型知識を医療画像理解に組み込む新しい事前学習フレームワークである。
PhenoLIPは、医学画像理解における最先端のアプローチよりも優れている。
論文 参考訳(メタデータ) (2026-02-05T20:44:07Z) - A Disease-Centric Vision-Language Foundation Model for Precision Oncology in Kidney Cancer [54.58205672910646]
RenalCLIPは、腎腫瘤の特徴、診断、予後のための視覚言語基盤モデルである。
腎がんの完全な臨床ワークフローにまたがる10のコアタスクにおいて、優れたパフォーマンスと優れた一般化性を実現した。
論文 参考訳(メタデータ) (2025-08-22T17:48:19Z) - Counterfactual Probabilistic Diffusion with Expert Models [44.96279296893773]
本稿では,不完全な専門家モデルからのガイダンスを取り入れた時系列拡散に基づくフレームワークを提案する。
我々の方法であるODE-Diffは、機械的およびデータ駆動的なアプローチをブリッジし、より信頼性が高く解釈可能な因果推論を可能にする。
論文 参考訳(メタデータ) (2025-08-18T20:44:32Z) - Prototype Learning to Create Refined Interpretable Digital Phenotypes from ECGs [0.6488018816675728]
プロトタイプベースのニューラルネットワークは、トレーニングデータに固定された学習された代表的な信号パターンと入力を比較して解釈可能な予測を提供する。
PTB-XLデータセットを用いた多ラベルECG分類のためのプロトタイプベースディープラーニングモデルを用いる。
分類専用に訓練された個別の試作機がフェーコード形式での退院診断に関連があるかどうかを評価する。
論文 参考訳(メタデータ) (2025-08-02T23:52:08Z) - Self-Explaining Hypergraph Neural Networks for Diagnosis Prediction [45.89562183034469]
既存のディープラーニング診断予測モデルと本質的な解釈性は、過去の診断や病院訪問の度に注意重みを割り当てることが多い。
我々は、パーソナライズされた簡潔で忠実な説明を提供するように設計された、自己説明型ハイパーグラフニューラルネットワークモデルSHyを紹介する。
SHyは高次疾患の相互作用を捉え、パーソナライズされた説明として異なる時間的表現型を抽出する。
論文 参考訳(メタデータ) (2025-02-15T06:33:02Z) - An evaluation of GPT models for phenotype concept recognition [0.4715973318447338]
臨床表現型および表現型アノテーションのためのGPT(Generative Pre-trained Transformer)モデルの性能について検討した。
その結果、適切な設定で、これらのモデルが芸術的パフォーマンスの状態を達成できることが示されている。
論文 参考訳(メタデータ) (2023-09-29T12:06:55Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - sEHR-CE: Language modelling of structured EHR data for efficient and
generalizable patient cohort expansion [0.0]
sEHR-CEは、異種臨床データセットの統合表現型化と分析を可能にするトランスフォーマーに基づく新しいフレームワークである。
大規模研究である英国バイオバンクのプライマリ・セカンダリ・ケアデータを用いてアプローチを検証する。
論文 参考訳(メタデータ) (2022-11-30T16:00:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。