論文の概要: LLM-MINE: Large Language Model based Alzheimer's Disease and Related Dementias Phenotypes Mining from Clinical Notes
- arxiv url: http://arxiv.org/abs/2603.13673v1
- Date: Sat, 14 Mar 2026 00:45:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:35.332798
- Title: LLM-MINE: Large Language Model based Alzheimer's Disease and Related Dementias Phenotypes Mining from Clinical Notes
- Title(参考訳): LLM-MINE:大規模言語モデルに基づくアルツハイマー病と認知症関連現象
- Authors: Mingchen Shao, Yuzhang Xie, Carl Yang, Jiaying Lu,
- Abstract要約: 本稿では,アルツハイマー病および認知症関連表現型の自動抽出のための大規模言語モデルに基づく表現型マイニングフレームワークを提案する。
専門家が定義した2つの表現型リストを用いて,コホート間の統計的意義と,教師なし疾患のステージングに対する有用性を検討することにより,抽出した表現型を評価する。
LLMをベースとした表現型抽出は,非構造化音符から臨床的に有意なADRD信号を検出する上で有望なツールであることを示す。
- 参考スコア(独自算出の注目度): 13.189180222247337
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate extraction of Alzheimer's Disease and Related Dementias (ADRD) phenotypes from electronic health records (EHR) is critical for early-stage detection and disease staging. However, this information is usually embedded in unstructured textual data rather than tabular data, making it difficult to be extracted accurately. We therefore propose LLM-MINE, a Large Language Model-based phenotype mining framework for automatic extraction of ADRD phenotypes from clinical notes. Using two expert-defined phenotype lists, we evaluate the extracted phenotypes by examining their statistical significance across cohorts and their utility for unsupervised disease staging. Chi-square analyses confirm statistically significant phenotype differences across cohorts, with memory impairment being the strongest discriminator. Few-shot prompting with the combined phenotype lists achieves the best clustering performance (ARI=0.290, NMI=0.232), substantially outperforming biomedical NER and dictionary-based baselines. Our results demonstrate that LLM-based phenotype extraction is a promising tool for discovering clinically meaningful ADRD signals from unstructured notes.
- Abstract(参考訳): EHR(Electronic Health Record)からのアルツハイマー病および関連認知症(ADRD)の正確な抽出は、早期発見と疾患のステージングに不可欠である。
しかし、この情報は表データではなく非構造化のテキストデータに埋め込まれるのが一般的であり、正確に抽出することは困難である。
そこで我々は,ADRD表現型の自動抽出のための大規模言語モデルに基づく表現型マイニングフレームワーク LLM-MINE を提案する。
専門家が定義した2つの表現型リストを用いて,コホート間の統計的意義と,教師なし疾患のステージングに対する有用性を検討することにより,抽出した表現型を評価する。
チ二乗分析によりコホート間での統計的に有意な表現型差が確認され、記憶障害が最も強い判別因子である。
ARI=0.290, NMI=0.232, バイオメディカルNER, 辞書ベースラインを著しく上回っている。
LLMをベースとした表現型抽出は,非構造化音符から臨床的に有意なADRD信号を検出する上で有望なツールであることを示す。
関連論文リスト
- A Weakly Supervised Transformer for Rare Disease Diagnosis and Subphenotyping from EHRs with Pulmonary Case Studies [28.253741893497136]
WEST(Wakly Supervised Transformer for rare disease phenotyping and subphenotyping from EHRs)を提案する。
ボストン小児病院のEHRデータを用いて2つの稀な肺疾患についてWESTを評価し, 表現型分類, 臨床的に有意な亜フェノタイプ同定, 疾患進行の予測において, 既存の方法よりも優れていることを示した。
論文 参考訳(メタデータ) (2025-07-01T23:11:20Z) - Explainable Biomedical Hypothesis Generation via Retrieval Augmented Generation enabled Large Language Models [46.05020842978823]
大規模言語モデル(LLM)はこの複雑なデータランドスケープをナビゲートする強力なツールとして登場した。
RAGGEDは、知識統合と仮説生成を伴う研究者を支援するために設計された包括的なワークフローである。
論文 参考訳(メタデータ) (2024-07-17T07:44:18Z) - SemioLLM: Evaluating Large Language Models for Diagnostic Reasoning from Unstructured Clinical Narratives in Epilepsy [45.2233252981348]
臨床知識を符号化するための言語モデル(LLM)が示されている。
6つの最先端モデルをベンチマークする評価フレームワークであるSemioLLMを提案する。
ほとんどのLSMは、脳内の発作発生領域の確率的予測を正確かつ確実に生成できることを示す。
論文 参考訳(メタデータ) (2024-07-03T11:02:12Z) - A Hybrid Framework with Large Language Models for Rare Disease Phenotyping [4.550497164299771]
希少な疾患は、その頻度が低く、異質な臨床的プレゼンテーションのため、診断と治療において重大な課題となる。
本研究では,辞書ベースの自然言語処理(NLP)ツールと大規模言語モデル(LLM)を組み合わせたハイブリッドアプローチを開発することを目的とする。
本稿では,Orphanet Rare Disease Ontology (ORDO) とUnified Medical Language System (UMLS) を統合した新たなハイブリッドフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-16T20:59:28Z) - Interpretable Medical Diagnostics with Structured Data Extraction by
Large Language Models [59.89454513692417]
タブラルデータはしばしばテキストに隠され、特に医学的診断報告に使用される。
本稿では,TEMED-LLM と呼ばれるテキスト医療報告から構造化表状データを抽出する手法を提案する。
本手法は,医学診断における最先端のテキスト分類モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-08T09:12:28Z) - PheME: A deep ensemble framework for improving phenotype prediction from
multi-modal data [42.56953523499849]
PheMEは, 構造化EHRのマルチモーダルデータを用いたアンサンブル・フレームワークであり, 非構造化臨床ノートを用いて, 正確なフェノタイプ予測を行う。
我々はアンサンブル学習を活用し、単一モーダルモデルと多モーダルモデルからの出力を組み合わせて表現型予測を改善する。
論文 参考訳(メタデータ) (2023-03-19T23:41:04Z) - Unsupervised EHR-based Phenotyping via Matrix and Tensor Decompositions [0.6875312133832078]
本稿では,低ランク近似に基づく計算表現法について概観する。
近年,様々な制約を組み込んだ低ランクデータ近似手法が開発され,解釈可能性の向上が図られている。
論文 参考訳(メタデータ) (2022-09-01T09:47:27Z) - Ontology-Driven and Weakly Supervised Rare Disease Identification from
Clinical Notes [13.096008602034086]
機械学習やドメインの専門家によるデータアノテーションの必要性から、希少な疾患の特定は困難である。
両方向変換器(例えばBERT)からの事前学習した文脈表現を用いた脳と弱い監督手法を提案する。
弱教師付きアプローチは、ドメインの専門家による注釈付きデータなしで、テキスト-UMLSリンクを改善するための確認表現型モデルを学ぶために提案される。
論文 参考訳(メタデータ) (2022-05-11T17:38:24Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。