論文の概要: Structured Extraction of Real World Medical Knowledge using LLMs for Summarization and Search
- arxiv url: http://arxiv.org/abs/2412.15256v1
- Date: Mon, 16 Dec 2024 02:57:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-23 16:24:50.263277
- Title: Structured Extraction of Real World Medical Knowledge using LLMs for Summarization and Search
- Title(参考訳): 要約検索のためのLLMを用いた実世界の医用知識の構造抽出
- Authors: Edward Kim, Manil Shrestha, Richard Foty, Tom DeLay, Vicki Seyfert-Margolis,
- Abstract要約: 大規模モデル抽出手法を用いて患者知識グラフを作成することを提案する。
提案手法は,既存の階層(SHMe,SNOMED-CT RxNORM,HPO)から抽出されたエンティティにマップする。
患者固有の知識グラフの構築と症状に基づく患者検索について述べる。
- 参考スコア(独自算出の注目度): 1.3453658538563749
- License:
- Abstract: Creation and curation of knowledge graphs can accelerate disease discovery and analysis in real-world data. While disease ontologies aid in biological data annotation, codified categories (SNOMED-CT, ICD10, CPT) may not capture patient condition nuances or rare diseases. Multiple disease definitions across data sources complicate ontology mapping and disease clustering. We propose creating patient knowledge graphs using large language model extraction techniques, allowing data extraction via natural language rather than rigid ontological hierarchies. Our method maps to existing ontologies (MeSH, SNOMED-CT, RxNORM, HPO) to ground extracted entities. Using a large ambulatory care EHR database with 33.6M patients, we demonstrate our method through the patient search for Dravet syndrome, which received ICD10 recognition in October 2020. We describe our construction of patient-specific knowledge graphs and symptom-based patient searches. Using confirmed Dravet syndrome ICD10 codes as ground truth, we employ LLM-based entity extraction to characterize patients in grounded ontologies. We then apply this method to identify Beta-propeller protein-associated neurodegeneration (BPAN) patients, demonstrating real-world discovery where no ground truth exists.
- Abstract(参考訳): 知識グラフの作成とキュレーションは、現実世界のデータにおける病気の発見と分析を加速させる。
病気オントロジーは生物学的データアノテーションを補助するが、コード化されたカテゴリー(SNOMED-CT, ICD10, CPT)は患者の病状や稀な疾患を捉えない。
データソース間の複数の疾患定義は、オントロジーマッピングと疾患クラスタリングを複雑にする。
本研究では,大規模言語モデル抽出手法を用いて患者知識グラフを作成することを提案する。
提案手法は,既存のオントロジー(MeSH,SNOMED-CT,RxNORM,HPO)を抽出対象にマッピングする。
2020年10月にICD10を承認されたDravet症候群の患者検索を通じて,336万の患者を対象とする大規模な救急EHRデータベースを用いて,本手法を実証した。
患者固有の知識グラフの構築と症状に基づく患者検索について述べる。
確定したDravet 症候群 ICD10 符号を根拠として,LLM をベースとした実体抽出法を用いて,接地オントロジーの患者を特徴付ける。
次に,β-proeller protein-associated neurodegeneration (BPAN) 患者を同定し,基礎的真実が存在しない実世界の発見を実証する。
関連論文リスト
- Inpainting Pathology in Lumbar Spine MRI with Latent Diffusion [4.410798232767917]
病理組織学的特徴をMRIで健全な解剖学的特徴に塗布する効率的な方法を提案する。
腰椎椎間板ヘルニアと中心管狭窄に対し,T2 MRIにて椎間板ヘルニアを挿入する能力について検討した。
論文 参考訳(メタデータ) (2024-06-04T16:47:47Z) - A Survey of Artificial Intelligence in Gait-Based Neurodegenerative Disease Diagnosis [51.07114445705692]
神経変性疾患(神経変性疾患、ND)は、伝統的に医学的診断とモニタリングのために広範囲の医療資源と人的努力を必要とする。
重要な疾患関連運動症状として、ヒトの歩行を利用して異なるNDを特徴づけることができる。
人工知能(AI)モデルの現在の進歩は、NDの識別と分類のための自動歩行分析を可能にする。
論文 参考訳(メタデータ) (2024-05-21T06:44:40Z) - README: Bridging Medical Jargon and Lay Understanding for Patient Education through Data-Centric NLP [9.432205523734707]
医療用語を患者に親しみやすい平易な言語に簡略化することを目的とした,レイ定義の自動生成という新たなタスクを導入する。
このデータセットは、5万以上のユニークな(医療用語、日常の定義)ペアと30万の言及からなる。
また、データフィルタリング、拡張、選択を相乗化してデータ品質を改善する、データ中心のHuman-AIパイプラインも開発しました。
論文 参考訳(メタデータ) (2023-12-24T23:01:00Z) - Data and Knowledge Co-driving for Cancer Subtype Classification on
Multi-Scale Histopathological Slides [4.22412600279685]
病理学者のような組織学的スライド上で癌サブタイプ分類の過程を再現するデータ・知識共同運転(D&K)モデルを提案する。
具体的には、データ駆動モジュールにおいて、アンサンブル学習におけるバッグング機構を利用して、埋め込み表現ユニットによって抽出された様々なバッグの組織学的特徴を統合する。
論文 参考訳(メタデータ) (2023-04-18T21:57:37Z) - Multi-confound regression adversarial network for deep learning-based
diagnosis on highly heterogenous clinical data [1.2891210250935143]
我々は、高度に異種な臨床データに基づいてディープラーニングモデルを訓練するための新しいディープラーニングアーキテクチャ、MUCRANを開発した。
われわれは、2019年以前にマサチューセッツ総合病院から収集した16,821個の臨床T1軸性脳MRIを用いてMUCRANを訓練した。
このモデルでは,新たに収集したデータに対して90%以上の精度で頑健な性能を示した。
論文 参考訳(メタデータ) (2022-05-05T18:39:09Z) - Variational Knowledge Distillation for Disease Classification in Chest
X-Rays [102.04931207504173]
我々は,X線に基づく疾患分類のための新しい確率的推論フレームワークである反復的知識蒸留(VKD)を提案する。
提案手法の有効性を,X線画像とEHRを用いた3つの公開ベンチマークデータセットに示す。
論文 参考訳(メタデータ) (2021-03-19T14:13:56Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z) - Interpretation of Disease Evidence for Medical Images Using Adversarial
Deformation Fields [4.2739669051600275]
本稿では,病状証拠の空間的説明を定式化し提示する手法を提案する。
逆行訓練されたジェネレータは、疾患患者の画像を変更する変形場を生成し、健康な患者の画像に類似させる。
慢性閉塞性肺疾患(COPD)の胸部X線(CXR)およびアルツハイマー病(AD)の脳MRI所見について検討した。
論文 参考訳(メタデータ) (2020-07-04T00:51:54Z) - Finding Patient Zero: Learning Contagion Source with Graph Neural
Networks [67.3415507211942]
感染源の特定は、感染の感染経路に関する重要な洞察を与えることができる。
既存の方法はグラフ理論測度と高価なメッセージパッシングアルゴリズムを用いる。
グラフニューラルネットワーク(GNN)を用いてP0を学習し,この問題を再考する。
論文 参考訳(メタデータ) (2020-06-21T21:12:44Z) - Learning Dynamic and Personalized Comorbidity Networks from Event Data
using Deep Diffusion Processes [102.02672176520382]
コンコルビンド病は、個人によって異なる複雑な時間的パターンを通じて発生し進行する。
電子的な健康記録では、患者が持つ異なる疾患を観察できるが、それぞれの共死状態の時間的関係を推測できるだけである。
我々は「ダイナミック・コオービディティ・ネットワーク」をモデル化するための深層拡散プロセスを開発する。
論文 参考訳(メタデータ) (2020-01-08T15:47:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。