論文の概要: Patient-level Information Extraction by Consistent Integration of Textual and Tabular Evidence with Bayesian Networks
- arxiv url: http://arxiv.org/abs/2511.17056v1
- Date: Fri, 21 Nov 2025 08:59:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-24 18:08:18.949024
- Title: Patient-level Information Extraction by Consistent Integration of Textual and Tabular Evidence with Bayesian Networks
- Title(参考訳): バイジアンネットワークを用いたテキスト・タブラリ証拠の一貫性統合による患者レベルの情報抽出
- Authors: Paloma Rabaey, Adrick Tench, Stefan Heytens, Thomas Demeester,
- Abstract要約: 本稿では,専門家インフォームドベイズネットワークを用いたマルチモーダル患者レベルの情報抽出手法を提案する。
本稿では,モデルの予測を解釈可能かつ確率的に融合させるために,一貫性ノードを付加した仮想エビデンスを提案する。
提案手法の有効性をSimSUMデータセットに示す。
- 参考スコア(独自算出の注目度): 4.993537302467224
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Electronic health records (EHRs) form an invaluable resource for training clinical decision support systems. To leverage the potential of such systems in high-risk applications, we need large, structured tabular datasets on which we can build transparent feature-based models. While part of the EHR already contains structured information (e.g. diagnosis codes, medications, and lab results), much of the information is contained within unstructured text (e.g. discharge summaries and nursing notes). In this work, we propose a method for multi-modal patient-level information extraction that leverages both the tabular features available in the patient's EHR (using an expert-informed Bayesian network) as well as clinical notes describing the patient's symptoms (using neural text classifiers). We propose the use of virtual evidence augmented with a consistency node to provide an interpretable, probabilistic fusion of the models' predictions. The consistency node improves the calibration of the final predictions compared to virtual evidence alone, allowing the Bayesian network to better adjust the neural classifier's output to handle missing information and resolve contradictions between the tabular and text data. We show the potential of our method on the SimSUM dataset, a simulated benchmark linking tabular EHRs with clinical notes through expert knowledge.
- Abstract(参考訳): 電子健康記録(EHR)は、臨床診断支援システムを訓練するための貴重な資源である。
リスクの高いアプリケーションでそのようなシステムの可能性を活用するには、透過的な機能ベースのモデルを構築するために、大きな構造化された表形式のデータセットが必要です。
EHRには構造化情報(例えば診断コード、薬品、検査結果)がすでに含まれているが、情報の多くは構造化されていないテキスト(例えば、概要と看護ノート)に含まれている。
本研究では,患者のEHR(エキスパートインフォームドベイズネットワーク)と,患者の症状を記述した臨床ノート(ニューラルテキスト分類器)を併用したマルチモーダル患者レベルの情報抽出手法を提案する。
本稿では,モデルの予測を解釈可能かつ確率的に融合させるために,一貫性ノードを付加した仮想エビデンスを提案する。
整合性ノードは、仮想的なエビデンスのみと比較して最終予測の校正を改善するため、ベイジアンネットワークは、欠落した情報を処理し、表とテキストデータの矛盾を解決するために、ニューラルネットワークの分類器の出力をより良く調整することができる。
また,本手法の有意性について,専門知識を通じて表型EMHと臨床メモをリンクするシミュレーションベンチマークであるSimSUMデータセットを用いて検討した。
関連論文リスト
- Interpretable Clinical Classification with Kolgomorov-Arnold Networks [70.72819760172744]
Kolmogorov-Arnold Networks (KAN) は、透明で象徴的な表現を通じて固有の解釈能力を提供する。
Kansは、組み込みの患者レベルの洞察、直感的な可視化、最寄りの患者の検索をサポートする。
これらの結果は、カンを、臨床医が理解し、監査し、行動できる信頼できるAIへの有望なステップと位置づけている。
論文 参考訳(メタデータ) (2025-09-20T17:21:58Z) - SimSUM: Simulated Benchmark with Structured and Unstructured Medical Records [7.5348062792]
SimSUMは、シミュレーションされた1万の患者記録のベンチマークデータセットである。
各記録は、呼吸器疾患の領域における患者の遭遇をシミュレートする。
大規模言語モデルに、遭遇を記述した臨床メモを生成するよう促される。
これらの音符には、スパンレベルの症状が言及されている。
論文 参考訳(メタデータ) (2024-09-13T15:55:15Z) - EMERGE: Enhancing Multimodal Electronic Health Records Predictive Modeling with Retrieval-Augmented Generation [22.94521527609479]
EMERGEはRetrieval-Augmented Generation(RAG)駆動のフレームワークであり、マルチモーダルEHR予測モデリングを強化する。
時系列データと臨床ノートからエンティティを抽出し,LLM(Large Language Models)を誘導し,プロのPrimeKGと整合させる。
抽出した知識は、患者の健康状態のタスク関連サマリーを生成するために使用される。
論文 参考訳(メタデータ) (2024-05-27T10:53:15Z) - Multimodal Fusion of EHR in Structures and Semantics: Integrating Clinical Records and Notes with Hypergraph and LLM [39.25272553560425]
本稿では,EHRにおける構造と意味を効果的に統合するMINGLEという新しいフレームワークを提案する。
本フレームワークでは,医療概念のセマンティクスと臨床ノートのセマンティクスをハイパーグラフニューラルネットワークに組み合わせるために,2段階の注入戦略を採用している。
2つのEHRデータセット(パブリックMIMIC-IIIとプライベートCRADLE)の実験結果から、MINGLEは予測性能を11.83%向上できることが示された。
論文 参考訳(メタデータ) (2024-02-19T23:48:40Z) - Radiology Report Generation Using Transformers Conditioned with
Non-imaging Data [55.17268696112258]
本稿では,胸部X線画像と関連する患者の人口統計情報を統合したマルチモーダルトランスフォーマーネットワークを提案する。
提案ネットワークは、畳み込みニューラルネットワークを用いて、CXRから視覚的特徴を抽出し、その視覚的特徴と患者の人口統計情報のセマンティックテキスト埋め込みを組み合わせたトランスフォーマーベースのエンコーダデコーダネットワークである。
論文 参考訳(メタデータ) (2023-11-18T14:52:26Z) - Interpretable Medical Diagnostics with Structured Data Extraction by
Large Language Models [59.89454513692417]
タブラルデータはしばしばテキストに隠され、特に医学的診断報告に使用される。
本稿では,TEMED-LLM と呼ばれるテキスト医療報告から構造化表状データを抽出する手法を提案する。
本手法は,医学診断における最先端のテキスト分類モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-08T09:12:28Z) - Informing clinical assessment by contextualizing post-hoc explanations
of risk prediction models in type-2 diabetes [50.8044927215346]
本研究は, 合併症リスク予測のシナリオを考察し, 患者の臨床状態に関する文脈に焦点を当てる。
我々は、リスク予測モデル推論に関する文脈を提示し、その受容性を評価するために、最先端のLLMをいくつか採用する。
本論文は,実世界における臨床症例における文脈説明の有効性と有用性を明らかにする最初のエンドツーエンド分析の1つである。
論文 参考訳(メタデータ) (2023-02-11T18:07:11Z) - Unifying Heterogenous Electronic Health Records Systems via Text-Based
Code Embedding [7.3394352452936085]
本稿では,コードに依存しない記述に基づく表現学習フレームワークであるDescEmbを紹介した。
予測タスクや伝達学習,プール学習など,さまざまな実験において,モデルの性能を検証した。
論文 参考訳(メタデータ) (2021-08-08T12:47:42Z) - Deep Co-Attention Network for Multi-View Subspace Learning [73.3450258002607]
マルチビューサブスペース学習のための深層コアテンションネットワークを提案する。
共通情報と相補情報の両方を敵意で抽出することを目的としている。
特に、新しいクロス再構成損失を使用し、ラベル情報を利用して潜在表現の構築を誘導する。
論文 参考訳(メタデータ) (2021-02-15T18:46:44Z) - DeepEnroll: Patient-Trial Matching with Deep Embedding and Entailment
Prediction [67.91606509226132]
臨床試験は医薬品開発に不可欠であるが、高価で不正確で不十分な患者募集に苦しむことが多い。
DeepEnrollは、入力基準(タブラリデータ)を一致する推論のための共有潜在空間に共同でエンコードする、クロスモーダル推論学習モデルである。
論文 参考訳(メタデータ) (2020-01-22T17:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。