論文の概要: Automating Early Disease Prediction Via Structured and Unstructured Clinical Data
- arxiv url: http://arxiv.org/abs/2603.28167v1
- Date: Mon, 30 Mar 2026 08:36:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.30715
- Title: Automating Early Disease Prediction Via Structured and Unstructured Clinical Data
- Title(参考訳): 構造的および非構造的臨床データによる早期疾患予測の自動化
- Authors: Ane G Domingo-Aldama, Marcos Merino Prado, Alain García Olea, Josu Goikoetxea, Koldo Gojenola, Aitziber Atutxa,
- Abstract要約: 提案したパイプラインは、早期予測の3つの主要なステップであるコホート選択、データセット生成、結果ラベリングをサポートするために、放電レポートを使用する。
本手法を心房細動(AF)の進行予測の文脈で評価し, 放電報告情報に富んだデータセットでトレーニングした予測モデルにより, 真の結果との相関性が高くなることを示す。
これらの結果は、構造化されていない臨床テキストの統合を自動化することにより、早期予測研究を効率化し、データ品質を改善し、臨床意思決定のための予測モデルの信頼性を高めることができることを示している。
- 参考スコア(独自算出の注目度): 0.20524609401792396
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This study presents a fully automated methodology for early prediction studies in clinical settings, leveraging information extracted from unstructured discharge reports. The proposed pipeline uses discharge reports to support the three main steps of early prediction: cohort selection, dataset generation, and outcome labeling. By processing discharge reports with natural language processing techniques, we can efficiently identify relevant patient cohorts, enrich structured datasets with additional clinical variables, and generate high-quality labels without manual intervention. This approach addresses the frequent issue of missing or incomplete data in codified electronic health records (EHR), capturing clinically relevant information that is often underrepresented. We evaluate the methodology in the context of predicting atrial fibrillation (AF) progression, showing that predictive models trained on datasets enriched with discharge report information achieve higher accuracy and correlation with true outcomes compared to models trained solely on structured EHR data, while also surpassing traditional clinical scores. These results demonstrate that automating the integration of unstructured clinical text can streamline early prediction studies, improve data quality, and enhance the reliability of predictive models for clinical decision-making.
- Abstract(参考訳): 本研究では,非構造的退院報告から抽出した情報を活用し,臨床現場における早期予測研究の完全自動化手法を提案する。
提案したパイプラインは、早期予測の3つの主要なステップであるコホート選択、データセット生成、結果ラベリングをサポートするために、放電レポートを使用する。
自然言語処理技術を用いて退院報告を処理することにより、関連患者コホートを効率的に識別し、追加の臨床変数を持つ構造化データセットを豊かにし、手作業による介入なしに高品質なラベルを生成することができる。
このアプローチは、符号化された電子健康記録(EHR)における欠落または不完全データの頻繁な問題に対処し、しばしば表現されていない臨床関連情報をキャプチャする。
本研究では, 心房細動(AF)進行の予測の文脈において, 放電報告情報に富んだデータセットでトレーニングした予測モデルが, 従来の臨床成績を上回りながら, 構造化ERHデータにのみトレーニングしたモデルと比較して, 精度と真の結果との相関性が高いことを示す。
これらの結果は、構造化されていない臨床テキストの統合を自動化することにより、早期予測研究を効率化し、データ品質を改善し、臨床意思決定のための予測モデルの信頼性を高めることができることを示している。
関連論文リスト
- From Generative Modeling to Clinical Classification: A GPT-Based Architecture for EHR Notes [0.0]
本研究は臨床テキスト分類のためのGPTアーキテクチャを提案する。
すべてのモデルパラメータを更新する代わりに、GPT-2のバックボーンの大部分は凍結されている。
提案手法はMIMIC-IV-Noteデータセットからの放射線学報告に基づいて評価する。
論文 参考訳(メタデータ) (2026-01-29T16:33:47Z) - Enhancing mortality prediction in cardiac arrest ICU patients through meta-modeling of structured clinical data from MIMIC-IV [0.0]
本研究では、構造化された臨床データと構造化されていない情報を統合する機械学習モデルを開発し、評価する。
機能選択にはLASSOとXGBoostを使用しました。
構造化データとテキスト入力を組み合わせた最終ロジスティック回帰モデルは、構造化データのみを使用する場合の0.753に対して、0.918のAUCを達成したが、相対的な改善は22%であった。
論文 参考訳(メタデータ) (2025-10-20T20:56:45Z) - Paging Dr. GPT: Extracting Information from Clinical Notes to Enhance Patient Predictions [0.25165775267615204]
GPT-4o-mini (ChatGPT) による患者に対する簡単な臨床質問に対する回答が患者レベルの死亡予測にどう役立つかを検討する。
MIMIC-IV Noteデータセットにおける14,011件の初診データや心血管集中治療ユニットのデータを用いて,GPT応答をロジスティック回帰モデルにおける入力特徴として用いた透明なフレームワークを実装した。
論文 参考訳(メタデータ) (2025-04-14T17:41:45Z) - Patient Trajectory Prediction: Integrating Clinical Notes with Transformers [0.0]
本稿では,非構造的臨床ノートをトランスフォーマーベース深層学習モデルに統合し,シーケンシャルな疾患予測を行うアプローチを提案する。
MIMIC-IVデータセットの実験は、提案手法が構造化データのみに依存する従来のモデルよりも優れていることを示した。
論文 参考訳(メタデータ) (2025-02-25T09:14:07Z) - Knowledge Graph Representations to enhance Intensive Care Time-Series
Predictions [4.660203987415476]
提案手法は,ICUデータと医療知識を統合し,臨床意思決定モデルを改善する。
グラフ表現とバイタルサインと臨床報告を組み合わせることで、パフォーマンスを向上させる。
我々のモデルには、知識グラフノードが予測にどのように影響するかを理解するための解釈可能性コンポーネントが含まれています。
論文 参考訳(メタデータ) (2023-11-13T09:11:55Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Textual Data Augmentation for Patient Outcomes Prediction [67.72545656557858]
本稿では,患者の電子カルテに人工的な臨床ノートを作成するための新しいデータ拡張手法を提案する。
生成言語モデルGPT-2を微調整し、ラベル付きテキストを元のトレーニングデータで合成する。
今回,最も多い患者,すなわち30日間の寛解率について検討した。
論文 参考訳(メタデータ) (2022-11-13T01:07:23Z) - Unsupervised pre-training of graph transformers on patient population
graphs [48.02011627390706]
異種臨床データを扱うグラフ変換器を用いたネットワークを提案する。
自己教師型, 移動学習環境において, 事前学習方式の利点を示す。
論文 参考訳(メタデータ) (2022-07-21T16:59:09Z) - Clinical Outcome Prediction from Admission Notes using Self-Supervised
Knowledge Integration [55.88616573143478]
臨床テキストからのアウトカム予測は、医師が潜在的なリスクを見落としないようにする。
退院時の診断,手術手順,院内死亡率,長期予測は4つの一般的な結果予測対象である。
複数の公開資料から得られた患者結果に関する知識を統合するために,臨床結果の事前学習を提案する。
論文 参考訳(メタデータ) (2021-02-08T10:26:44Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。