論文の概要: Predicting first-episode homelessness among US Veterans using longitudinal EHR data: time-varying models and social risk factors
- arxiv url: http://arxiv.org/abs/2602.02731v1
- Date: Mon, 02 Feb 2026 19:46:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.04656
- Title: Predicting first-episode homelessness among US Veterans using longitudinal EHR data: time-varying models and social risk factors
- Title(参考訳): 縦断的EHRデータを用いた米国退役軍人の第一段階ホームレスの予測--時間変化モデルと社会的リスク要因
- Authors: Rohan Pandey, Haijuan Yan, Hong Yu, Jack Tsai,
- Abstract要約: 276,403人の獣医師のデータを分析し、2017年3~12カ月後に発生した最初期のホームレスを予測した。
縦型モデルに社会的要因と行動的要因を取り入れたことにより,曲線下(PR-AUC)の精度が15~30%向上した。
これらの結果から,縦断的かつ社会的にインフォームドされたEHRモデリングは,ホームレスのリスクを行動可能な層に集中させ,リスクの高いベテランに対する標的的・データインフォームド予防戦略を可能にすることが示唆された。
- 参考スコア(独自算出の注目度): 4.832969778918575
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Homelessness among US veterans remains a critical public health challenge, yet risk prediction offers a pathway for proactive intervention. In this retrospective prognostic study, we analyzed electronic health record (EHR) data from 4,276,403 Veterans Affairs patients during a 2016 observation period to predict first-episode homelessness occurring 3-12 months later in 2017 (prevalence: 0.32-1.19%). We constructed static and time-varying EHR representations, utilizing clinician-informed logic to model the persistence of clinical conditions and social risks over time. We then compared the performance of classical machine learning, transformer-based masked language models, and fine-tuned large language models (LLMs). We demonstrate that incorporating social and behavioral factors into longitudinal models improved precision-recall area under the curve (PR-AUC) by 15-30%. In the top 1% risk tier, models yielded positive predictive values ranging from 3.93-4.72% at 3 months, 7.39-8.30% at 6 months, 9.84-11.41% at 9 months, and 11.65-13.80% at 12 months across model architectures. Large language models underperformed encoder-based models on discrimination but showed smaller performance disparities across racial groups. These results demonstrate that longitudinal, socially informed EHR modeling concentrates homelessness risk into actionable strata, enabling targeted and data-informed prevention strategies for at-risk veterans.
- Abstract(参考訳): 米国の退役軍人のホームレスは依然として公衆衛生上の重要な課題だが、リスク予測は積極的な介入の道筋を提供する。
この振り返り予後調査では、2016年観察期間中に4,276,403人の獣医師の電子健康記録(EHR)データを分析し、2017年3~12カ月後に発生した第1段階のホームレスを予測した(頻度:0.32-1.19%)。
臨床症状の持続性や社会的リスクを時間とともにモデル化するために,臨床応用論理を用いて静的かつ時間的に変化するERH表現を構築した。
次に、従来の機械学習、トランスフォーマーベースのマスキング言語モデル、および微調整された大規模言語モデル(LLM)の性能を比較した。
縦型モデルに社会的・行動的要因を組み込むことで,曲線下(PR-AUC)の精度が15~30%向上することが実証された。
最上位1%のリスク層では、3ヶ月で3.93-4.72%、6ヶ月で7.39-8.30%、9ヶ月で9.84-11.41%、モデルアーキテクチャで12ヶ月で11.65-13.80%という正の予測値を得た。
大規模な言語モデルは、差別に関するエンコーダベースのモデルよりも性能が低いが、人種間のパフォーマンス格差は小さい。
これらの結果から,縦断的かつ社会的にインフォームドされたEHRモデリングは,ホームレスのリスクを行動可能な層に集中させ,リスクの高いベテランに対するターゲットおよびデータインフォームド予防戦略を可能にすることが示唆された。
関連論文リスト
- Early predicting of hospital admission using machine learning algorithms: Priority queues approach [0.1957338076370071]
救急署の混雑は患者の安全と作業効率を損なう重要な問題である。
本研究では,季節自動回帰統合移動平均とeXogenous Regressors(SARIMAX),Extreme Gradient Boosting(XGBoost),Long Short-Term Memory(LSTM)の3つの予測モデルを評価し,比較する。
XGBoostは平均絶対誤差が6.63であり、統計SARIMAXモデルでは3.77である大合併症の予測に優れていた。
論文 参考訳(メタデータ) (2026-01-21T21:31:16Z) - HARBOR: Holistic Adaptive Risk assessment model for BehaviORal healthcare [4.268975608471992]
本稿では,個別の気分とリスクスコアを予測するための行動型健康意識言語モデルであるHARBORを紹介する。
PEARLは,3症例の4年間の月次観察を対象とする縦断的行動医療データセットである。
論文 参考訳(メタデータ) (2025-12-21T17:27:10Z) - Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文 参考訳(メタデータ) (2025-05-30T14:42:02Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Construction of extra-large scale screening tools for risks of severe
mental illnesses using real world healthcare data [0.5671051073036456]
米国での重篤な精神病(SMI)の流行は全人口の約3%である。
SMIの集団レベルのリスクスクリーニングを行うために、スケーラブルな機械学習ベースのツールが開発された。
論文 参考訳(メタデータ) (2022-12-20T15:12:12Z) - Clinical Deterioration Prediction in Brazilian Hospitals Based on
Artificial Neural Networks and Tree Decision Models [56.93322937189087]
超強化ニューラルネットワーク(XBNet)は臨床劣化(CD)を予測するために用いられる
XGBoostモデルはブラジルの病院のデータからCDを予測する最良の結果を得た。
論文 参考訳(メタデータ) (2022-12-17T23:29:14Z) - Causal Analysis and Prediction of Human Mobility in the U.S. during the
COVID-19 Pandemic [0.0]
米国における新型コロナウイルスの感染拡大以来、ほとんどの州は旅行制限を強制しており、移動度は大幅に低下している。
本研究は、このパンデミックの間、米国における人間の移動と旅行に最も影響を及ぼす要因を決定・分析する分析枠組みを開発する。
論文 参考訳(メタデータ) (2021-11-24T05:15:12Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。