論文の概要: Application and Validation of Geospatial Foundation Model Data for the Prediction of Health Facility Programmatic Outputs -- A Case Study in Malawi
- arxiv url: http://arxiv.org/abs/2510.25954v1
- Date: Wed, 29 Oct 2025 20:53:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-31 16:05:09.568897
- Title: Application and Validation of Geospatial Foundation Model Data for the Prediction of Health Facility Programmatic Outputs -- A Case Study in Malawi
- Title(参考訳): 医療施設計画成果予測への地理空間モデルデータの適用と検証 -マラウイを事例として-
- Authors: Lynn Metz, Rachel Haggard, Michael Moszczynski, Samer Asbah, Chris Mwase, Patricia Khomani, Tyler Smith, Hannah Cooper, Annie Mwale, Arbaaz Muslim, Gautam Prasad, Mimi Sun, Tomer Shekel, Joydeep Paul, Anna Carter, Shravya Shetty, Dylan Green,
- Abstract要約: Geospatial Foundation Models (GeoFMs) は、多様な空間的、時間的、行動的なデータを合成することで、有望な道を提供する。
本研究は、マラウイにおける15の定期的な健康プログラム出力をモデル化するための3つのGeoFM埋め込み源の予測性能について評価した。
- 参考スコア(独自算出の注目度): 0.7669892939042836
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The reliability of routine health data in low and middle-income countries (LMICs) is often constrained by reporting delays and incomplete coverage, necessitating the exploration of novel data sources and analytics. Geospatial Foundation Models (GeoFMs) offer a promising avenue by synthesizing diverse spatial, temporal, and behavioral data into mathematical embeddings that can be efficiently used for downstream prediction tasks. This study evaluated the predictive performance of three GeoFM embedding sources - Google Population Dynamics Foundation Model (PDFM), Google AlphaEarth (derived from satellite imagery), and mobile phone call detail records (CDR) - for modeling 15 routine health programmatic outputs in Malawi, and compared their utility to traditional geospatial interpolation methods. We used XGBoost models on data from 552 health catchment areas (January 2021-May 2023), assessing performance with R2, and using an 80/20 training and test data split with 5-fold cross-validation used in training. While predictive performance was mixed, the embedding-based approaches improved upon baseline geostatistical methods in 13 of 15 (87%) indicators tested. A Multi-GeoFM model integrating all three embedding sources produced the most robust predictions, achieving average 5-fold cross validated R2 values for indicators like population density (0.63), new HIV cases (0.57), and child vaccinations (0.47) and test set R2 of 0.64, 0.68, and 0.55, respectively. Prediction was poor for prediction targets with low primary data availability, such as TB and malnutrition cases. These results demonstrate that GeoFM embeddings imbue a modest predictive improvement for select health and demographic outcomes in an LMIC context. We conclude that the integration of multiple GeoFM sources is an efficient and valuable tool for supplementing and strengthening constrained routine health information systems.
- Abstract(参考訳): 低所得国と中所得国(LMIC)における日常的な健康データの信頼性は、レポートの遅延や不完全なカバレッジ、新しいデータソースの探索、分析によって制限されることが多い。
Geospatial Foundation Models (GeoFMs) は、様々な空間的、時間的、行動的なデータを数学的埋め込みに合成し、下流予測タスクに効率的に使用できる、有望な道を提供する。
本研究では、マラウイにおける15の定期的な健康プログラム出力をモデル化するために、Google Population Dynamics Foundation Model(PDFM)、Google AlphaEarth(衛星画像由来)、携帯電話通話詳細記録(CDR)の3つのGeoFM埋め込みソースの予測性能を評価し、それらの有用性を従来の地理空間補間法と比較した。
健常者552名(2021年1月~2023年5月)のデータにXGBoostモデルを用いた。
予測性能は混在するが, 埋込型アプローチは, 15 (87%) の指標のうち13 (87%) の基準測地法により改善した。
3つの埋め込み源を統合したMulti-GeoFMモデルは、人口密度(0.63)、新しいHIV(0.57)、子ワクチン(0.47)、テストセットR2(0.64)、0.68(0.55)などの指標に対して平均5倍に検証されたR2値を達成し、最も堅牢な予測を生み出した。
TBや栄養不良などの一次データ利用率の低い予測対象では予測が不十分であった。
これらの結果から,GeoFMの埋め込みは,LMICコンテキストにおける健康・人口統計学的結果の選択に対して,控えめな予測的改善をもたらすことが示唆された。
複数のGeoFMソースの統合は、制約された日常的な健康情報システムの補完と強化のための、効率的で価値のあるツールである、と結論付けている。
関連論文リスト
- Validating Emergency Department Admission Predictions Based on Local Data Through MIMIC-IV [0.0]
本研究は,ギリシャの病院において,MIMIC-IVデータセットを総合的に活用して,小規模の局所的データセットを用いて開発された入院予測モデルを検証した。
MIMIC-IVデータを前処理した後,線形判別分析 (LDA), K-Nearest Neighbors (KNN), Random Forest (RF), Recursive Partitioning and Regression Trees (RPART), Support Vector Machines (SVM) の5つのアルゴリズムが評価された。
RFは、受信器動作特性曲線(AUC)が0.9999、感度が0.9997、MIMICが0.9999と、優れた性能を示した。
論文 参考訳(メタデータ) (2025-03-18T13:54:28Z) - Region-wise stacking ensembles for estimating brain-age using MRI [0.23301643766310373]
高次元MRIデータは、一般化可能な解釈可能なモデルの構築に挑戦する。
本稿では,概念的に新しい2段階積み重ねアンサンブル(SE)手法を提案する。
第1レベルの予測では、改善され、より堅牢な老化信号が見られた。
論文 参考訳(メタデータ) (2025-01-17T12:24:28Z) - Out-of-distribution Reject Option Method for Dataset Shift Problem in Early Disease Onset Prediction [3.382273111067512]
本稿では,リアルタイム設定におけるデータセットシフトを減少させるために,予測(ODROP)のアウト・オブ・ディストリビューション・リジェクションオプションを提案する。
我々は、糖尿病、ジスリピド血症、高血圧という3つの疾患発症予測タスクで、データセットシフトを伴う現実の健康チェックデータセットを2つ使用した。
5つのOOD手法では, 可変オートエンコーダ法によりAUROCの安定性が向上し, 改良が見られた。
論文 参考訳(メタデータ) (2024-05-30T09:14:01Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Long-term drought prediction using deep neural networks based on geospatial weather data [75.38539438000072]
農業計画や保険には1年前から予測される高品質の干ばつが不可欠だ。
私たちは、体系的なエンドツーエンドアプローチを採用するエンドツーエンドアプローチを導入することで、干ばつデータに取り組みます。
主な発見は、TransformerモデルであるEarthFormerが、正確な短期(最大6ヶ月)の予測を行う際の例外的なパフォーマンスである。
論文 参考訳(メタデータ) (2023-09-12T13:28:06Z) - Strict baselines for Covid-19 forecasting and ML perspective for USA and
Russia [105.54048699217668]
Covid-19は、2年間にわたって蓄積されたデータセットを収集し、予測分析に使用できるようにする。
本研究は、米国とロシアの2カ国の地域データに基づいて、Covid-19の拡散のダイナミクスを予測するための様々な種類の方法に関する一貫した研究結果である。
論文 参考訳(メタデータ) (2022-07-15T18:21:36Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。