論文の概要: Design and Implementation of a Scalable Clinical Data Warehouse for Resource-Constrained Healthcare Systems
- arxiv url: http://arxiv.org/abs/2502.16674v1
- Date: Sun, 23 Feb 2025 18:19:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-25 15:51:29.606210
- Title: Design and Implementation of a Scalable Clinical Data Warehouse for Resource-Constrained Healthcare Systems
- Title(参考訳): リソース制約型医療システムのためのスケーラブルな臨床データウェアハウスの設計と実装
- Authors: Shovito Barua Soumma, Fahim Shahriar, Umme Niraj Mahi, Md Hasin Abrar, Md Abdur Rahman Fahad, Abu Sayed Md. Latiful Hoque,
- Abstract要約: 本研究は、リソース制限設定における異種EHR統合のために設計された、スケーラブルでプライバシに制限された臨床データウェアハウスであるNCDWを提案する。
このフレームワークは、ICD-11やHL7 FHIRといった標準に適合するように、摂食層を変更することで、開発途上国のさまざまな医療環境に適応することができる。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Centralized electronic health record repositories are critical for advancing disease surveillance, public health research, and evidence-based policymaking. However, developing countries face persistent challenges in achieving this due to fragmented healthcare data sources, inconsistent record-keeping practices, and the absence of standardized patient identifiers, limiting reliable record linkage, compromise data interoperability, and limit scalability-obstacles exacerbated by infrastructural constraints and privacy concerns. To address these barriers, this study proposes a scalable, privacy-preserving clinical data warehouse, NCDW, designed for heterogeneous EHR integration in resource-limited settings and tested with 1.16 million clinical records. The framework incorporates a wrapper-based data acquisition layer for secure, automated ingestion of multisource health data and introduces a soundex algorithm to resolve patient identity mismatches in the absence of unique IDs. A modular data mart is designed for disease-specific analytics, demonstrated through a dengue fever case study in Bangladesh, integrating clinical, demographic, and environmental data for outbreak prediction and resource planning. Quantitative assessment of the data mart underscores its utility in strengthening national decision-support systems, highlighting the model's adaptability for infectious disease management. Comparative evaluation of database technologies reveals NoSQL outperforms relational SQL by 40-69% in complex query processing, while system load estimates validate the architecture's capacity to manage 19 million daily records (34TB over 5 years). The framework can be adapted to various healthcare settings across developing nations by modifying the ingestion layer to accommodate standards like ICD-11 and HL7 FHIR, facilitating interoperability for managing infectious diseases (i.e., COVID, tuberculosis).
- Abstract(参考訳): 中央集権型電子健康記録リポジトリは、疾病の監視、公衆衛生研究、エビデンスに基づく政策立案に不可欠である。
しかし、発展途上国は、断片化された医療データソース、一貫性のない記録保持プラクティス、標準化された患者識別子の欠如、信頼性の高いレコードリンクの制限、データ相互運用性の妥協、インフラ上の制約とプライバシー上の懸念によって悪化するスケーラビリティ-障害物の制限など、これを実現するための継続的な課題に直面している。
これらの障壁に対処するために,資源制限された環境下での不均一なEHRを統合するために設計され,臨床記録16万件でテストされた,スケーラブルでプライバシ保護型臨床データウェアハウスであるNCDWを提案する。
このフレームワークは、複数ソースの健康データの安全かつ自動化された取り込みのためのラッパーベースのデータ取得層を組み込んでおり、ユニークなIDがない場合の患者識別ミスマッチを解決するためのサウンドエックスアルゴリズムを導入している。
モジュラーデータマートは、バングラデシュのデング熱のケーススタディを通じて、流行の予測と資源計画のための臨床、人口統計、環境データを統合することで、疾患特異的分析のために設計されている。
データマートを定量的に評価することで、全国的な意思決定支援システムを強化し、感染性疾患管理へのモデルの適用性を強調している。
データベース技術の比較評価では、NoSQLは複雑なクエリ処理においてリレーショナルSQLを40~69%上回り、システム負荷推定では、11900万レコード(5年間で34TB)を管理するアーキテクチャの能力を評価する。
このフレームワークは、ICD-11やHL7 FHIRのような標準に適合するように摂取層を変更し、感染症(新型コロナウイルス、結核など)の管理の相互運用性を促進することで、発展途上国の様々な医療環境に適応することができる。
関連論文リスト
- Electronic Health Records: Towards Digital Twins in Healthcare [1.702436955667761]
本章では、医療情報システムの進化と重要性について論じる。
英国と米国における EHR の実施に関する調査から始まる。
国際疾病分類(ICD)システムの概要を概観し、ICD-9からICD-10までの発展を辿る。
この議論の中心はMIMIC-IIIデータベースであり、これは医療データ共有における目覚ましい業績であり、世界中の研究者が自由に利用できる最も包括的なクリティカルケアデータベースである。
論文 参考訳(メタデータ) (2025-01-16T16:30:02Z) - Datasheets for Healthcare AI: A Framework for Transparency and Bias Mitigation [0.0]
トレーニングデータセットにおけるバイアス、データ不完全性、不正確性は、不公平な結果をもたらし、既存の格差を増幅する。
透明性を促進し,規制要件との整合性を確保するためのデータセットドキュメンテーションフレームワークを提案する。
この発見は、責任あるAI開発を促進する上で、データセットドキュメンテーションの重要性を強調している。
論文 参考訳(メタデータ) (2025-01-09T23:36:34Z) - FedCVD: The First Real-World Federated Learning Benchmark on Cardiovascular Disease Data [52.55123685248105]
心臓血管疾患(CVD)は、現在世界でも主要な死因であり、早期診断と治療の要点を浮き彫りにしている。
機械学習(ML)手法はCVDの早期診断に役立つが、その性能は高品質なデータへのアクセスに依存している。
本稿では、FedCVDという心臓血管疾患検出のための、世界初の実世界のFLベンチマークを示す。
論文 参考訳(メタデータ) (2024-10-28T02:24:01Z) - Prediction and Detection of Terminal Diseases Using Internet of Medical Things: A Review [4.4389631374821255]
AI駆動モデルでは、心臓疾患、慢性腎臓病(CKD)、アルツハイマー病、肺がんの予測において98%以上の精度が達成されている。
IoMTデータは巨大で異種であり、患者のプライバシを保護するための相互運用性とセキュリティを確保するための複雑さが増している。
今後の研究は、データ品質と相互運用性を改善するために、データの標準化と高度な前処理技術に焦点を当てるべきである。
論文 参考訳(メタデータ) (2024-09-22T15:02:33Z) - FEDMEKI: A Benchmark for Scaling Medical Foundation Models via Federated Knowledge Injection [83.54960238236548]
FEDMEKIはデータのプライバシーを守るだけでなく、医療基盤モデルの能力を高める。
FEDMEKIは、医療ファンデーションモデルに対して、直接データを公開することなく、幅広い医療知識から学ぶことを可能にする。
論文 参考訳(メタデータ) (2024-08-17T15:18:56Z) - Generation and De-Identification of Indian Clinical Discharge Summaries using LLMs [3.8895618250348116]
近年のデータ漏洩による財務的影響は、1000万ドル近くと推定されている。
個人情報を識別するコンピュータベースのシステムは、データドリフトに対して脆弱である。
論文 参考訳(メタデータ) (2024-07-08T12:47:03Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z) - From predictions to prescriptions: A data-driven response to COVID-19 [42.57407485467993]
新型コロナウイルスの臨床的特徴を理解するための包括的データ駆動型アプローチを提案する。
私たちは、感染や死亡のリスクを予測するために、パーソナライズされた電卓を構築します。
人工呼吸器の再配置と不足軽減のための最適化モデルを提案する。
論文 参考訳(メタデータ) (2020-06-30T03:34:00Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z) - Predictive Modeling of ICU Healthcare-Associated Infections from
Imbalanced Data. Using Ensembles and a Clustering-Based Undersampling
Approach [55.41644538483948]
本研究は,集中治療室における危険因子の同定と医療関連感染症の予測に焦点をあてる。
感染発生率の低減に向けた意思決定を支援することを目的とする。
論文 参考訳(メタデータ) (2020-05-07T16:13:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。