論文の概要: A Systematic Approach to Cleaning Routine Health Surveillance Datasets:
An Illustration Using National Vector Borne Disease Control Programme Data of
Punjab, India
- arxiv url: http://arxiv.org/abs/2108.09963v1
- Date: Mon, 23 Aug 2021 06:22:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-17 12:08:09.223689
- Title: A Systematic Approach to Cleaning Routine Health Surveillance Datasets:
An Illustration Using National Vector Borne Disease Control Programme Data of
Punjab, India
- Title(参考訳): 定期的健康監視データセットの整理に関する体系的アプローチ--インド・パンジャブ州のnational vector borne disease control program dataを用いて
- Authors: Gurpreet Singh, Biju Soman and Arun Mitra
- Abstract要約: ICT4Dとデータサイエンスは、健康情報システムのための体系的、再現可能、スケーラブルなデータクリーニングを促進する。
データクリーニングのためのロジックモデルが使用され、データセットのスクリーニング、診断、編集のための自動アルゴリズムが含まれていた。
ロジックモデルアプリケーションにより、疫学を理解し、データベースの公衆衛生決定を容易にするために使用できる分析可能なデータセットが開発された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Advances in ICT4D and data science facilitate systematic, reproducible, and
scalable data cleaning for strengthening routine health information systems. A
logic model for data cleaning was used and it included an algorithm for
screening, diagnosis, and editing datasets in a rule-based, interactive, and
semi-automated manner. Apriori computational workflows and operational
definitions were prepared. Model performance was illustrated using the dengue
line-list of the National Vector Borne Disease Control Programme, Punjab, India
from 01 January 2015 to 31 December 2019. Cleaning and imputation for an
estimated date were successful for 96.1% and 98.9% records for the year 2015
and 2016 respectively, and for all cases in the year 2017, 2018, and 2019.
Information for age and sex was cleaned and extracted for more than 98.4% and
99.4% records. The logic model application resulted in the development of an
analysis-ready dataset that can be used to understand spatiotemporal
epidemiology and facilitate data-based public health decision making.
- Abstract(参考訳): ICT4Dとデータサイエンスの進歩は、定期的な健康情報システムを強化するために、体系的、再現可能、スケーラブルなデータクリーニングを促進する。
データクリーニングのための論理モデルを使用し、ルールベース、対話型、半自動的な方法でデータセットをスクリーニング、診断、編集するアルゴリズムを含んでいた。
計算ワークフローと運用定義が準備された。
モデルパフォーマンスは、2015年1月01日から2019年12月31日までインドのプンジャブにあるnational vector borne disease control programのdengue line-listを使用して示されている。
2015年と2016年のそれぞれ96.1%と98.9%の記録、2017年と2018年と2019年のすべてのケースで、推定日付のクリーニングとインプテーションが成功した。
年齢と性別に関する情報は98.4%、99.4%以上で削除された。
論理モデルアプリケーションは、時空間疫学を理解し、データベースの公衆衛生意思決定を容易にする分析可能なデータセットの開発につながった。
関連論文リスト
- A Survey of Artificial Intelligence in Gait-Based Neurodegenerative Disease Diagnosis [51.07114445705692]
神経変性疾患(神経変性疾患、ND)は、伝統的に医学的診断とモニタリングのために広範囲の医療資源と人的努力を必要とする。
重要な疾患関連運動症状として、ヒトの歩行を利用して異なるNDを特徴づけることができる。
人工知能(AI)モデルの現在の進歩は、NDの識別と分類のための自動歩行分析を可能にする。
論文 参考訳(メタデータ) (2024-05-21T06:44:40Z) - Towards System Modelling to Support Diseases Data Extraction from the Electronic Health Records for Physicians Research Activities [0.0]
本研究の目的は、特定の人口に対する疾患統計のモニタリングなど、研究活動に利用できるデータを提供することである。
EHRシステムの制限の1つは、データは標準フォーマットではなく様々な形式で利用できることである。
まず、疾患や人口統計データの名称を1つの標準化された形式に変換し、研究活動に利用できるようにする必要がある。
論文 参考訳(メタデータ) (2024-04-01T16:18:40Z) - NLICE: Synthetic Medical Record Generation for Effective Primary
Healthcare Differential Diagnosis [0.765458997723296]
患者記録の作成には,SymCatという公衆疾患症状データソースを用いている。
合成データの表現性を高めるために,NLICEと呼ばれる医学標準化された症状モデリング手法を用いる。
予測疾患モデルをトレーニングするためのデータセットの有効性を示す。
論文 参考訳(メタデータ) (2024-01-24T19:17:45Z) - Remote Medication Status Prediction for Individuals with Parkinson's
Disease using Time-series Data from Smartphones [75.23250968928578]
本稿では,パーキンソン病患者のmPowerデータセットを用いて薬剤状態を予測する方法を提案する。
提案手法は,3つの薬物状態を客観的に予測する上で有望な結果を示す。
論文 参考訳(メタデータ) (2022-07-26T02:08:08Z) - TrialGraph: Machine Intelligence Enabled Insight from Graph Modelling of
Clinical Trials [0.0]
我々はCT.gov, AACT, TrialTroveデータベースから収集した治験データセット(n=1191臨床試験、100万人の患者を代表する)を紹介する。
次に,グラフ機械学習アルゴリズムの数学的基礎と実装について詳述する。
我々はこれらのモデルを用いて、疾患、既往の医療状況、治療に関する情報を与えられた臨床試験の副作用情報を予測する訓練を行った。
論文 参考訳(メタデータ) (2021-12-15T15:36:57Z) - Neural Networks for Pulmonary Disease Diagnosis using Auditory and
Demographic Information [2.3228726690478547]
新型コロナウイルス(COVID-19)の感染拡大は、呼吸器疾患の機械診断に研究コミュニティの注目を集めている。
そこで本論文は,呼吸問題の分類に機械学習を活用する試みである。
我々は、公開されている肺聴覚データセットの処理と分類にディープ畳み込みニューラルネットワーク(DCNN)を使用します。
論文 参考訳(メタデータ) (2020-11-26T09:14:40Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - PClean: Bayesian Data Cleaning at Scale with Domain-Specific
Probabilistic Programming [65.88506015656951]
我々は、データセット固有の知識を活用して汚いデータのクリーン化と正規化を行う確率的プログラミング言語であるPCleanを提案する。
PCleanは、(1)確率的プログラムでカスタマイズ可能なリレーショナルデータベースインスタンスの非パラメトリックモデル、(2)モデルの構造を利用するシーケンシャルなモンテカルロ推論アルゴリズム、(3)ほぼ最適のSMC提案とブロックされたギブス再構成の3つのモデルと推論コントリビューションを利用している。
論文 参考訳(メタデータ) (2020-07-23T08:01:47Z) - A Deep Learning Pipeline for Patient Diagnosis Prediction Using
Electronic Health Records [0.5672132510411464]
我々は、公衆衛生データセットを普遍的なフォーマットに容易に変換するPythonパッケージを開発し、公開する。
複数の診断を同時に予測する2つの新しいモデルアーキテクチャを提案する。
どちらのモデルも高い精度で複数の診断を同時に予測できる。
論文 参考訳(メタデータ) (2020-06-23T14:58:58Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z) - A machine learning methodology for real-time forecasting of the
2019-2020 COVID-19 outbreak using Internet searches, news alerts, and
estimates from mechanistic models [53.900779250589814]
提案手法は,2日前の安定かつ正確な予測を行うことができる。
我々のモデルでは,中国32州中27州において,ベースラインモデルよりも予測力が優れています。
論文 参考訳(メタデータ) (2020-04-08T14:39:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。