論文の概要: An Extensive Data Processing Pipeline for MIMIC-IV
- arxiv url: http://arxiv.org/abs/2204.13841v1
- Date: Fri, 29 Apr 2022 01:09:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-02 14:35:22.583308
- Title: An Extensive Data Processing Pipeline for MIMIC-IV
- Title(参考訳): MIMIC-IV用データ処理パイプライン
- Authors: Mehak Gupta, Brennan Gallamoza, Nicolas Cutrona, Pranjal Dhakal,
Raphael Poulain, Rahmatollah Beheshti
- Abstract要約: エンドツーエンドで完全にカスタマイズ可能なパイプラインを提供して、データの抽出、クリーン化、および前処理を行います。
ICUおよび非ICU関連臨床時系列予測タスクにおけるMIMICデータセットの第4版(MIMIC-IV)の予測と評価を行った。
- 参考スコア(独自算出の注目度): 0.20326203100766121
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An increasing amount of research is being devoted to applying machine
learning methods to electronic health record (EHR) data for various clinical
tasks. This growing area of research has exposed the limitation of
accessibility of EHR datasets for all, as well as the reproducibility of
different modeling frameworks. One reason for these limitations is the lack of
standardized pre-processing pipelines. MIMIC is a freely available EHR dataset
in a raw format that has been used in numerous studies. The absence of
standardized pre-processing steps serves as a major barrier to the wider
adoption of the dataset. It also leads to different cohorts being used in
downstream tasks, limiting the ability to compare the results among similar
studies. Contrasting studies also use various distinct performance metrics,
which can greatly reduce the ability to compare model results. In this work, we
provide an end-to-end fully customizable pipeline to extract, clean, and
pre-process data; and to predict and evaluate the fourth version of the MIMIC
dataset (MIMIC-IV) for ICU and non-ICU-related clinical time-series prediction
tasks.
- Abstract(参考訳): さまざまな臨床業務のための電子健康記録(EHR)データに機械学習手法を適用する研究が増えている。
この成長する研究領域は、EHRデータセットのアクセシビリティの制限と、異なるモデリングフレームワークの再現性を明らかにしている。
これらの制限の1つの理由は、標準化された前処理パイプラインの欠如である。
MIMICは、多くの研究で使われている生のフォーマットで自由に利用できるEHRデータセットである。
標準化された前処理ステップがないことは、データセットをより広く採用するための大きな障壁となる。
また、下流のタスクで異なるコホートが使われ、同様の研究結果を比較する能力が制限される。
対照的に、さまざまなパフォーマンス指標を使用して、モデル結果を比較する能力を大幅に削減することができる。
本研究では,icuおよび非icu関連臨床時系列予測タスクのための第4版の模倣データセット (mimic-iv) の予測と評価を行う。
関連論文リスト
- XAI for In-hospital Mortality Prediction via Multimodal ICU Data [57.73357047856416]
マルチモーダルICUデータを用いて病院内死亡率を予測するための,効率的で説明可能なAIソリューションを提案する。
我々は,臨床データから異種入力を受信し,意思決定を行うマルチモーダル・ラーニングを我々のフレームワークに導入する。
我々の枠組みは、医療研究において重要な要素の発見を容易にする他の臨床課題に容易に移行することができる。
論文 参考訳(メタデータ) (2023-12-29T14:28:04Z) - Convolutional Monge Mapping Normalization for learning on sleep data [63.22081662149488]
我々は、CMMN(Convolutional Monge Mapping Normalization)と呼ばれる新しい手法を提案する。
CMMNは、そのパワースペクトル密度(PSD)をトレーニングデータに基づいて推定されるワッサーシュタインバリセンタに適応させるために、信号をフィルタリングする。
睡眠脳波データに関する数値実験により、CMMNはニューラルネットワークアーキテクチャから独立して、顕著で一貫したパフォーマンス向上をもたらすことが示された。
論文 参考訳(メタデータ) (2023-05-30T08:24:01Z) - Automated Medical Coding on MIMIC-III and MIMIC-IV: A Critical Review
and Replicability Study [60.56194508762205]
我々は、最先端の医療自動化機械学習モデルを再現し、比較し、分析する。
その結果, 弱い構成, サンプル化の不十分さ, 評価の不十分さなどにより, いくつかのモデルの性能が低下していることが判明した。
再生モデルを用いたMIMIC-IVデータセットの総合評価を行った。
論文 参考訳(メタデータ) (2023-04-21T11:54:44Z) - Time-dependent Iterative Imputation for Multivariate Longitudinal
Clinical Data [0.0]
Time-Dependent Iterative Imputationは時系列データを計算するための実用的なソリューションを提供する。
500,000人以上の患者を観察するコホートに応用した場合,本手法は最先端の計算法より優れていた。
論文 参考訳(メタデータ) (2023-04-16T16:10:49Z) - Time Associated Meta Learning for Clinical Prediction [78.99422473394029]
本稿では,時間関連メタラーニング(TAML)手法を提案する。
タスク分割後のスパーシリティ問題に対処するため、TAMLは時間情報共有戦略を採用し、正のサンプル数を増やす。
複数の臨床データセットに対するTAMLの有効性を示す。
論文 参考訳(メタデータ) (2023-03-05T03:54:54Z) - Unsupervised Pre-Training on Patient Population Graphs for Patient-Level
Predictions [48.02011627390706]
プレトレーニングは、コンピュータビジョン(CV)、自然言語処理(NLP)、医療画像など、機械学習のさまざまな分野で成功している。
本稿では,患者結果の予測のために,教師なし事前学習を異種マルチモーダルEHRデータに適用する。
提案手法は,人口レベルでのデータモデリングに有効であることがわかった。
論文 参考訳(メタデータ) (2022-03-23T17:59:45Z) - HiRID-ICU-Benchmark -- A Comprehensive Machine Learning Benchmark on
High-resolution ICU Data [0.8418021941792283]
ICU関連タスクの幅広い範囲をカバーするベンチマークの提供を目指している。
HiRIDデータセットを用いて,臨床医とのコラボレーションによって開発された複数の臨床関連タスクを定義した。
我々は,このタイプのデータに対する深層学習アプローチのいくつかの制限を強調し,現在最先端のシーケンスモデリング手法を詳細に分析する。
論文 参考訳(メタデータ) (2021-11-16T15:06:42Z) - Machine Learning for Multimodal Electronic Health Records-based
Research: Challenges and Perspectives [22.230972071321357]
電子健康記録は患者の健康史に関する豊富な情報を含んでいる。
構造化されたデータに頼ることは 患者の包括的情報を反映するのに 不十分かもしれない
多くの研究が、構造化されていない自由テキストデータも取り入れることで、より正確な結果を得ようとしている。
論文 参考訳(メタデータ) (2021-11-09T01:19:11Z) - Deep neural networks approach to microbial colony detection -- a
comparative analysis [52.77024349608834]
本稿では,AGARデータセットを用いた3つの深層学習手法の性能について検討する。
得られた結果は将来の実験のベンチマークとして機能するかもしれない。
論文 参考訳(メタデータ) (2021-08-23T12:06:00Z) - ODVICE: An Ontology-Driven Visual Analytic Tool for Interactive Cohort
Extraction [2.0131681387862153]
一般的な疾患では、EHRから抽出されたコホートは非常に限られた数の記録を含んでいる。
本稿では,モンテカルログラフスパンニングアルゴリズムを用いたデータ拡張フレームワークODVICEを提案する。
以上の結果から, ODVICE拡張コーホートの予測性能は, 非拡張データセットよりも曲線下面積(AUC)が30%向上していることが示唆された。
論文 参考訳(メタデータ) (2020-05-13T17:15:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。