Fugu-MT 論文翻訳(概要): An Extensive Data Processing Pipeline for MIMIC-IV

論文の概要: An Extensive Data Processing Pipeline for MIMIC-IV

arxiv url: http://arxiv.org/abs/2204.13841v1
Date: Fri, 29 Apr 2022 01:09:38 GMT
ステータス: 翻訳完了
システム内更新日: 2022-05-02 14:35:22.583308
Title: An Extensive Data Processing Pipeline for MIMIC-IV
Title（参考訳）: MIMIC-IV用データ処理パイプライン
Authors: Mehak Gupta, Brennan Gallamoza, Nicolas Cutrona, Pranjal Dhakal, Raphael Poulain, Rahmatollah Beheshti
Abstract要約: エンドツーエンドで完全にカスタマイズ可能なパイプラインを提供して、データの抽出、クリーン化、および前処理を行います。 ICUおよび非ICU関連臨床時系列予測タスクにおけるMIMICデータセットの第4版(MIMIC-IV)の予測と評価を行った。
参考スコア（独自算出の注目度）: 0.20326203100766121
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: An increasing amount of research is being devoted to applying machine learning methods to electronic health record (EHR) data for various clinical tasks. This growing area of research has exposed the limitation of accessibility of EHR datasets for all, as well as the reproducibility of different modeling frameworks. One reason for these limitations is the lack of standardized pre-processing pipelines. MIMIC is a freely available EHR dataset in a raw format that has been used in numerous studies. The absence of standardized pre-processing steps serves as a major barrier to the wider adoption of the dataset. It also leads to different cohorts being used in downstream tasks, limiting the ability to compare the results among similar studies. Contrasting studies also use various distinct performance metrics, which can greatly reduce the ability to compare model results. In this work, we provide an end-to-end fully customizable pipeline to extract, clean, and pre-process data; and to predict and evaluate the fourth version of the MIMIC dataset (MIMIC-IV) for ICU and non-ICU-related clinical time-series prediction tasks.
Abstract（参考訳）: さまざまな臨床業務のための電子健康記録(EHR)データに機械学習手法を適用する研究が増えている。この成長する研究領域は、EHRデータセットのアクセシビリティの制限と、異なるモデリングフレームワークの再現性を明らかにしている。これらの制限の1つの理由は、標準化された前処理パイプラインの欠如である。 MIMICは、多くの研究で使われている生のフォーマットで自由に利用できるEHRデータセットである。標準化された前処理ステップがないことは、データセットをより広く採用するための大きな障壁となる。また、下流のタスクで異なるコホートが使われ、同様の研究結果を比較する能力が制限される。対照的に、さまざまなパフォーマンス指標を使用して、モデル結果を比較する能力を大幅に削減することができる。本研究では,icuおよび非icu関連臨床時系列予測タスクのための第4版の模倣データセット (mimic-iv) の予測と評価を行う。

関連論文リスト

A Multimodal Data Processing Pipeline for MIMIC-IV Dataset [6.536530002576318]
MIMIC-IVは、大規模な電子健康記録(EHR)リソースで、臨床機械学習研究に広く利用されている。構造化データ、臨床ノート、波形、画像データを含む複数のモダリティから構成される。 MIMIC-IVデータ抽出用のパイプラインがいくつか用意されているが、モダリティの小さなサブセットをターゲットにしているか、あるいは任意のダウンストリームアプリケーションを完全にサポートしていない。本稿では,従来普及してきたユニモーダルパイプラインを大幅に拡張し,包括的でカスタマイズ可能なマルチモーダルパイプラインを提案する。
論文参考訳（メタデータ） (2026-01-08T20:05:05Z)
SurvBench: A Standardised Preprocessing Pipeline for Multi-Modal Electronic Health Record Survival Analysis [2.74994442100348]
本稿では、SurvBenchについて述べる。SurvBenchは、生のPhyloNetデータセットをマルチモーダルサバイバル分析のためのモデル対応テンソルに変換する、包括的でオープンソースの前処理パイプラインである。 SurvBenchは、MIMIC-IV、eICU、MC-MEDの3つの主要なクリティカルケアデータベースにデータローダを提供する。パイプラインは厳格なデータ品質管理、データ漏洩を防止するための患者レベルの分割、明確な欠陥追跡、標準化された時間的集約を実装している。
論文参考訳（メタデータ） (2025-11-14T23:19:14Z)
Improving the Generation and Evaluation of Synthetic Data for Downstream Medical Causal Inference [89.5628648718851]
因果推論は医療介入の開発と評価に不可欠である。現実の医療データセットは、規制障壁のためアクセスが難しいことが多い。本稿では,医学における治療効果分析のための新しい合成データ生成法STEAMを提案する。
論文参考訳（メタデータ） (2025-10-21T16:16:00Z)
Cross-Representation Benchmarking in Time-Series Electronic Health Records for Clinical Outcome Prediction [44.23284500920266]
このベンチマークは、2つの異なる臨床環境におけるデータキュレーションと評価を標準化する。実験によると、イベントストリームモデルは、常に最強のパフォーマンスを提供する。特徴選択戦略は臨床環境に適応する必要がある。
論文参考訳（メタデータ） (2025-10-10T09:03:47Z)
Representation Learning of Lab Values via Masked AutoEncoders [2.785172582119726]
逐次的な実験値の計算のためのトランスフォーマーベースのマスク付きオートエンコーダフレームワークであるLab-MAEを提案する。 Lab-MAEは、患者の人口集団間で同等のパフォーマンスを達成し、臨床予測において公平性を向上させる。
論文参考訳（メタデータ） (2025-01-05T20:26:49Z)
Autonomous Droplet Microfluidic Design Framework with Large Language Models [0.6827423171182153]
本研究では,処理および特徴抽出のためのフレームワークであるMicroFluidic-LLMsを提案する。コンテンツが言語形式に変換され、事前訓練された大きな言語モデルを活用することで、処理上の課題を克服する。当社のMicroFluidic-LLMsフレームワークは、ディープニューラルネットワークモデルに極めて効果的で簡単なものにすることができることを実証しています。
論文参考訳（メタデータ） (2024-11-11T03:20:53Z)
MEDS-Tab: Automated tabularization and baseline methods for MEDS datasets [2.8209943093430443]
この作業は、MEDSフレームワークによるコアデータ標準化の補完的な進歩によって実現されている。我々は、不規則にサンプリングされた時系列データを著しく単純化し、加速する。このシステムは、多様なデータセットと臨床設定にわたる健康問題に対する強力なMLソリューションの開発において、信頼性、スケーラビリティ、容易性を大幅に向上する。
論文参考訳（メタデータ） (2024-10-31T20:36:37Z)
Meta-Learners for Partially-Identified Treatment Effects Across Multiple Environments [67.80453452949303]
観察データから条件平均治療効果(CATE)を推定することは、パーソナライズされた医療など多くの応用に関係している。ここでは、観測データが複数の環境からやってくる広範囲な環境に焦点を当てる。任意の機械学習モデルと組み合わせて使用可能な境界を推定するために、異なるモデルに依存しない学習者(いわゆるメタ学習者)を提案する。
論文参考訳（メタデータ） (2024-06-04T16:31:43Z)
EMERGE: Integrating RAG for Improved Multimodal EHR Predictive Modeling [22.94521527609479]
EMERGEは、マルチモーダルEHR予測モデリングの強化を目的とした、検索拡張生成駆動フレームワークである。提案手法は,大規模言語モデルにより時系列データと臨床メモの両方からエンティティを抽出する。抽出した知識は、患者の健康状態のタスク関連サマリーを生成するために使用される。
論文参考訳（メタデータ） (2024-05-27T10:53:15Z)
Towards Precision Healthcare: Robust Fusion of Time Series and Image Data [8.579651833717763]
本稿では,データの種類毎に2つのエンコーダを用いて,視覚情報と時間情報の両方において複雑なパターンをモデル化する手法を提案する。また、不均衡なデータセットに対処し、不確実性損失関数を使用し、改善した結果を得る。本手法は,臨床応用におけるマルチモーダルディープラーニングの改善に有効であることを示す。
論文参考訳（メタデータ） (2024-05-24T11:18:13Z)
Convolutional Monge Mapping Normalization for learning on sleep data [63.22081662149488]
我々は、CMMN(Convolutional Monge Mapping Normalization)と呼ばれる新しい手法を提案する。 CMMNは、そのパワースペクトル密度(PSD)をトレーニングデータに基づいて推定されるワッサーシュタインバリセンタに適応させるために、信号をフィルタリングする。睡眠脳波データに関する数値実験により、CMMNはニューラルネットワークアーキテクチャから独立して、顕著で一貫したパフォーマンス向上をもたらすことが示された。
論文参考訳（メタデータ） (2023-05-30T08:24:01Z)
Automated Medical Coding on MIMIC-III and MIMIC-IV: A Critical Review and Replicability Study [60.56194508762205]
我々は、最先端の医療自動化機械学習モデルを再現し、比較し、分析する。その結果, 弱い構成, サンプル化の不十分さ, 評価の不十分さなどにより, いくつかのモデルの性能が低下していることが判明した。再生モデルを用いたMIMIC-IVデータセットの総合評価を行った。
論文参考訳（メタデータ） (2023-04-21T11:54:44Z)
Time Associated Meta Learning for Clinical Prediction [78.99422473394029]
本稿では,時間関連メタラーニング(TAML)手法を提案する。タスク分割後のスパーシリティ問題に対処するため、TAMLは時間情報共有戦略を採用し、正のサンプル数を増やす。複数の臨床データセットに対するTAMLの有効性を示す。
論文参考訳（メタデータ） (2023-03-05T03:54:54Z)
Unsupervised Pre-Training on Patient Population Graphs for Patient-Level Predictions [48.02011627390706]
プレトレーニングは、コンピュータビジョン(CV)、自然言語処理(NLP)、医療画像など、機械学習のさまざまな分野で成功している。本稿では,患者結果の予測のために,教師なし事前学習を異種マルチモーダルEHRデータに適用する。提案手法は,人口レベルでのデータモデリングに有効であることがわかった。
論文参考訳（メタデータ） (2022-03-23T17:59:45Z)
HiRID-ICU-Benchmark -- A Comprehensive Machine Learning Benchmark on High-resolution ICU Data [0.8418021941792283]
ICU関連タスクの幅広い範囲をカバーするベンチマークの提供を目指している。 HiRIDデータセットを用いて,臨床医とのコラボレーションによって開発された複数の臨床関連タスクを定義した。我々は,このタイプのデータに対する深層学習アプローチのいくつかの制限を強調し,現在最先端のシーケンスモデリング手法を詳細に分析する。
論文参考訳（メタデータ） (2021-11-16T15:06:42Z)
Deep neural networks approach to microbial colony detection -- a comparative analysis [52.77024349608834]
本稿では,AGARデータセットを用いた3つの深層学習手法の性能について検討する。得られた結果は将来の実験のベンチマークとして機能するかもしれない。
論文参考訳（メタデータ） (2021-08-23T12:06:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。