論文の概要: Time-dependent Iterative Imputation for Multivariate Longitudinal
Clinical Data
- arxiv url: http://arxiv.org/abs/2304.07821v1
- Date: Sun, 16 Apr 2023 16:10:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-18 17:09:30.318654
- Title: Time-dependent Iterative Imputation for Multivariate Longitudinal
Clinical Data
- Title(参考訳): 多変量長期臨床データの時間依存性反復計算
- Authors: Omer Noy and Ron Shamir
- Abstract要約: Time-Dependent Iterative Imputationは時系列データを計算するための実用的なソリューションを提供する。
500,000人以上の患者を観察するコホートに応用した場合,本手法は最先端の計算法より優れていた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Missing data is a major challenge in clinical research. In electronic medical
records, often a large fraction of the values in laboratory tests and vital
signs are missing. The missingness can lead to biased estimates and limit our
ability to draw conclusions from the data. Additionally, many machine learning
algorithms can only be applied to complete datasets. A common solution is data
imputation, the process of filling-in the missing values. However, some of the
popular imputation approaches perform poorly on clinical data. We developed a
simple new approach, Time-Dependent Iterative imputation (TDI), which offers a
practical solution for imputing time-series data. It addresses both
multivariate and longitudinal data, by integrating forward-filling and
Iterative Imputer. The integration employs a patient, variable, and
observation-specific dynamic weighting strategy, based on the clinical patterns
of the data, including missing rates and measurement frequency. We tested TDI
on randomly masked clinical datasets. When applied to a cohort consisting of
more than 500,000 patient observations from MIMIC III, our approach
outperformed state-of-the-art imputation methods for 25 out of 30 clinical
variables, with an overall root-mean-squared-error of 0.63, compared to 0.85
for SoftImpute, the second best method. MIMIC III and COVID-19 inpatient
datasets were used to perform prediction tasks. Importantly, these tests
demonstrated that TDI imputation can lead to improved risk prediction.
- Abstract(参考訳): データ不足は臨床研究における大きな課題である。
電子カルテでは、しばしば実験室検査やバイタルサインの値のかなりの部分が欠落している。
不足はバイアスのある見積もりにつながり、データから結論を引き出す能力を制限する可能性がある。
さらに、多くの機械学習アルゴリズムは完全なデータセットにのみ適用できる。
一般的な解決策はデータインプテーションであり、欠落した値を満たすプロセスである。
しかし、一般的な計算手法のいくつかは臨床データでは不十分である。
我々は時間依存反復計算(TDI)というシンプルな新しい手法を開発し、時系列データを計算するための実用的なソリューションを提供した。
フォワードフィルとイテレーティブインプタを統合することで、多変量データと長手データの両方に対処する。
この統合は、欠落率や測定頻度を含むデータの臨床的パターンに基づいて、患者、変数、観察固有の動的重み付け戦略を採用する。
ランダムにマスクした臨床データセットを用いてTDIを試験した。
MIMIC IIIから50,000人以上の患者を観察したコホートに適用すると,本手法は30例中25例に対して根平均2乗誤差が0.63例,SoftImputeが0.85例であった。
MIMIC IIIとCOVID-19の患者データセットは予測タスクの実行に使用された。
重要なことは、これらの試験は、TDI計算がリスク予測の改善につながることを示した。
関連論文リスト
- An Efficient Contrastive Unimodal Pretraining Method for EHR Time Series Data [35.943089444017666]
本稿では,長期臨床経過データに適した比較事前学習法を提案する。
本モデルでは, 臨床医が患者の症状についてより深い知見を得られるように, 欠損測定をインプットする能力を示す。
論文 参考訳(メタデータ) (2024-10-11T19:05:25Z) - TrialBench: Multi-Modal Artificial Intelligence-Ready Clinical Trial Datasets [57.067409211231244]
本稿では,マルチモーダルデータ(例えば,薬物分子,疾患コード,テキスト,分類・数値的特徴)と臨床治験設計における8つの重要な予測課題をカバーするAIreadyデータセットを精巧にキュレートした。
データセットのユーザビリティと信頼性を確保するため、各タスクに基本的な検証方法を提供する。
このようなオープンアクセスデータセットが利用可能になることは、臨床試験設計のための高度なAIアプローチの開発を促進することを期待する。
論文 参考訳(メタデータ) (2024-06-30T09:13:10Z) - Multimodal Pretraining of Medical Time Series and Notes [45.89025874396911]
ディープラーニングモデルは、意味のあるパターンを抽出する際の約束を示すが、広範囲なラベル付きデータが必要である。
本稿では,臨床測定値とノートのアライメントに着目し,自己指導型事前学習を用いた新しいアプローチを提案する。
病院内での死亡予測や表現型化などの下流タスクでは、データのごく一部がラベル付けされた設定において、ベースラインよりも優れています。
論文 参考訳(メタデータ) (2023-12-11T21:53:40Z) - Leveraging Unlabelled Data in Multiple-Instance Learning Problems for
Improved Detection of Parkinsonian Tremor in Free-Living Conditions [80.88681952022479]
本稿では,半教師付き学習とマルチスタンス学習を組み合わせた新しい手法を提案する。
本研究は,454被験者の非競合データを活用することにより,物体ごとの震動検出において大きな性能向上が達成できることを示す。
論文 参考訳(メタデータ) (2023-04-29T12:25:10Z) - Deep Imputation of Missing Values in Time Series Health Data: A Review
with Benchmarking [0.0]
この調査では,5つの時系列健康データセットに対して,最先端の深層計算手法をベンチマークするために,データ中心の6つの実験を行った。
時系列データにおける欠落した値の縦方向の計算と横方向の計算を共同で行う深層学習法は、従来の計算法よりも統計的に優れたデータ品質が得られる。
論文 参考訳(メタデータ) (2023-02-10T16:03:36Z) - Unsupervised pre-training of graph transformers on patient population
graphs [48.02011627390706]
異種臨床データを扱うグラフ変換器を用いたネットワークを提案する。
自己教師型, 移動学習環境において, 事前学習方式の利点を示す。
論文 参考訳(メタデータ) (2022-07-21T16:59:09Z) - MURAL: An Unsupervised Random Forest-Based Embedding for Electronic
Health Record Data [59.26381272149325]
異なる変数型でデータを表現するための教師なしランダムフォレストを提案する。
muraL forestsは、ノード分割変数がランダムに選択される一連の決定ツリーで構成されている。
提案手法を用いることで,競合するアプローチよりも正確なデータの視覚化と分類が可能であることを示す。
論文 参考訳(メタデータ) (2021-11-19T22:02:21Z) - Sequential Diagnosis Prediction with Transformer and Ontological
Representation [35.88195694025553]
本稿では,患者が訪問する時間スタンプと滞在時間との間に不規則な間隔を対応させるSETORと呼ばれる,エンドツーエンドの頑健なトランスフォーマーモデルを提案する。
2つの実世界の医療データセットで実施された実験により、シーケンシャルな診断予測モデルSETORは、従来の最先端のアプローチよりも優れた予測結果が得られることが示された。
論文 参考訳(メタデータ) (2021-09-07T13:09:55Z) - A random shuffle method to expand a narrow dataset and overcome the
associated challenges in a clinical study: a heart failure cohort example [50.591267188664666]
本研究の目的は、統計的に合法なHFデータセットのカーディナリティを高めるためにランダムシャッフル法を設計することであった。
提案されたランダムシャッフル法は、HFデータセットのカーディナリティを10回、およびランダムな繰り返し測定アプローチに続いて21回向上させることができた。
論文 参考訳(メタデータ) (2020-12-12T10:59:38Z) - Longitudinal modeling of MS patient trajectories improves predictions of
disability progression [2.117653457384462]
本研究は, 実世界の患者データから情報を最適に抽出する作業に対処する。
本研究では,患者軌跡モデリングに適した機械学習手法を用いることで,患者の障害進行を2年間の地平線で予測できることを示す。
文献で利用可能なモデルと比較して、この研究はMS病の進行予測に最も完全な患者履歴を使用する。
論文 参考訳(メタデータ) (2020-11-09T20:48:00Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。