論文の概要: Enabling scalable clinical interpretation of ML-based phenotypes using
real world data
- arxiv url: http://arxiv.org/abs/2208.01607v1
- Date: Tue, 2 Aug 2022 17:31:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-03 13:51:25.109850
- Title: Enabling scalable clinical interpretation of ML-based phenotypes using
real world data
- Title(参考訳): 実世界データを用いたMLに基づく表現型のスケーラブルな臨床的解釈
- Authors: Owen Parsons (1), Nathan E Barlow (1), Janie Baxter (1), Karen
Paraschin (2), Andrea Derix (2), Peter Hein (2), Robert D\"urichen (1) ((1)
Sensyne Health, Oxford, UK, (2) Research and Development, Pharmaceuticals,
Bayer AG, Wuppertal, Germany)
- Abstract要約: 本研究では,大規模なERHデータセットを用いて患者層化分析を行う手法について検討した。
本研究は, 患者層分類結果の臨床的評価と解釈を容易にするためのいくつかのツールを開発した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The availability of large and deep electronic healthcare records (EHR)
datasets has the potential to enable a better understanding of real-world
patient journeys, and to identify novel subgroups of patients. ML-based
aggregation of EHR data is mostly tool-driven, i.e., building on available or
newly developed methods. However, these methods, their input requirements, and,
importantly, resulting output are frequently difficult to interpret, especially
without in-depth data science or statistical training. This endangers the final
step of analysis where an actionable and clinically meaningful interpretation
is needed.This study investigates approaches to perform patient stratification
analysis at scale using large EHR datasets and multiple clustering methods for
clinical research. We have developed several tools to facilitate the clinical
evaluation and interpretation of unsupervised patient stratification results,
namely pattern screening, meta clustering, surrogate modeling, and curation.
These tools can be used at different stages within the analysis. As compared to
a standard analysis approach, we demonstrate the ability to condense results
and optimize analysis time. In the case of meta clustering, we demonstrate that
the number of patient clusters can be reduced from 72 to 3 in one example. In
another stratification result, by using surrogate models, we could quickly
identify that heart failure patients were stratified if blood sodium
measurements were available. As this is a routine measurement performed for all
patients with heart failure, this indicated a data bias. By using further
cohort and feature curation, these patients and other irrelevant features could
be removed to increase the clinical meaningfulness. These examples show the
effectiveness of the proposed methods and we hope to encourage further research
in this field.
- Abstract(参考訳): 大規模で深い電子医療記録(EHR)データセットが利用可能であることは、現実世界の患者旅行をよりよく理解し、患者の新しいサブグループを特定する可能性を秘めている。
MLベースのEHRデータの集約は、主にツール駆動、すなわち、利用可能なあるいは新しく開発されたメソッドに基づいて構築される。
しかし、これらの手法、入力要件、そして重要な結果の出力は、特に深層データ科学や統計的トレーニングなしでは解釈が困難であることが多い。
本研究は,大規模なERHデータセットと複数のクラスタリング手法を用いて,患者層化分析を大規模に実施するためのアプローチについて検討する。
我々は, パターンスクリーニング, メタクラスタリング, 代理モデル, キュレーションなど, 教師なし患者の階層化結果の臨床的評価と解釈を容易にするツールを開発した。
これらのツールは分析のさまざまな段階で使用できる。
標準的な分析手法と比較して、結果を凝縮し分析時間を最適化する能力を示す。
メタクラスタリングの場合、ある例では患者クラスタの数を72から3に削減できることを示した。
別の成層化結果では, 代理モデルを用いて, 血液ナトリウム測定が可能であれば, 心不全患者が成層化されていることを素早く確認することができた。
これは心不全患者全員を対象とした定期的な測定であり,データバイアスが示唆された。
さらなるコホートと特徴キュレーションを用いることで、臨床的意義を高めるために、これらの患者や他の無関係な特徴を除去することができる。
これらの例は,提案手法の有効性を示し,本分野のさらなる研究を奨励したい。
関連論文リスト
- AI Framework for Early Diagnosis of Coronary Artery Disease: An
Integration of Borderline SMOTE, Autoencoders and Convolutional Neural
Networks Approach [0.44998333629984877]
我々は,データのバランスが不均衡でサンプルサイズが小さい場合に,より正確な予測を行うために,データのバランスと拡張のための方法論を開発する。
実験の結果,提案手法の平均精度は95.36であり,ランダムフォレスト(RF),決定木(DT),サポートベクターマシン(SVM),ロジスティック回帰(LR),人工ニューラルネットワーク(ANN)よりも高かった。
論文 参考訳(メタデータ) (2023-08-29T14:33:38Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Enhancing Causal Estimation through Unlabeled Offline Data [7.305019142196583]
患者の診断と治療に強い影響を及ぼす未測定の生理的変数について検討したい。
集中的なオフライン情報は、現在の患者と部分的に関係のある以前の患者についてのみ利用可能である。
提案手法は3段階からなる: (i) 非因果推定器と因果推定器の両方を作成するために、豊富なオフラインデータを使用する。
オフラインデータが新しい観測に部分的にのみ関係している状況において、この手法が(医療的でない)実世界のタスクに対して有効であることを示す。
論文 参考訳(メタデータ) (2022-02-16T07:02:42Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Adversarial Sample Enhanced Domain Adaptation: A Case Study on
Predictive Modeling with Electronic Health Records [57.75125067744978]
ドメイン適応を容易にするデータ拡張手法を提案する。
逆生成したサンプルはドメイン適応時に使用される。
その結果,本手法の有効性とタスクの一般性が確認された。
論文 参考訳(メタデータ) (2021-01-13T03:20:20Z) - Mixture Model Framework for Traumatic Brain Injury Prognosis Using
Heterogeneous Clinical and Outcome Data [3.7363119896212478]
TBIに関連する大きな異種データ型をモデル化する手法を開発する。
このモデルは、人口統計、血液ベースのバイオマーカー、画像検出など、さまざまなデータタイプを含むデータセットでトレーニングされます。
教師なしの学習環境で患者を別々のグループに成層するために使用されます。
論文 参考訳(メタデータ) (2020-12-22T19:31:03Z) - Longitudinal modeling of MS patient trajectories improves predictions of
disability progression [2.117653457384462]
本研究は, 実世界の患者データから情報を最適に抽出する作業に対処する。
本研究では,患者軌跡モデリングに適した機械学習手法を用いることで,患者の障害進行を2年間の地平線で予測できることを示す。
文献で利用可能なモデルと比較して、この研究はMS病の進行予測に最も完全な患者履歴を使用する。
論文 参考訳(メタデータ) (2020-11-09T20:48:00Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Segmentation analysis and the recovery of queuing parameters via the
Wasserstein distance: a study of administrative data for patients with
chronic obstructive pulmonary disease [0.0]
この研究は、慢性閉塞性肺疾患(COPD)患者のリソース要求がどのように変化するかを分析するために、データ駆動型アプローチを用いている。
これは、セグメント化、運用キューイング理論、不完全データからのパラメータの回復という、しばしば異なる分析様式の新たな組み合わせで構成されている。
論文 参考訳(メタデータ) (2020-08-10T17:47:34Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。