論文の概要: GenHPF: General Healthcare Predictive Framework with Multi-task
Multi-source Learning
- arxiv url: http://arxiv.org/abs/2207.09858v3
- Date: Wed, 15 Nov 2023 11:47:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-16 21:15:10.523239
- Title: GenHPF: General Healthcare Predictive Framework with Multi-task
Multi-source Learning
- Title(参考訳): GenHPF:マルチタスクマルチソース学習による一般医療予測フレームワーク
- Authors: Kyunghoon Hur, Jungwoo Oh, Junu Kim, Jiyoun Kim, Min Jae Lee, Eunbyeol
Cho, Seong-Eun Moon, Young-Hak Kim, Louis Atallah, Edward Choi
- Abstract要約: General Healthcare Predictive Framework (GenHPF) は、複数の予測タスクに対して最小限の事前処理を持つ任意の EHR に適用可能である。
我々のフレームワークは、マルチソース学習においてドメイン知識を利用するベースラインモデルよりも大幅に優れています。
- 参考スコア(独自算出の注目度): 9.406539794019581
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the remarkable progress in the development of predictive models for
healthcare, applying these algorithms on a large scale has been challenging.
Algorithms trained on a particular task, based on specific data formats
available in a set of medical records, tend to not generalize well to other
tasks or databases in which the data fields may differ. To address this
challenge, we propose General Healthcare Predictive Framework (GenHPF), which
is applicable to any EHR with minimal preprocessing for multiple prediction
tasks. GenHPF resolves heterogeneity in medical codes and schemas by converting
EHRs into a hierarchical textual representation while incorporating as many
features as possible. To evaluate the efficacy of GenHPF, we conduct multi-task
learning experiments with single-source and multi-source settings, on three
publicly available EHR datasets with different schemas for 12 clinically
meaningful prediction tasks. Our framework significantly outperforms baseline
models that utilize domain knowledge in multi-source learning, improving
average AUROC by 1.2%P in pooled learning and 2.6%P in transfer learning while
also showing comparable results when trained on a single EHR dataset.
Furthermore, we demonstrate that self-supervised pretraining using multi-source
datasets is effective when combined with GenHPF, resulting in a 0.6%P AUROC
improvement compared to models without pretraining. By eliminating the need for
preprocessing and feature engineering, we believe that this work offers a solid
framework for multi-task and multi-source learning that can be leveraged to
speed up the scaling and usage of predictive algorithms in healthcare.
- Abstract(参考訳): 医療のための予測モデルの開発が著しく進んでいるにもかかわらず、これらのアルゴリズムを大規模に適用することは困難である。
特定のタスクで訓練されたアルゴリズムは、一連の医療記録で利用可能な特定のデータ形式に基づいており、データフィールドが異なる可能性のある他のタスクやデータベースにうまく一般化しない傾向にある。
この課題に対処するため、我々は、複数の予測タスクに対して最小限の事前処理を持つ任意の EHR に適用可能な General Healthcare Predictive Framework (GenHPF) を提案する。
GenHPFは、EHRをできるだけ多くの特徴を取り入れつつ階層的なテキスト表現に変換することで、医療コードやスキーマの不均一性を解消する。
GenHPFの有効性を評価するため、臨床に有意な12の予測タスクに対して、異なるスキーマを持つ3つのEHRデータセット上で、シングルソースおよびマルチソース設定を用いたマルチタスク学習実験を行った。
本フレームワークは,マルチソース学習におけるドメイン知識を活用したベースラインモデルよりも優れ,プール学習における平均AUROCの1.2%,トランスファー学習における平均AUROCの2.6%を向上すると同時に,単一のEHRデータセットでトレーニングした場合と同等の結果を示す。
さらに,GenHPFと組み合わせた場合,マルチソースデータセットを用いた自己教師付き事前トレーニングが有効であることを示し,事前トレーニングのないモデルと比較して0.6%のAUROC改善が得られた。
事前処理と機能エンジニアリングの必要性を排除することで、この作業は、医療における予測アルゴリズムのスケーリングと利用をスピードアップするために活用できる、マルチタスクおよびマルチソース学習のための堅実なフレームワークを提供すると信じています。
関連論文リスト
- MEDS-Tab: Automated tabularization and baseline methods for MEDS datasets [2.8209943093430443]
この作業は、MEDSフレームワークによるコアデータ標準化の補完的な進歩によって実現されている。
我々は、不規則にサンプリングされた時系列データを著しく単純化し、加速する。
このシステムは、多様なデータセットと臨床設定にわたる健康問題に対する強力なMLソリューションの開発において、信頼性、スケーラビリティ、容易性を大幅に向上する。
論文 参考訳(メタデータ) (2024-10-31T20:36:37Z) - Automated Multi-Task Learning for Joint Disease Prediction on Electronic Health Records [4.159498069487535]
本稿では,タスクグループとアーキテクチャの最適構成を同時に検索できるAutoDPという自動手法を提案する。
ハンドクラフトと自動化された最先端の手法の両方に対して大幅な性能向上を実現し、同時に検索コストを同時に維持する。
論文 参考訳(メタデータ) (2024-03-06T22:32:48Z) - Predicting Infant Brain Connectivity with Federated Multi-Trajectory
GNNs using Scarce Data [54.55126643084341]
既存のディープラーニングソリューションには,3つの大きな制限がある。
我々はフェデレートグラフベースの多軌道進化ネットワークであるFedGmTE-Net++を紹介する。
フェデレーションの力を利用して、限られたデータセットを持つ多種多様な病院の地域学習を集約する。
論文 参考訳(メタデータ) (2024-01-01T10:20:01Z) - Learnable Weight Initialization for Volumetric Medical Image Segmentation [66.3030435676252]
本稿では,学習可能な重みに基づくハイブリッド医療画像セグメンテーション手法を提案する。
我々のアプローチはどんなハイブリッドモデルにも簡単に統合でき、外部のトレーニングデータを必要としない。
多臓器・肺がんセグメンテーションタスクの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-06-15T17:55:05Z) - Time Associated Meta Learning for Clinical Prediction [78.99422473394029]
本稿では,時間関連メタラーニング(TAML)手法を提案する。
タスク分割後のスパーシリティ問題に対処するため、TAMLは時間情報共有戦略を採用し、正のサンプル数を増やす。
複数の臨床データセットに対するTAMLの有効性を示す。
論文 参考訳(メタデータ) (2023-03-05T03:54:54Z) - Active learning using adaptable task-based prioritisation [7.0002224852386545]
我々は,バッチモードのアクティブ学習のように,バッチ列内の画像の優先度を測定するコントローラニューラルネットワークを開発した。
メタ強化学習アルゴリズムは複数のMDPを用いて提案され、事前学習したコントローラを新しいMDPに適応させることができる。
提案法により, 腎臓の新しい分類のセグメンテーション精度が向上することが示唆された。
論文 参考訳(メタデータ) (2022-12-03T22:37:38Z) - Unsupervised Pre-Training on Patient Population Graphs for Patient-Level
Predictions [48.02011627390706]
プレトレーニングは、コンピュータビジョン(CV)、自然言語処理(NLP)、医療画像など、機械学習のさまざまな分野で成功している。
本稿では,患者結果の予測のために,教師なし事前学習を異種マルチモーダルEHRデータに適用する。
提案手法は,人口レベルでのデータモデリングに有効であることがわかった。
論文 参考訳(メタデータ) (2022-03-23T17:59:45Z) - Pre-training transformer-based framework on large-scale pediatric claims
data for downstream population-specific tasks [3.1580072841682734]
本研究は、小児科のクレームデータセット全体をトレーニングする一般的な事前学習モデルであるClaim Pre-Training(Claim-PT)フレームワークを提案する。
効果的な知識伝達はタスク対応微調整段階を通じて完了する。
我々は100万人以上の患者記録を持つ実世界のクレームデータセットの実験を行った。
論文 参考訳(メタデータ) (2021-06-24T15:25:41Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。