論文の概要: Self-Supervised Time-to-Event Modeling with Structured Medical Records
- arxiv url: http://arxiv.org/abs/2301.03150v2
- Date: Fri, 23 Jun 2023 04:11:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-26 17:24:06.888052
- Title: Self-Supervised Time-to-Event Modeling with Structured Medical Records
- Title(参考訳): 構造化医療記録を用いた自己教師付き時間-イベントモデリング
- Authors: Ethan Steinberg, Yizhe Xu, Jason Fries, Nigam Shah
- Abstract要約: TTEモデル(Time-to-event Model)は、特定の事象が起こるまでの時間確率分布を推定するために医学やその他の分野で用いられる。
TTEモデルは、固定時間地平線を用いた分類よりも多くの利点を提供するが、より多くのパラメータを必要とし、ラベル付きデータによるトレーニングを困難にしている。
本稿では,これらの課題を,時系列イベントのコレクションに見られる時間構造を利用した自己教師型モデルMOTOR(Many Outcome Time Oriented Representations)を用いて解決する。
- 参考スコア(独自算出の注目度): 3.301741845583689
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Time-to-event (TTE) models are used in medicine and other fields for
estimating the probability distribution of the time until a specific event
occurs. TTE models provide many advantages over classification using fixed time
horizons, including naturally handling censored observations, but require more
parameters and are challenging to train in settings with limited labeled data.
Existing approaches, e.g. proportional hazards or accelerated failure time,
employ distributional assumptions to reduce parameters but are vulnerable to
model misspecification. In this work, we address these challenges with MOTOR
(Many Outcome Time Oriented Representations), a self-supervised model that
leverages temporal structure found in collections of timestamped events in
electronic health records (EHR) and health insurance claims. MOTOR uses a TTE
pretraining objective that predicts the probability distribution of times when
events occur, making it well-suited to transfer learning for medical prediction
tasks. Having pretrained on EHR and claims data of up to 55M patient records
(9B clinical events), we evaluate performance after finetuning for 19 tasks
across two datasets. Task-specific models built using MOTOR improve
time-dependent C statistics by 4.6% over state-of-the-art while greatly
improving sample efficiency, achieving comparable performance to existing
methods using only 5% of available task data.
- Abstract(参考訳): TTEモデル(Time-to-event Model)は、特定の事象が起こるまでの時間確率分布を推定するために医学やその他の分野で用いられる。
TTEモデルは、自然に検閲された観測を取り扱うなど、固定時間地平線を用いた分類よりも多くの利点を提供するが、より多くのパラメータが必要であり、ラベル付きデータを限定した環境でのトレーニングは困難である。
既存のアプローチ、例えば比例ハザードや障害時間の加速は、パラメータを減らすために分散仮定を採用するが、モデルの誤特定に弱い。
本研究は、電子健康記録(EHR)および健康保険請求におけるタイムスタンプイベントのコレクションに見られる時間構造を利用した自己管理モデルMOTOR(Many Outcome Time Oriented Representations)を用いて、これらの課題に対処する。
MOTORは、イベント発生時の確率分布を予測するTTE事前学習目標を使用しており、医学的な予測タスクのために学習を伝達するのに適している。
EHRで事前訓練し,最大5500万件の患者記録(9B臨床イベント)を請求し,2つのデータセットにまたがる19のタスクの微調整後のパフォーマンスを評価した。
MOTORを使用して構築されたタスク固有モデルは、最先端のC統計を4.6%改善し、サンプル効率を大幅に改善し、利用可能なタスクデータの5%しか使用せずに既存のメソッドに匹敵するパフォーマンスを実現した。
関連論文リスト
- GIFT-Eval: A Benchmark For General Time Series Forecasting Model Evaluation [90.53485251837235]
時系列基礎モデルはゼロショット予測に優れ、明示的なトレーニングなしで多様なタスクを処理する。
GIFT-Evalは、多様なデータセットに対する評価を促進するための先駆的なベンチマークである。
GIFT-Evalには、144,000の時系列と17700万のデータポイントの23のデータセットが含まれている。
論文 参考訳(メタデータ) (2024-10-14T11:29:38Z) - Towards a Theoretical Understanding of Memorization in Diffusion Models [76.85077961718875]
拡散確率モデル(DPM)は、生成人工知能(GenAI)の主流モデルとして採用されている。
モデル収束を前提とした条件付きおよび非条件付きDPMにおける記憶の理論的理解を提供する。
本研究では、生成されたデータに基づいて訓練された時間依存型分類器を代理条件として利用し、無条件DPMからトレーニングデータを抽出する、textbfSurrogate condItional Data extract (SIDE) という新しいデータ抽出手法を提案する。
論文 参考訳(メタデータ) (2024-10-03T13:17:06Z) - Modeling IoT Traffic Patterns: Insights from a Statistical Analysis of an MTC Dataset [1.2289361708127877]
IoT(Internet-of-Things)は急速に拡大し、多くのデバイスを接続し、私たちの日常生活に不可欠なものになっています。
効果的なIoTトラフィック管理には、マシン型通信(MTC)のモデリングと予測が必要である。
我々は、Kolmogorov-Smirnov、Anderson-Darling、chi-squared、ルート平均二乗誤差などの確立されたテストを含む、適合性テストを用いたMCCトラフィックの包括的統計分析を行う。
論文 参考訳(メタデータ) (2024-09-03T14:24:18Z) - Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - Towards a clinically accessible radiology foundation model: open-access and lightweight, with automated evaluation [113.5002649181103]
オープンソースの小型マルチモーダルモデル(SMM)を訓練し、放射線学における未測定臨床ニーズに対する能力ギャップを埋める。
トレーニングのために,697万以上の画像テキストペアからなる大規模なデータセットを組み立てる。
評価のために,GPT-4に基づく実測値CheXpromptを提案する。
LlaVA-Radの推論は高速で、単一のV100 GPU上でプライベート設定で実行できる。
論文 参考訳(メタデータ) (2024-03-12T18:12:02Z) - Task-customized Masked AutoEncoder via Mixture of Cluster-conditional
Experts [104.9871176044644]
Masked Autoencoder (MAE) は,モデル事前学習において有望な結果が得られる自己教師型学習手法である。
我々は、新しいMAEベースの事前学習パラダイム、Mixture of Cluster-conditional Experts (MoCE)を提案する。
MoCEは、クラスタ条件ゲートを使用して、各専門家にセマンティックなイメージのみをトレーニングする。
論文 参考訳(メタデータ) (2024-02-08T03:46:32Z) - Forecasting Emergency Department Crowding with Advanced Machine Learning
Models and Multivariable Input [8.294560133196807]
救急部門(ED)の混雑は患者の安全にとって重大な脅威であり、死亡率の上昇と繰り返し関連付けられている。
1)高度な機械学習モデル(ML)の急激な流入により予測モデルが時代遅れになったこと,2)多変量入力データが制限されたこと,3)個別のパフォーマンス指標が報告されることは稀である。
我々は、N-BEATSとLightGBMがそれぞれ11%と9%の改善率でベンチマークを上回り、DeepARは翌日のAUCが0.76(95 % CI 0.69-0.84)になると予測していることを示す。
論文 参考訳(メタデータ) (2023-08-31T08:34:20Z) - EHRSHOT: An EHR Benchmark for Few-Shot Evaluation of Foundation Models [6.506937003687058]
スタンフォード大学の6,739人の患者の電子健康記録(EHRs)から構造化されたデータを含む新しいデータセット EHRSHOT を公表した。
第2に,257万症例のERHデータに基づいて事前訓練した141Mパラメータ臨床基盤モデルであるCLMBR-T-baseの重みを公表した。
第3に、15の臨床的予測タスクを定義し、サンプル効率やタスク適応などの利点に基づく基礎モデルの評価を可能にする。
論文 参考訳(メタデータ) (2023-07-05T05:24:59Z) - Federated Learning of Medical Concepts Embedding using BEHRT [0.0]
医療概念の埋め込み学習のための連合学習手法を提案する。
我々のアプローチは、EHRのディープニューラルネットワークモデルであるBEHRTのような埋め込みモデルに基づいている。
我々は、FLで訓練されたモデルと集中型データで訓練されたモデルのパフォーマンスを比較した。
論文 参考訳(メタデータ) (2023-05-22T14:05:39Z) - Unsupervised Pre-Training on Patient Population Graphs for Patient-Level
Predictions [48.02011627390706]
プレトレーニングは、コンピュータビジョン(CV)、自然言語処理(NLP)、医療画像など、機械学習のさまざまな分野で成功している。
本稿では,患者結果の予測のために,教師なし事前学習を異種マルチモーダルEHRデータに適用する。
提案手法は,人口レベルでのデータモデリングに有効であることがわかった。
論文 参考訳(メタデータ) (2022-03-23T17:59:45Z) - Pre-training transformer-based framework on large-scale pediatric claims
data for downstream population-specific tasks [3.1580072841682734]
本研究は、小児科のクレームデータセット全体をトレーニングする一般的な事前学習モデルであるClaim Pre-Training(Claim-PT)フレームワークを提案する。
効果的な知識伝達はタスク対応微調整段階を通じて完了する。
我々は100万人以上の患者記録を持つ実世界のクレームデータセットの実験を行った。
論文 参考訳(メタデータ) (2021-06-24T15:25:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。