論文の概要: MOTOR: A Time-To-Event Foundation Model For Structured Medical Records
- arxiv url: http://arxiv.org/abs/2301.03150v4
- Date: Tue, 5 Dec 2023 00:24:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-06 20:31:31.637499
- Title: MOTOR: A Time-To-Event Foundation Model For Structured Medical Records
- Title(参考訳): motor: 構造化医療記録のためのイベントファウンデーションモデル
- Authors: Ethan Steinberg, Jason Fries, Yizhe Xu, Nigam Shah
- Abstract要約: 我々はMOTOR(Many Outcome Time Oriented Representations)と呼ばれるTTE基盤モデルを提案する。
TTEモデルは、特定の事象が起こるまでの時間の確率分布を推定するために使用される。
最大5500万件の患者記録(9億件の臨床イベント)を事前トレーニングすることで、この課題に対処する。
- 参考スコア(独自算出の注目度): 4.773344142823636
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a self-supervised, time-to-event (TTE) foundation model called
MOTOR (Many Outcome Time Oriented Representations) which is pretrained on
timestamped sequences of events in electronic health records (EHR) and health
insurance claims. TTE models are used for estimating the probability
distribution of the time until a specific event occurs, which is an important
task in medical settings. TTE models provide many advantages over
classification using fixed time horizons, including naturally handling censored
observations, but are challenging to train with limited labeled data. MOTOR
addresses this challenge by pretraining on up to 55M patient records (9B
clinical events). We evaluate MOTOR's transfer learning performance on 19
tasks, across 3 patient databases (a private EHR system, MIMIC-IV, and Merative
claims data). Task-specific models adapted from MOTOR improve time-dependent C
statistics by 4.6% over state-of-the-art, improve label efficiency by up to 95%
,and are more robust to temporal distributional shifts. We further evaluate
cross-site portability by adapting our MOTOR foundation model for six
prediction tasks on the MIMIC-IV dataset, where it outperforms all baselines.
MOTOR is the first foundation model for medical TTE predictions and we release
a 143M parameter pretrained model for research use at [redacted URL].
- Abstract(参考訳): 電子健康記録(EHR)および健康保険請求における事象の時系列を事前学習したMOTOR(Many Outcome Time Oriented Representations)と呼ばれる,自己監督型TTE基盤モデルを提案する。
tteモデルは特定の事象が起こるまでの時間の確率分布を推定するために使用され、医療現場では重要なタスクである。
TTEモデルは、自然に検閲された観測データを扱うなど、固定時間地平線を用いた分類よりも多くの利点を提供するが、ラベル付きデータで訓練することは困難である。
MOTORはこの課題に対処するため、最大55万件の患者記録(9B臨床イベント)を事前トレーニングする。
3つの患者データベース(プライベートEHRシステム,MIMIC-IV,Merativeクレームデータ)を対象に,MOTORの移動学習性能を評価した。
MOTORから適応されたタスク固有モデルは、最先端のC統計を4.6%改善し、ラベル効率を最大95%改善し、時間分布シフトに対してより堅牢である。
さらに、MIMIC-IVデータセット上の6つの予測タスクに対してMOTOR基盤モデルを適用することで、クロスサイトポータビリティを評価する。
MOTORは医学的TTE予測のための最初の基礎モデルであり、[reacted URL]での研究用の143Mパラメータ事前トレーニングモデルをリリースする。
関連論文リスト
- GIFT-Eval: A Benchmark For General Time Series Forecasting Model Evaluation [90.53485251837235]
時系列基礎モデルはゼロショット予測に優れ、明示的なトレーニングなしで多様なタスクを処理する。
GIFT-Evalは、多様なデータセットに対する評価を促進するための先駆的なベンチマークである。
GIFT-Evalには、144,000の時系列と17700万のデータポイントの23のデータセットが含まれている。
論文 参考訳(メタデータ) (2024-10-14T11:29:38Z) - Towards a Theoretical Understanding of Memorization in Diffusion Models [76.85077961718875]
拡散確率モデル(DPM)は、生成人工知能(GenAI)の主流モデルとして採用されている。
モデル収束を前提とした条件付きおよび非条件付きDPMにおける記憶の理論的理解を提供する。
本研究では、生成されたデータに基づいて訓練された時間依存型分類器を代理条件として利用し、無条件DPMからトレーニングデータを抽出する、textbfSurrogate condItional Data extract (SIDE) という新しいデータ抽出手法を提案する。
論文 参考訳(メタデータ) (2024-10-03T13:17:06Z) - Modeling IoT Traffic Patterns: Insights from a Statistical Analysis of an MTC Dataset [1.2289361708127877]
IoT(Internet-of-Things)は急速に拡大し、多くのデバイスを接続し、私たちの日常生活に不可欠なものになっています。
効果的なIoTトラフィック管理には、マシン型通信(MTC)のモデリングと予測が必要である。
我々は、Kolmogorov-Smirnov、Anderson-Darling、chi-squared、ルート平均二乗誤差などの確立されたテストを含む、適合性テストを用いたMCCトラフィックの包括的統計分析を行う。
論文 参考訳(メタデータ) (2024-09-03T14:24:18Z) - Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - Towards a clinically accessible radiology foundation model: open-access and lightweight, with automated evaluation [113.5002649181103]
オープンソースの小型マルチモーダルモデル(SMM)を訓練し、放射線学における未測定臨床ニーズに対する能力ギャップを埋める。
トレーニングのために,697万以上の画像テキストペアからなる大規模なデータセットを組み立てる。
評価のために,GPT-4に基づく実測値CheXpromptを提案する。
LlaVA-Radの推論は高速で、単一のV100 GPU上でプライベート設定で実行できる。
論文 参考訳(メタデータ) (2024-03-12T18:12:02Z) - Task-customized Masked AutoEncoder via Mixture of Cluster-conditional
Experts [104.9871176044644]
Masked Autoencoder (MAE) は,モデル事前学習において有望な結果が得られる自己教師型学習手法である。
我々は、新しいMAEベースの事前学習パラダイム、Mixture of Cluster-conditional Experts (MoCE)を提案する。
MoCEは、クラスタ条件ゲートを使用して、各専門家にセマンティックなイメージのみをトレーニングする。
論文 参考訳(メタデータ) (2024-02-08T03:46:32Z) - Forecasting Emergency Department Crowding with Advanced Machine Learning
Models and Multivariable Input [8.294560133196807]
救急部門(ED)の混雑は患者の安全にとって重大な脅威であり、死亡率の上昇と繰り返し関連付けられている。
1)高度な機械学習モデル(ML)の急激な流入により予測モデルが時代遅れになったこと,2)多変量入力データが制限されたこと,3)個別のパフォーマンス指標が報告されることは稀である。
我々は、N-BEATSとLightGBMがそれぞれ11%と9%の改善率でベンチマークを上回り、DeepARは翌日のAUCが0.76(95 % CI 0.69-0.84)になると予測していることを示す。
論文 参考訳(メタデータ) (2023-08-31T08:34:20Z) - EHRSHOT: An EHR Benchmark for Few-Shot Evaluation of Foundation Models [6.506937003687058]
スタンフォード大学の6,739人の患者の電子健康記録(EHRs)から構造化されたデータを含む新しいデータセット EHRSHOT を公表した。
第2に,257万症例のERHデータに基づいて事前訓練した141Mパラメータ臨床基盤モデルであるCLMBR-T-baseの重みを公表した。
第3に、15の臨床的予測タスクを定義し、サンプル効率やタスク適応などの利点に基づく基礎モデルの評価を可能にする。
論文 参考訳(メタデータ) (2023-07-05T05:24:59Z) - Federated Learning of Medical Concepts Embedding using BEHRT [0.0]
医療概念の埋め込み学習のための連合学習手法を提案する。
我々のアプローチは、EHRのディープニューラルネットワークモデルであるBEHRTのような埋め込みモデルに基づいている。
我々は、FLで訓練されたモデルと集中型データで訓練されたモデルのパフォーマンスを比較した。
論文 参考訳(メタデータ) (2023-05-22T14:05:39Z) - Unsupervised Pre-Training on Patient Population Graphs for Patient-Level
Predictions [48.02011627390706]
プレトレーニングは、コンピュータビジョン(CV)、自然言語処理(NLP)、医療画像など、機械学習のさまざまな分野で成功している。
本稿では,患者結果の予測のために,教師なし事前学習を異種マルチモーダルEHRデータに適用する。
提案手法は,人口レベルでのデータモデリングに有効であることがわかった。
論文 参考訳(メタデータ) (2022-03-23T17:59:45Z) - Pre-training transformer-based framework on large-scale pediatric claims
data for downstream population-specific tasks [3.1580072841682734]
本研究は、小児科のクレームデータセット全体をトレーニングする一般的な事前学習モデルであるClaim Pre-Training(Claim-PT)フレームワークを提案する。
効果的な知識伝達はタスク対応微調整段階を通じて完了する。
我々は100万人以上の患者記録を持つ実世界のクレームデータセットの実験を行った。
論文 参考訳(メタデータ) (2021-06-24T15:25:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。