論文の概要: PORTER: Language-Grounded Event Representations for Portable Structured EHR Foundation Models
- arxiv url: http://arxiv.org/abs/2606.24102v1
- Date: Tue, 23 Jun 2026 03:33:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.756299
- Title: PORTER: Language-Grounded Event Representations for Portable Structured EHR Foundation Models
- Title(参考訳): Porter: 可搬型構造化EHRファンデーションモデルのための言語周囲のイベント表現
- Authors: Lin Lawrence Guo, Adam Paul Yan, Emily Vettese, Lillian Sung,
- Abstract要約: 固定語彙からイベント表現を分離する構造付きEHR基盤モデルである PortER を導入する。
ポーターは、凍結したテキストエンコーダを使用して記述を通じてイベントを表現し、専用の経路を通じて数値値を統合し、患者のタイムラインを通して臨床力学を学ぶ。
ポーターはタスク固有のテキストシリアライゼーションよりも高いAUROCを実現し、329倍のアモルティフィケーション計算を実現した。
- 参考スコア(独自算出の注目度): 0.27998963147546146
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Most electronic health record (EHR) foundation models encode clinical events as discrete event tokens from a fixed vocabulary and therefore cannot directly represent events containing unseen concepts or new combinations of concepts and attributes such as numeric values. This limits transfer across institutions and even across deployment pipelines within the same institution. We introduce PORTER, a language-grounded structured EHR foundation model that decouples event representation from this fixed vocabulary. PORTER represents events through their descriptions using a frozen text encoder, integrates numeric values through a dedicated pathway, and learns clinical dynamics over patient timelines with an autoregressively pretrained temporal backbone. Across 74 clinical prediction tasks at a pediatric hospital, PORTER matched the mean AUROC of a fixed-vocabulary model with the same temporal backbone and pretraining objective. When the same patient timelines were rendered using event descriptions not seen during pretraining, PORTER transferred without retraining or vocabulary mapping, recovering 97.1% of the mean AUROC of a model trained directly on the target vocabulary. When transferred to MIMIC, PORTER outperformed the fixed-vocabulary model, which dropped 69% of events because their tokens were unseen. Mechanistic analyses showed cross-vocabulary transfer tracked preservation of patient-level representation geometry rather than the scale of the text encoder, and the numeric pathway improved sensitivity to magnitude without disrupting clinical concept identity. PORTER also achieved higher AUROC than a task-specific text serialization comparator, at 329-fold lower amortized compute. PORTER is a step toward vocabulary-independent EHR foundation models that reduce the need for vocabulary harmonization while preserving in-domain performance and enabling efficient cross-task reuse.
- Abstract(参考訳): ほとんどの電子健康記録(EHR)基盤モデルは、臨床イベントを固定された語彙から離散的なイベントトークンとしてエンコードするので、目に見えない概念や数値のような新しい概念と属性の組み合わせを含むイベントを直接表現することはできない。
これにより、機関間の移動や、同じ機関内のデプロイメントパイプライン間の移動が制限される。
本稿では,この固定語彙からイベント表現を分離する言語基底構造EHR基盤モデルである PortER を紹介する。
PortERは、凍結したテキストエンコーダを使用して記述を通じてイベントを表現し、専用の経路を通じて数値値を統合し、自己回帰的に事前訓練された側頭骨で患者のタイムライン上で臨床力学を学習する。
小児病院における74件の臨床予知課題のうち, Porter は, 時間的バックボーンと事前訓練目的の固定語彙モデルの AUROC の平均値と一致した。
プレトレーニング中に見られないイベント記述を用いて、同じ患者タイムラインが作成されると、Porterはリトレーニングや語彙マッピングなしで移行し、ターゲット語彙上で直接訓練されたモデルの平均AUROCの97.1%を回復した。
MIMICに移行したとき、Porterは固定語彙モデルよりも優れており、トークンが見えないために69%のイベントが減少した。
メカニカル分析では,テキストエンコーダのスケールよりも患者レベルの表現の保存がクロスボキャブラリ転送によって追跡され,臨床概念のアイデンティティを損なうことなく,数値経路の精度が向上した。
Porterはまた、タスク固有のテキストシリアライズコンパレータよりもAUROCを329倍低いアモルティゼーション計算で達成した。
PortER は語彙に依存しない EHR ファンデーションモデルへのステップであり、ドメイン内のパフォーマンスを維持しながら語彙調和の必要性を低減し、効率的なクロスタスクの再利用を可能にする。
関連論文リスト
- Something from Nothing: Data Augmentation for Robust Severity Level Estimation of Dysarthric Speech [69.86604856129883]
外科的音声品質評価(DSQA)は臨床診断と包括的音声技術において重要である。
本研究では,未ラベルの変形音声と大規模典型的な音声データセットを併用した3段階のフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-16T23:00:07Z) - Tokenization Tradeoffs in Structured EHR Foundation Models [0.23453441553817042]
トークン化は、どの情報が保存され、どれだけ効率的にエンコードされ、どの関係が事前に計算されなければならないかを決定する。
ここでは、事象エンコーディング、時間エンコーディング、ワークフローアノテーションに沿ったトークン化の異なる要因設計の下で、小児のERHデータにトランスフォーマーを事前学習した。
共同イベントエンコーディングと位置時間エンコーディングは、それぞれ39.5%と9.6%の事前訓練浮動小数点演算を減らした。
論文 参考訳(メタデータ) (2026-03-03T22:48:39Z) - Serialized EHR make for good text representations [1.585843510099207]
SerialBEHRTはSciBERTを拡張したドメイン整列基盤モデルである。
我々は, 抗生物質感受性予測の課題において, その効果を評価した。
論文 参考訳(メタデータ) (2025-10-11T17:16:15Z) - Reading Between the Lines: Combining Pause Dynamics and Semantic Coherence for Automated Assessment of Thought Disorder [8.239710313549466]
本研究では,ポーズ機能と3つのデータセット間のセマンティックコヒーレンスメトリクスを統合する。
重要な発見は、停止機能だけで形式的思考障害(FTD)の重症度を確実に予測できることである。
これらの結果から,時間的分析と意味的分析を組み合わせたフレームワークが,非編成音声の評価を洗練するためのロードマップを提供する可能性が示唆された。
論文 参考訳(メタデータ) (2025-07-17T22:00:16Z) - Leveraging large language models and traditional machine learning ensembles for ADHD detection from narrative transcripts [6.55440666066668]
本稿では,物語の書き起こしを用いたADHD診断(バイナリ)の自動分類のためのアンサンブルフレームワークを提案する。
LLaMA3、RoBERTa、SVM(Support Vector Machine)の3つの補完モデルを統合する。
実験の結果、アンサンブルは個々のモデルよりも優れていた。
論文 参考訳(メタデータ) (2025-05-27T15:22:01Z) - Temporal Entailment Pretraining for Clinical Language Models over EHR Data [9.584923572354045]
臨床領域における言語モデルのための新しい時間的包含事前学習目標を提案する。
本手法は, EHRセグメントを時間的に順序付けられた文対として定式化し, 後の状態が先行状態に関係しているか, 矛盾しているか, 中立であるかを決定するようモデルを訓練する。
論文 参考訳(メタデータ) (2025-04-25T07:30:38Z) - REBORN: Reinforcement-Learned Boundary Segmentation with Iterative Training for Unsupervised ASR [54.64158282822995]
教師なしASRにおける反復訓練を用いたREBORN, Reinforcement-Learned boundaryを提案する。
ReBORNは、音声信号におけるセグメント構造の境界を予測するセグメンテーションモデルのトレーニングと、セグメンテーションモデルによってセグメント化された音声特徴である音素予測モデルのトレーニングを交互に行い、音素転写を予測する。
我々は、広範囲にわたる実験を行い、同じ条件下で、REBORNは、LibriSpeech、TIMIT、および5つの非英語言語において、以前の教師なしASRモデルよりも優れていることを発見した。
論文 参考訳(メタデータ) (2024-02-06T13:26:19Z) - Learning to Exploit Temporal Structure for Biomedical Vision-Language
Processing [53.89917396428747]
視覚言語処理における自己教師あり学習は、画像とテキストのモダリティのセマンティックアライメントを利用する。
トレーニングと微調整の両方で利用できる場合、事前のイメージとレポートを明示的に説明します。
我々のアプローチはBioViL-Tと呼ばれ、テキストモデルと共同で訓練されたCNN-Transformerハイブリッドマルチイメージエンコーダを使用する。
論文 参考訳(メタデータ) (2023-01-11T16:35:33Z) - CROP: Zero-shot Cross-lingual Named Entity Recognition with Multilingual
Labeled Sequence Translation [113.99145386490639]
言語間NERは、整列した言語間表現や機械翻訳結果を通じて、言語間で知識を伝達することができる。
ゼロショット言語間NERを実現するために,クロスランガル・エンティティ・プロジェクション・フレームワーク(CROP)を提案する。
多言語ラベル付きシーケンス翻訳モデルを用いて、タグ付けされたシーケンスをターゲット言語に投影し、ターゲットの原文にラベル付けする。
論文 参考訳(メタデータ) (2022-10-13T13:32:36Z) - Bridging the Gap between Language Models and Cross-Lingual Sequence
Labeling [101.74165219364264]
大規模言語間事前学習言語モデル (xPLM) は、言語間シーケンスラベリングタスクにおいて有効であることを示す。
大きな成功にもかかわらず、事前学習と微調整の段階の間には訓練対象のギャップがあるという経験的観察を描いている。
本稿では,まず,言語間インフォーマティブ・スパン・マスキング(CLISM)と呼ばれるxSLのための事前学習タスクを設計し,目的のギャップを解消する。
第2に、コントラスト学習を利用して入力並列表現間の一貫性を促進するContrAstive-Consistency Regularization (CACR)を提案する。
論文 参考訳(メタデータ) (2022-04-11T15:55:20Z) - Unsupervised Paraphrasing with Pretrained Language Models [85.03373221588707]
教師なし環境で,事前学習した言語モデルを用いて高品質なパラフレーズを生成する訓練パイプラインを提案する。
提案手法は,タスク適応,自己スーパービジョン,動的ブロッキング(Dynamic Blocking)という新しい復号アルゴリズムから構成される。
提案手法は,Quora Question PairとParaNMTの両方のデータセット上で,最先端の性能を達成できることを示す。
論文 参考訳(メタデータ) (2020-10-24T11:55:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。