論文の概要: Hierarchical Modeling of ICD Codes in EHR Foundation Models
- arxiv url: http://arxiv.org/abs/2606.15447v1
- Date: Sat, 13 Jun 2026 19:40:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:33.578175
- Title: Hierarchical Modeling of ICD Codes in EHR Foundation Models
- Title(参考訳): EHRファンデーションモデルにおけるICD符号の階層的モデリング
- Authors: Megha Thukral, Dong Gyun Kang, Rudra Pratap Singh, Shruthi Kashinath Hiremath, Katrin Hänsel, Thomas Plötz,
- Abstract要約: ICD-10-CM階層を臨床表現学習の一般的な帰納バイアスとして検討した。
ICD階層を明示的に符号化することで、ドメイン内およびデータセット間の両方でフラットなコード表現が向上することを示す。
- 参考スコア(独自算出の注目度): 0.8620335948752808
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Electronic health record foundation models typically treat ICD diagnosis codes as flat tokens, overlooking the clinically meaningful hierarchical structure that captures disease families, subcategories, and fine-grained diagnostic detail. As a result, existing EHR representation learning methods do not explicitly exploit the hierarchical structure already present in the coding system. In this work, we study ICD-10-CM hierarchy as a general inductive bias for clinical representation learning. We investigate two complementary mechanisms for incorporating hierarchy: first, by augmenting diagnosis sequences in a BERT-style transformer with tokens corresponding to different levels of the ICD hierarchy, and second, by injecting hierarchy into graph-based code representations through hierarchy-aware edges combined with diagnosis co-occurrence structure. Across these settings, we evaluate whether explicit hierarchy improves downstream prediction, which levels of the hierarchy are most useful, whether hierarchy encoding improves transfer across datasets, and how hierarchy reshapes embedding similarity structure. We conduct experiments on two large-scale real-world clinical datasets: MIMIC-IV, used for pretraining and in-domain evaluation, and eICU, used to assess cross-dataset transfer via frozen encoder probing. Our findings show that explicitly encoding ICD hierarchy improves over flat code representations in both in-domain and cross-dataset settings, while revealing that the most useful level of hierarchy depends on both the task and the modeling approach. More broadly, we focus on hierarchy-aware EHR representation learning and show that the benefits of encoding hierarchy are generalizable across modeling settings and hierarchy levels.
- Abstract(参考訳): 電子健康記録基礎モデルは、通常、ICDの診断コードを平らなトークンとして扱い、病気の家族、サブカテゴリ、そしてきめ細かい診断の詳細を捉える臨床的に意味のある階層構造を見渡す。
その結果、既存の EHR 表現学習手法は、符号化システムにすでに存在する階層構造を明示的に利用していない。
本研究では,ICD-10-CM階層を臨床表現学習の一般的な帰納バイアスとして検討する。
まず,ICD階層の異なるレベルに対応するトークンを持つBERT型トランスフォーマーの診断シーケンスを増大させ,次に,階層認識エッジと診断共起構造を組み合わせたグラフベースのコード表現に階層を注入することにより,階層を組み込む2つの補完メカニズムについて検討する。
これらの設定を通じて、明示的な階層構造が下流予測を改善するか、階層のどのレベルが最も有用か、階層符号化がデータセット間の転送を改善するか、階層構造が類似性構造を埋め込むかを評価する。
実世界の大規模臨床データセットであるMIMIC-IV(事前トレーニングとドメイン内評価)と,凍結エンコーダによるクロスデータセット転送を評価するeICU(eICU)について実験を行った。
本研究は,ICD階層を明示的に符号化することで,ドメイン内およびデータセット間におけるフラットなコード表現よりも向上し,最も有用な階層構造はタスクとモデリングアプローチの両方に依存することを示した。
より広範に、階層を意識したEHR表現学習に焦点をあて、符号化階層の利点が、モデリング設定と階層レベルにまたがって一般化可能であることを示す。
関連論文リスト
- Online Continual Learning with Dynamic Label Hierarchies [72.33335166136045]
粒度をまたいで重大度が進化する新しい問題設定であるDHOCLを導入し,各サンプルは単一階層レベルでの監視を行う。
i) 混合粒度の部分的監視は、塑性を制約し、階層間のセマンティック一貫性を損なう、進化するパスワイド階層上のポイントワイド信号のみを提供する。
本稿では,相補的分類を適応的に組み合わせ,学習可能な階層型プロトタイプによって正規化し,素早い適応,階層的整合性,構造的知識の統合を可能にするHALOを提案する。
論文 参考訳(メタデータ) (2026-05-12T08:20:23Z) - Feature Identification for Hierarchical Contrastive Learning [7.655211354400059]
本稿では,2つの新しい階層型コントラスト学習法を提案する。
提案手法は,階層レベルのクラス間関係と不均衡なクラス分布を明示的にモデル化する。
提案手法は,線形評価における最先端性能を実現し,既存の階層的コントラスト学習法を精度で2ポイント向上させる。
論文 参考訳(メタデータ) (2025-10-01T12:46:47Z) - Deep Taxonomic Networks for Unsupervised Hierarchical Prototype Discovery [5.300910554558862]
既存の手法は、しばしば構造をクラスの数に結び付け、中間階層レベルで利用可能なリッチなプロトタイプ情報を未利用にする。
我々はこれらのギャップを埋めるために設計された新しい潜伏変数アプローチであるDeep Taxonomic Networkを導入する。
論文 参考訳(メタデータ) (2025-09-28T03:13:32Z) - Hierarchical knowledge guided fault intensity diagnosis of complex industrial systems [9.830457900441939]
本稿では,階層的知識に基づく断層強度診断フレームワーク(HKG)を提案する。
HKGはグラフ畳み込みネットワークを用いて、クラス表現の階層的トポロジカルグラフを大域的階層的分類器の集合にマッピングする。
さらに,クラス間の階層的知識をデータ駆動型統計相関行列に埋め込むことにより,再重み付き階層的知識相関行列(Re-HKCM)を作成する。
論文 参考訳(メタデータ) (2025-08-17T14:22:03Z) - Hyperbolic Residual Quantization: Discrete Representations for Data with Latent Hierarchies [48.72319569157807]
残留量子化(Residual Quantization, RQ)は階層データに対する離散的マルチトークン表現を生成するために広く用いられている。
本稿では,双曲多様体にデータを埋め込むハイパーボリック残留量子化(HRQ)を提案する。
HRQは、自然に階層的な分岐と整合する帰納的バイアスを与える。
論文 参考訳(メタデータ) (2025-05-18T13:14:07Z) - Implant Global and Local Hierarchy Information to Sequence based Code
Representation Models [25.776540440893257]
完全な階層構造がコードシーケンスのトークンに与える影響を分析し、階層埋め込みと呼ばれるコードトークンの特性として、この影響を抽象化する。
ソースコードの完全な階層化をトランスフォーマーモデルに組み込むための,単純かつ効果的なシーケンスモデルである階層変換器(HiT)を提案する。
論文 参考訳(メタデータ) (2023-03-14T12:01:39Z) - CoPHE: A Count-Preserving Hierarchical Evaluation Metric in Large-Scale
Multi-Label Text Classification [70.554573538777]
ニューラルLMTCモデルの予測の階層的評価について論じる。
先行技術における構造化ラベル空間の表現における構造的問題について述べる。
深度に基づく表現を用いた階層的評価のための指標セットを提案する。
論文 参考訳(メタデータ) (2021-09-10T13:09:12Z) - HUMAP: Hierarchical Uniform Manifold Approximation and Projection [40.77787659104315]
HUMAPは、局所的・大域的構造の保存に柔軟であるように設計された、新しい階層的次元削減技術である。
提案手法の優位性を示す実証的証拠を現在の階層的アプローチと比較し,データセットラベリングにHUMAPを適用したケーススタディを示す。
論文 参考訳(メタデータ) (2021-06-14T19:27:54Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - Dual-constrained Deep Semi-Supervised Coupled Factorization Network with
Enriched Prior [80.5637175255349]
本稿では、DS2CF-Netと呼ばれる、拡張された事前制約付きDual-Constrained Deep Semi-Supervised Coupled Factorization Networkを提案する。
隠れた深い特徴を抽出するために、DS2CF-Netは、深い構造と幾何学的な構造に制約のあるニューラルネットワークとしてモデル化される。
我々のネットワークは、表現学習とクラスタリングのための最先端の性能を得ることができる。
論文 参考訳(メタデータ) (2020-09-08T13:10:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。