論文の概要: Clinical semantics for lung cancer prediction
- arxiv url: http://arxiv.org/abs/2508.14627v1
- Date: Wed, 20 Aug 2025 11:29:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-21 16:52:41.437532
- Title: Clinical semantics for lung cancer prediction
- Title(参考訳): 肺癌予測のための臨床的意味論
- Authors: Luis H. John, Jan A. Kors, Jenna M. Reps, Peter R. Rijnbeek, Egill A. Fridgeirsson,
- Abstract要約: 既存の臨床予測モデルは、しばしば臨床概念間の意味的関係を無視した特徴を用いて患者データを表現している。
本研究では,SNOMED医療用語階層を低次元双曲空間にマッピングすることで,ドメイン固有の意味情報を統合する。
- 参考スコア(独自算出の注目度): 1.6744500686720596
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Background: Existing clinical prediction models often represent patient data using features that ignore the semantic relationships between clinical concepts. This study integrates domain-specific semantic information by mapping the SNOMED medical term hierarchy into a low-dimensional hyperbolic space using Poincar\'e embeddings, with the aim of improving lung cancer onset prediction. Methods: Using a retrospective cohort from the Optum EHR dataset, we derived a clinical knowledge graph from the SNOMED taxonomy and generated Poincar\'e embeddings via Riemannian stochastic gradient descent. These embeddings were then incorporated into two deep learning architectures, a ResNet and a Transformer model. Models were evaluated for discrimination (area under the receiver operating characteristic curve) and calibration (average absolute difference between observed and predicted probabilities) performance. Results: Incorporating pre-trained Poincar\'e embeddings resulted in modest and consistent improvements in discrimination performance compared to baseline models using randomly initialized Euclidean embeddings. ResNet models, particularly those using a 10-dimensional Poincar\'e embedding, showed enhanced calibration, whereas Transformer models maintained stable calibration across configurations. Discussion: Embedding clinical knowledge graphs into hyperbolic space and integrating these representations into deep learning models can improve lung cancer onset prediction by preserving the hierarchical structure of clinical terminologies used for prediction. This approach demonstrates a feasible method for combining data-driven feature extraction with established clinical knowledge.
- Abstract(参考訳): 背景:既存の臨床予測モデルは臨床概念間の意味的関係を無視した特徴を用いて患者データを表現していることが多い。
本研究は, SNOMED医療用語階層をポインカーイー埋め込みを用いた低次元双曲空間にマッピングすることにより, ドメイン固有の意味情報を統合し, 肺癌発症予測を改善することを目的とする。
方法: Optum EHR データセットからの振り返りコホートを用いて,SNOMED 分類から臨床知識グラフを抽出し,リーマン確率勾配勾配から Poincar\e 埋め込みを生成する。
これらの埋め込みは2つのディープラーニングアーキテクチャ、ResNetとTransformerモデルに組み込まれた。
判別(受信機動作特性曲線下での領域)とキャリブレーション(観測値と予測確率の平均絶対差)の性能評価を行った。
結果: 事前学習した Poincar\'e 埋め込みを組み込むことで, ランダム初期化ユークリッド埋め込みを用いたベースラインモデルと比較して, 識別性能が適度かつ一貫した改善が得られた。
ResNetモデル、特に10次元のPoincar\'e埋め込みを用いたモデルではキャリブレーションが向上し、Transformerモデルは構成の安定なキャリブレーションを維持した。
考察: 臨床知識グラフを双曲空間に埋め込み, これらの表現を深層学習モデルに組み込むことで, 予測に使用される臨床用語の階層構造を保存することにより, 肺癌発症予測を改善することができる。
提案手法は,データ駆動型特徴抽出と確立された臨床知識を組み合わせるための実現可能な手法である。
関連論文リスト
- TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - A Multimodal Transformer: Fusing Clinical Notes with Structured EHR Data
for Interpretable In-Hospital Mortality Prediction [8.625186194860696]
臨床ノートと構造化HRデータを融合し,院内死亡率の予測に役立てる新しいマルチモーダルトランスフォーマーを提案する。
そこで本研究では,臨床ノートにおいて重要な単語を選択するための統合的勾配(IG)手法を提案する。
また,臨床 BERT における領域適応型事前訓練とタスク適応型微調整の重要性についても検討した。
論文 参考訳(メタデータ) (2022-08-09T03:49:52Z) - Continual Learning for Tumor Classification in Histopathology Images [0.0]
モデル忘れを緩和する継続的な学習モデルは、デジタル病理学に基づく分析で導入する必要がある。
本稿では,DP設定におけるCLシナリオを提案する。
画像の外観変化をシミュレートするために,大腸癌H&E分類のための拡張データセットを構築した。
乳腺腫瘍H&Eデータセットと大腸癌を併用し,腫瘍タイプ別にCLを評価した。
論文 参考訳(メタデータ) (2022-08-07T01:04:25Z) - Unsupervised pre-training of graph transformers on patient population
graphs [48.02011627390706]
異種臨床データを扱うグラフ変換器を用いたネットワークを提案する。
自己教師型, 移動学習環境において, 事前学習方式の利点を示す。
論文 参考訳(メタデータ) (2022-07-21T16:59:09Z) - A multi-stage machine learning model on diagnosis of esophageal
manometry [50.591267188664666]
このフレームワークには、飲み込みレベルにおけるディープラーニングモデルと、学習レベルにおける機能ベースの機械学習モデルが含まれている。
これは、生のマルチスワローデータからHRM研究のCC診断を自動的に予測する最初の人工知能モデルである。
論文 参考訳(メタデータ) (2021-06-25T20:09:23Z) - Deep Learning with Heterogeneous Graph Embeddings for Mortality
Prediction from Electronic Health Records [2.2859570135269625]
我々は、電子健康記録データ上に不均一グラフモデル(HGM)をトレーニングし、結果の埋め込みベクトルをコナールニューラルネットワーク(CNN)モデルに追加情報として使用して、院内死亡率を予測する。
CNNモデルにHGMを追加すると、死亡予測精度が最大4%向上することがわかった。
論文 参考訳(メタデータ) (2020-12-28T02:27:09Z) - Bidirectional Representation Learning from Transformers using Multimodal
Electronic Health Record Data to Predict Depression [11.1492931066686]
うつ病の予測のために,ERHシーケンス上で双方向の表現学習を行うための時間的深層学習モデルを提案する。
このモデルでは, 曲線(PRAUC)下において, 最良ベースラインモデルと比較して, 抑うつ予測において0.70から0.76まで, 精度・リコール面積の最大値が得られた。
論文 参考訳(メタデータ) (2020-09-26T17:56:37Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。