論文の概要: SigBERT: Combining Narrative Medical Reports and Rough Path Signature Theory for Survival Risk Estimation in Oncology
- arxiv url: http://arxiv.org/abs/2507.22941v1
- Date: Fri, 25 Jul 2025 12:33:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-01 17:19:08.318855
- Title: SigBERT: Combining Narrative Medical Reports and Rough Path Signature Theory for Survival Risk Estimation in Oncology
- Title(参考訳): SigBERT: オンコロジーの生存リスク評価のためのナラティブ・メディカル・レポートと粗路シグナチャ理論の組み合わせ
- Authors: Paul Minchella, Loïc Verlingue, Stéphane Chrétien, Rémi Vaucher, Guillaume Metzler,
- Abstract要約: SigBERTは、患者1人当たりの多数の臨床報告を処理するために設計された、革新的な時間的生存分析フレームワークである。
文章埋め込みに単語埋め込みを抽出し平均化することにより、タイムスタンプ化された医療報告を処理する。
これは、L'eon B'erard Center corpusの実際の腫瘍学データセットで訓練され、独立したテストコホート上でのC-インデックススコア0.75(sd 0.014)で評価された。
- 参考スコア(独自算出の注目度): 1.5425688173297465
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Electronic medical reports (EHR) contain a vast amount of information that can be leveraged for machine learning applications in healthcare. However, existing survival analysis methods often struggle to effectively handle the complexity of textual data, particularly in its sequential form. Here, we propose SigBERT, an innovative temporal survival analysis framework designed to efficiently process a large number of clinical reports per patient. SigBERT processes timestamped medical reports by extracting and averaging word embeddings into sentence embeddings. To capture temporal dynamics from the time series of sentence embedding coordinates, we apply signature extraction from rough path theory to derive geometric features for each patient, which significantly enhance survival model performance by capturing complex temporal dynamics. These features are then integrated into a LASSO-penalized Cox model to estimate patient-specific risk scores. The model was trained and evaluated on a real-world oncology dataset from the L\'eon B\'erard Center corpus, with a C-index score of 0.75 (sd 0.014) on the independent test cohort. SigBERT integrates sequential medical data to enhance risk estimation, advancing narrative-based survival analysis.
- Abstract(参考訳): 電子医療報告(EHR)には、医療における機械学習アプリケーションに活用できる膨大な情報が含まれている。
しかし、既存の生存分析手法は、テキストデータの複雑さ、特にシーケンシャルな形式を効果的に扱うのに苦労することが多い。
本稿では,患者1人当たりの多数の臨床報告を効率的に処理する革新的な時間的生存分析フレームワークであるSigBERTを提案する。
SigBERTは、文章埋め込みに単語埋め込みを抽出し平均化することにより、タイムスタンプ化された医療報告を処理する。
文埋め込み座標の時系列から時間的ダイナミクスを捉えるため,各患者の幾何学的特徴を導出するために粗い経路理論からのシグネチャ抽出を適用し,複雑な時間的ダイナミクスを捉えることで生存モデルの性能を大幅に向上させる。
これらの機能は、患者固有のリスクスコアを推定するために、LASSOペナル化されたCoxモデルに統合される。
このモデルは、L\'eon B\'erard Center corpusの実際のオンコロジーデータセットを用いて、独立試験コホート上でのC-インデックススコア0.75(sd 0.014)でトレーニングされ、評価された。
SigBERTは、シーケンシャルな医療データを統合し、リスク推定を強化し、物語に基づく生存分析を進める。
関連論文リスト
- Deep Survival Analysis in Multimodal Medical Data: A Parametric and Probabilistic Approach with Competing Risks [47.19194118883552]
単一リスクシナリオと競合リスクシナリオの両方をモデル化可能な生存分析のためのマルチモーダルディープラーニングフレームワークを提案する。
生存予測のための新しいディープラーニングアーキテクチャであるSAMVAE(Survival Analysis Multimodal Variational Autoencoder)を提案する。
論文 参考訳(メタデータ) (2025-07-10T14:29:48Z) - Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文 参考訳(メタデータ) (2025-05-30T14:42:02Z) - Survival Prediction in Lung Cancer through Multi-Modal Representation Learning [9.403446155541346]
本稿では,CTとPETの包括的情報と関連するゲノムデータを用いた生存予測手法を提案する。
我々は,マルチモーダル画像データと遺伝的情報を統合することにより,生存率の予測モデルを構築することを目的とする。
論文 参考訳(メタデータ) (2024-09-30T10:42:20Z) - Deep State-Space Generative Model For Correlated Time-to-Event Predictions [54.3637600983898]
そこで本研究では,様々な種類の臨床イベント間の相互作用を捉えるために,潜伏状態空間生成モデルを提案する。
また,死亡率と臓器不全の関連性について有意な知見が得られた。
論文 参考訳(メタデータ) (2024-07-28T02:42:36Z) - Advancing Head and Neck Cancer Survival Prediction via Multi-Label Learning and Deep Model Interpretation [7.698783025721071]
我々は,複数のHNC生存率を同時に予測するための,解釈可能なマルチラベル・マルチモーダル・ディープ・サバイバル予測フレームワーク IMLSP を提案する。
また、深層生存モデル視覚説明のために開発された、グラディエント重み付き時間イベント活性化マッピング手法であるGrad-TEAMを提案する。
論文 参考訳(メタデータ) (2024-05-09T01:30:04Z) - Estimating the severity of dental and oral problems via sentiment
classification over clinical reports [0.8287206589886879]
テキストにおける著者の感情を分析することは、医学や歯科など様々な分野において実用的で有用である。
CNN-LSTMとして知られる畳み込みニューラルネットワーク(CNN)とLong Short-Term Memory(LSTM)ネットワークアーキテクチャに基づくディープラーニングモデルを開発した。
論文 参考訳(メタデータ) (2024-01-17T14:33:13Z) - SAVAE: Leveraging the variational Bayes autoencoder for survival
analysis [10.0060346233449]
SAVAE(Survival Analysis Variational Autoencoder)は,変分オートエンコーダに基づく新しい手法である。
サボエは、生存分析のための調整されたELBOの定式化を導入することにより、この分野に大きく貢献する。
様々な測定値に対して一貫して優れた性能を発揮し、異なる実験を通して頑健さと安定性を実証する一般的な方法を提供する。
論文 参考訳(メタデータ) (2023-12-22T12:36:50Z) - Radiology Report Generation Using Transformers Conditioned with
Non-imaging Data [55.17268696112258]
本稿では,胸部X線画像と関連する患者の人口統計情報を統合したマルチモーダルトランスフォーマーネットワークを提案する。
提案ネットワークは、畳み込みニューラルネットワークを用いて、CXRから視覚的特徴を抽出し、その視覚的特徴と患者の人口統計情報のセマンティックテキスト埋め込みを組み合わせたトランスフォーマーベースのエンコーダデコーダネットワークである。
論文 参考訳(メタデータ) (2023-11-18T14:52:26Z) - SurvTimeSurvival: Survival Analysis On The Patient With Multiple
Visits/Records [26.66492761632773]
近年の人工知能の進歩にもかかわらず、重症疾患患者の生存時間の正確な予測は重要な課題である。
本研究は「SurvTimeSurvival: Survival Analysis on patients with Multiple visits/Records」を紹介する。
論文 参考訳(メタデータ) (2023-11-16T12:30:14Z) - MIA-Prognosis: A Deep Learning Framework to Predict Therapy Response [58.0291320452122]
本稿では,患者の予後と治療反応を予測するための統合型深層学習手法を提案する。
我々は,マルチモーダル非同期時系列分類タスクとして,確率モデリングを定式化する。
我々の予測モデルは、長期生存の観点から、低リスク、高リスクの患者をさらに階層化する可能性がある。
論文 参考訳(メタデータ) (2020-10-08T15:30:17Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。