論文の概要: Semantic Analysis of SNOMED CT Concept Co-occurrences in Clinical Documentation using MIMIC-IV
- arxiv url: http://arxiv.org/abs/2509.03662v1
- Date: Wed, 03 Sep 2025 19:25:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-05 20:21:09.953588
- Title: Semantic Analysis of SNOMED CT Concept Co-occurrences in Clinical Documentation using MIMIC-IV
- Title(参考訳): MIMIC-IVを用いた臨床記録におけるSNOMED CT概念のセマンティック解析
- Authors: Ali Noori, Somya Mohanty, Prashanti Manda,
- Abstract要約: SNOMED CTの概念の共起パターンと埋め込みに基づく意味的類似性との関係について検討した。
分析の結果,共起と意味的類似性は相関が弱いものの,埋め込みは臨床的に有意な関連を捉えていることが明らかとなった。
- 参考スコア(独自算出の注目度): 0.10499611180329803
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Clinical notes contain rich clinical narratives but their unstructured format poses challenges for large-scale analysis. Standardized terminologies such as SNOMED CT improve interoperability, yet understanding how concepts relate through co-occurrence and semantic similarity remains underexplored. In this study, we leverage the MIMIC-IV database to investigate the relationship between SNOMED CT concept co-occurrence patterns and embedding-based semantic similarity. Using Normalized Pointwise Mutual Information (NPMI) and pretrained embeddings (e.g., ClinicalBERT, BioBERT), we examine whether frequently co-occurring concepts are also semantically close, whether embeddings can suggest missing concepts, and how these relationships evolve temporally and across specialties. Our analyses reveal that while co-occurrence and semantic similarity are weakly correlated, embeddings capture clinically meaningful associations not always reflected in documentation frequency. Embedding-based suggestions frequently matched concepts later documented, supporting their utility for augmenting clinical annotations. Clustering of concept embeddings yielded coherent clinical themes (symptoms, labs, diagnoses, cardiovascular conditions) that map to patient phenotypes and care patterns. Finally, co-occurrence patterns linked to outcomes such as mortality and readmission demonstrate the practical utility of this approach. Collectively, our findings highlight the complementary value of co-occurrence statistics and semantic embeddings in improving documentation completeness, uncovering latent clinical relationships, and informing decision support and phenotyping applications.
- Abstract(参考訳): 臨床ノートには豊富な臨床物語が含まれているが、その非構造化形式は大規模な分析に困難をもたらす。
SNOMED CTのような標準化された用語は相互運用性を改善するが、概念が共起や意味的類似性を通してどのように関係するかは未解明のままである。
本研究では,MIMIC-IVデータベースを用いて,SNOMEDCTの概念の共起パターンと埋め込みに基づく意味的類似性との関係について検討する。
正規化ポイントワイド・ミューチュアル・インフォメーション(NPMI)と事前学習した埋め込み(例えば、クリニティバート、ビオバート)を用いて、しばしば共起概念が意味的に近いか、埋め込みが欠落概念を示唆できるか、これらの関係が時間的・専門的にどのように進化するかを検討する。
分析の結果,共起と意味的類似性は相関が弱いが,埋め込みは必ずしも文書頻度に反映されない臨床的に有意な関連を捉えていることがわかった。
埋め込みに基づく提案は、後に文書化された概念とよく一致し、臨床アノテーションを増強するための有用性をサポートした。
概念埋め込みのクラスタリングは、患者の表現型やケアパターンにマッピングするコヒーレントな臨床テーマ(症状、検査、診断、心血管状態)を生み出した。
最後に、死亡率や可読率などの結果に関連付けられた共起パターンは、このアプローチの実用性を示している。
以上より,文献の完全性向上,潜伏臨床関係の解明,意思決定支援や表現表現の応用などにおいて,共起統計とセマンティック埋め込みの相補的価値を強調した。
関連論文リスト
- Automated SNOMED CT Concept Annotation in Clinical Text Using Bi-GRU Neural Networks [0.31457219084519]
本研究では,双方向GRUモデルを用いたSNOMEDCT概念認識のためのニューラルネットワークラベリング手法を提案する。
ドメイン適応型SpaCyおよびSciBERTベースのトークン化を用いてテキストを前処理し,テキストを文脈,構文,形態に富んだ重なり合う19個のチャンクに分割する。
Bi-GRUモデルは、IOBタグを指定してコンセプトスパンを特定し、検証セット上で90%のF1スコアで強力なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-08-04T16:08:49Z) - Deep State-Space Generative Model For Correlated Time-to-Event Predictions [54.3637600983898]
そこで本研究では,様々な種類の臨床イベント間の相互作用を捉えるために,潜伏状態空間生成モデルを提案する。
また,死亡率と臓器不全の関連性について有意な知見が得られた。
論文 参考訳(メタデータ) (2024-07-28T02:42:36Z) - Efficient Biomedical Entity Linking: Clinical Text Standardization with Low-Resource Techniques [0.0]
複数の用語は、臨床エンティティと呼ばれることができる同じコア概念を参照することができる。
UMLS(Unified Medical Language System)のようなオントロジーは、何百万もの臨床エンティティを格納するために開発・維持されている。
そこで本稿では,エンティティの曖昧さを解消するために,コンテキストベースとコンテキストレスの省力化手法を提案する。
論文 参考訳(メタデータ) (2024-05-24T01:14:33Z) - CoRelation: Boosting Automatic ICD Coding Through Contextualized Code
Relation Learning [56.782963838838036]
我々は,ICDコード表現の学習を促進するために,文脈的かつ柔軟なフレームワークである新しい手法を提案する。
提案手法では,可能なすべてのコード関係をモデル化する際の臨床ノートのコンテキストを考慮した,依存型学習パラダイムを採用している。
論文 参考訳(メタデータ) (2024-02-24T03:25:28Z) - Informing clinical assessment by contextualizing post-hoc explanations
of risk prediction models in type-2 diabetes [50.8044927215346]
本研究は, 合併症リスク予測のシナリオを考察し, 患者の臨床状態に関する文脈に焦点を当てる。
我々は、リスク予測モデル推論に関する文脈を提示し、その受容性を評価するために、最先端のLLMをいくつか採用する。
本論文は,実世界における臨床症例における文脈説明の有効性と有用性を明らかにする最初のエンドツーエンド分析の1つである。
論文 参考訳(メタデータ) (2023-02-11T18:07:11Z) - Enriching Unsupervised User Embedding via Medical Concepts [51.17532619610099]
教師なしのユーザ埋め込みは、患者を人間の監督なしに、固定長のベクターにエンコードすることを目的としている。
臨床ノートから抽出された医療概念は、患者とその臨床カテゴリ間の豊富な関係を含んでいる。
本稿では,2つの臨床コーパスからテキスト文書と医療概念を共同で活用する,非教師なしユーザ埋め込みを提案する。
論文 参考訳(メタデータ) (2022-03-20T18:54:05Z) - MIMICause : Defining, identifying and predicting types of causal
relationships between biomedical concepts from clinical notes [0.0]
本研究は, ガイドラインの策定, 注釈付きコーパスの開発, 臨床ノートにおけるバイオメディカル概念間の因果関係のタイプと方向を特定するためのベースラインスコアの提供を目的とする。
2018 n2c2共有タスクデータセットからサンプリングされた、合計2714の特定されていないサンプルを注釈付けし、4つの異なる言語モデルベースのアーキテクチャをトレーニングします。
臨床用テキストにおける注釈書間の高い合意は,本ガイドラインの質を示す一方で,提案されたベースラインF1は,臨床用テキストにおける物語の理解に向けた今後の研究の方向性を示す。
論文 参考訳(メタデータ) (2021-10-14T00:15:36Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z) - Biomedical Concept Relatedness -- A large EHR-based benchmark [10.133874724214984]
医療へのAIの有望な応用は、電子健康記録から情報を取得することである。
このようなアプリケーションに対するAI手法の適合性は、概念の関連性を既知の関連性スコアで予測することによって検証される。
既存の医療概念関連データセットはすべて小さく、手書きのコンセプトペアで構成されている。
これらの問題を克服する新しい概念関連性ベンチマークをオープンソースとして公開しています。
論文 参考訳(メタデータ) (2020-10-30T12:20:18Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。