論文の概要: CardioEmbed: Domain-Specialized Text Embeddings for Clinical Cardiology
- arxiv url: http://arxiv.org/abs/2511.10930v1
- Date: Fri, 14 Nov 2025 03:38:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-17 22:42:18.416036
- Title: CardioEmbed: Domain-Specialized Text Embeddings for Clinical Cardiology
- Title(参考訳): CardioEmbed: 臨床診断のためのドメイン特化テキスト埋め込み
- Authors: Richard J. Young, Alice M. Matthews,
- Abstract要約: 本研究は,7つの総合心臓学教科書のキュレートコーパスを用いたコントラスト学習を用いて,Qwen3-Embedding-8Bに基づくドメイン特化埋め込みモデルであるCardioEmbedを訓練した。
このモデルでは、InfoNCE損失とバッチ内の負の値を使い、心特異的なセマンティック検索タスクにおいて99.60%の精度を達成している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Biomedical text embeddings have primarily been developed using research literature from PubMed, yet clinical cardiology practice relies heavily on procedural knowledge and specialized terminology found in comprehensive textbooks rather than research abstracts. This research practice gap limits the effectiveness of existing embedding models for clinical applications incardiology. This study trained CardioEmbed, a domain-specialized embedding model based on Qwen3-Embedding-8B, using contrastive learning on a curated corpus of seven comprehensive cardiology textbooks totaling approximately 150,000 sentences after deduplication. The model employs InfoNCE loss with in-batch negatives and achieves 99.60% retrieval accuracy on cardiac-specific semantic retrieval tasks, a +15.94 percentage point improvement over MedTE, the current state-of-the-art medical embedding model. On MTEB medical benchmarks, the model obtained BIOSSES 0.77 Spearman and SciFact 0.61 NDCG@10, indicating competitive performance on related biomedical domains. Domain-specialized training on comprehensive clinical textbooks yields near-perfect cardiology retrieval (99.60% Acc@1), improving over MedTE by +15.94 percentage points.
- Abstract(参考訳): バイオメディカルテキストの埋め込みは主にPubMedの研究文献を用いて開発されてきたが、臨床心臓学の実践は、研究要約ではなく総合的な教科書で見られる手続き的知識と専門用語に大きく依存している。
本研究の実践は, 臨床応用における既存の埋め込みモデルの有効性を限定するものである。
本研究は,Qwen3-Embedding-8Bをベースとしたドメイン特化埋め込みモデルであるCardioEmbedを,約15万文のデデューケーション後の7つの総合的心臓学教科書のキュレーションコーパスのコントラスト学習を用いて訓練した。
このモデルではInfoNCEの損失とバッチ内の負の損失を採用し、心臓固有のセマンティック検索タスクで99.60%の精度を達成し、現在の最先端医療埋め込みモデルであるMedTEよりも+15.94ポイント向上した。
MTEBの医療ベンチマークでは、BIOSSES 0.77 SpearmanとSciFact 0.61 NDCG@10を得た。
総合的な臨床教科書のドメイン特化トレーニングは、ほぼ完全な心臓学検索(99.60% Acc@1)をもたらし、MedTEを+15.94ポイント改善する。
関連論文リスト
- From Motion to Meaning: Biomechanics-Informed Neural Network for Explainable Cardiovascular Disease Identification [1.1142444517901016]
我々は,ネオ・フック材料のエネルギーひずみ定式化を利用して心組織変形をモデル化する。
移動心内の局所ひずみを推定し,心血管疾患の分類に使用する特徴の詳細なセットを抽出した。
論文 参考訳(メタデータ) (2025-07-08T08:43:05Z) - Multi-Stage Segmentation and Cascade Classification Methods for Improving Cardiac MRI Analysis [15.236546465767026]
心磁気共鳴画像のセグメンテーションと分類における深層学習に基づく新しいアプローチを提案する。
その結果,左心室では0.974,右心室では0.947のDice係数が得られた。
分類には,肥大型心筋症,心筋梗塞,拡張型心筋症などの心疾患を識別するために,深層学習分類器のカスケードが用いられた。
論文 参考訳(メタデータ) (2024-12-12T15:53:14Z) - Towards a clinically accessible radiology foundation model: open-access and lightweight, with automated evaluation [113.5002649181103]
オープンソースの小型マルチモーダルモデル(SMM)を訓練し、放射線学における未測定臨床ニーズに対する能力ギャップを埋める。
トレーニングのために,697万以上の画像テキストペアからなる大規模なデータセットを組み立てる。
評価のために,GPT-4に基づく実測値CheXpromptを提案する。
LlaVA-Radの推論は高速で、単一のV100 GPU上でプライベート設定で実行できる。
論文 参考訳(メタデータ) (2024-03-12T18:12:02Z) - An empirical study of using radiology reports and images to improve ICU
mortality prediction [21.99553011832319]
ICU死亡率を予測するために,多モードデータを用いたディープラーニングに基づく生存予測モデルを構築した。
医療情報マートをMIMIC-IV(MIMIC-IV)データセットを用いて提案モデルの評価を行った。
論文 参考訳(メタデータ) (2023-06-20T15:43:28Z) - Deep-Learning Tool for Early Identifying Non-Traumatic Intracranial
Hemorrhage Etiology based on CT Scan [40.51754649947294]
深層学習モデルは、2011年1月から2018年4月までに収集された非外傷性ICHを用いた1868個のNCCTスキャンを用いて開発された。
診断成績は臨床医の成績と比較した。
臨床医は, システム拡張による特定の出血エチオロジーの感度, 特異性, 精度を著しく改善した。
論文 参考訳(メタデータ) (2023-02-02T08:45:17Z) - On the Automated Segmentation of Epicardial and Mediastinal Cardiac
Adipose Tissues Using Classification Algorithms [0.9176056742068814]
本研究は,心臓脂肪パッドの自動セグメンテーションのための新しい技術を提案する。
本手法は,心臓CT画像のセグメンテーションに分類アルゴリズムを適用することに基づく。
心内膜脂肪および縦隔脂肪の分類における平均精度は98.4%であった。
論文 参考訳(メタデータ) (2022-08-30T15:57:02Z) - Self-supervised contrastive learning of echocardiogram videos enables
label-efficient cardiac disease diagnosis [48.64462717254158]
心エコービデオを用いた自己教師型コントラスト学習手法であるエコーCLRを開発した。
左室肥大症 (LVH) と大動脈狭窄症 (AS) の分類成績は,EchoCLR の訓練により有意に改善した。
EchoCLRは、医療ビデオの表現を学習する能力に特有であり、SSLがラベル付きデータセットからラベル効率の高い疾患分類を可能にすることを実証している。
論文 参考訳(メタデータ) (2022-07-23T19:17:26Z) - Towards dynamic multi-modal phenotyping using chest radiographs and
physiological data [3.11179491890629]
本稿では,モダリティ固有のデータ表現を学習し,補助的特徴を統合するための動的トレーニング手法を提案する。
MIMIC-IVおよび胸部X線写真を用いたMIMIC-CXRデータセットを用いた患者表現型検索の予備実験を行った。
このことは、表現型タスクにおける胸部画像モダリティの活用の利点を示し、医療応用におけるマルチモーダル学習の可能性を強調している。
論文 参考訳(メタデータ) (2021-11-04T09:41:00Z) - Domain-Specific Pretraining for Vertical Search: Case Study on
Biomedical Literature [67.4680600632232]
自己教師型学習は、アノテーションのボトルネックを克服するための有望な方向として現れました。
本稿では,ドメイン固有の事前学習に基づく垂直探索手法を提案する。
我々のシステムはPubMed上で何千万もの記事にスケールでき、Microsoft Biomedical Searchとしてデプロイされている。
論文 参考訳(メタデータ) (2021-06-25T01:02:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。