論文の概要: Efficient Multimodal Clinical Question Answering for Pulmonary Embolism Risk Assessment
- arxiv url: http://arxiv.org/abs/2606.22442v1
- Date: Sun, 21 Jun 2026 11:18:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 21:38:57.071532
- Title: Efficient Multimodal Clinical Question Answering for Pulmonary Embolism Risk Assessment
- Title(参考訳): 肺塞栓症リスクアセスメントのためのマルチモーダル・クリニカル・アサーションの有用性
- Authors: Xiangyuan Xue, Yang Yu, Yan Gao, Junyan Wang, Bin Chen, Lingyan Ruan, Ting Dang, Hong Jia,
- Abstract要約: 肺塞栓症(PE)は高リスク心肺疾患である。
PEケアはCTPA(CTPA)、放射線学の解釈、縦断的電子健康記録(EHR)の証拠を日常的に組み合わせているため、コンパクトなマルチモーダル言語モデルを評価するために臨床的に有意義な設定を提供する。
本研究では,1,402人の患者から23,248Aを抽出したマルチモーダルPEデータセットであるINSPECTを用いて,効率的なマルチモーダル大言語モデル(MLLM)を用いたベンチマークを構築した。
- 参考スコア(独自算出の注目度): 18.646810467653484
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pulmonary embolism (PE) is a high risk cardiopulmonary condition whose management requires both timely diagnosis and reliable assessment of future clinical risk. Because PE care routinely combines computed tomography pulmonary angiography (CTPA), radiology interpretation, and longitudinal electronic health record (EHR) evidence, it provides a clinically meaningful setting for evaluating compact multimodal language models. In this work, we build a benchmark using efficient multimodal large language models (MLLMs) on INSPECT, a multimodal PE dataset containing 23,248 CTPA studies from 19,402 patients. We formulate eight diagnostic and prognostic tasks as structured clinical question answering problems and evaluate on typical efficient MLLMs under CTPA-Only, EHR-Only, and CTPA+EHR settings with zero-shot and few-shot prompting. Results show that Gemma4 E4B and Gemma4 E2B perform more strongly when EHR evidence is available, especially under CTPA+EHR input. Task level analysis further shows that PE diagnosis achieves higher performance than prognostic tasks, particularly readmission prediction. These observations suggest that compact multimodal models have the great potential in early stage PE risk detection and explanation.
- Abstract(参考訳): 肺塞栓症(PE)は高リスク心肺疾患である。
PEケアはCTPA(CTPA)、放射線学の解釈、縦断的電子健康記録(EHR)の証拠を日常的に組み合わせているため、コンパクトなマルチモーダル言語モデルを評価するために臨床的に有意義な設定を提供する。
本研究では,1,402名の患者から23,248名のCTPAを収録したマルチモーダルPEデータセットであるINSPECTを用いて,効率的なマルチモーダル大言語モデル(MLLM)を用いたベンチマークを構築した。
本研究は,CTPA-Only, EHR-Only, CTPA+EHR設定において, ゼロショットと少数ショットのプロンプトを併用して, 8つの診断・予後タスクを構造化された臨床質問応答問題として定式化し, 典型的なMLLMの評価を行った。
Gemma4 E4B と Gemma4 E2B は,特に CTPA+EHR 入力下において, EHR の証拠が得られればより強く作用することを示した。
タスクレベル分析により、PE診断は予後タスク、特に読み出し予測よりも高いパフォーマンスを達成することが示された。
これらの観測から, 小型マルチモーダルモデルは早期PEのリスク検出と説明において大きな可能性を秘めていることが示唆された。
関連論文リスト
- Prospective evaluation of multimodal respiratory failure prediction: Do chest X-rays improve performance beyond EHR signals? [4.250825424649631]
我々は、構造化EHR時系列データをCXR基礎モデル表現と統合するゲート型マルチモーダルフレームワークを開発した。
ICU患者24時間以内の侵襲的機械換気予測の枠組みについて検討した。
論文 参考訳(メタデータ) (2026-05-25T18:25:47Z) - TumorChain: Interleaved Multimodal Chain-of-Thought Reasoning for Traceable Clinical Tumor Analysis [46.04720262017957]
tumorChainは、3Dイメージングエンコーダ、臨床テキスト理解、臓器レベルの視覚言語アライメントを密結合するマルチモーダルインターリーブ推論フレームワークである。
実験では、病変検出、印象生成、病理分類において、強いベースラインよりも一貫した改善が見られ、DeepTumorVQAベンチマークで強い一般化が示されている。
論文 参考訳(メタデータ) (2026-03-06T03:42:22Z) - UniPACT: A Multimodal Framework for Prognostic Question Answering on Raw ECG and Structured EHR [15.533178197005208]
本稿では,このモダリティギャップを橋渡しする確率的質問に対する統一的な枠組みを提案する。
UniPACTのコアコントリビューションは、数値EHRデータを意味的にリッチなテキストに変換する構造化プロンプト機構である。
総合的なMDS-EDベンチマークで評価し、最先端のAUROCの89.37%を様々な予後タスクで達成した。
論文 参考訳(メタデータ) (2026-01-25T17:35:52Z) - EHR-R1: A Reasoning-Enhanced Foundational Language Model for Electronic Health Record Analysis [78.05962117947259]
EHR-Insは大規模で総合的なEHR推論命令データセットである。
また,EHR分析に適した最大72Bパラメータを持つ推理強化LDMであるEHR-R1を開発した。
最後に、MIMIC-IVからキュレートされた新しいベンチマークであるEHR-Benchを紹介し、42のタスクにまたがる。
論文 参考訳(メタデータ) (2025-10-29T15:32:47Z) - LlaMADRS: Prompting Large Language Models for Interview-Based Depression Assessment [75.44934940580112]
LlaMADRSは、オープンソースのLarge Language Models(LLM)を利用して、うつ病の重症度評価を自動化する新しいフレームワークである。
本研究は,クリニカルインタヴューの解釈・スコアリングにおけるモデル指導のために,慎重に設計された手がかりを用いたゼロショットプロンプト戦略を用いている。
実世界における236件のインタビューを対象とし,臨床評価と強い相関性を示した。
論文 参考訳(メタデータ) (2025-01-07T08:49:04Z) - Detecting and clustering swallow events in esophageal long-term high-resolution manometry [48.688209040613216]
深達度学習に基づく飲み込み検出法を提案し, 二次性非解離性食道運動障害を正確に同定する。
われわれは,25 LTHRMで計算パイプラインを評価し,医療専門家の注意を喚起した。
論文 参考訳(メタデータ) (2024-05-02T09:41:31Z) - INSPECT: A Multimodal Dataset for Pulmonary Embolism Diagnosis and
Prognosis [19.32686665459374]
肺塞栓症(PE)リスクの高い大コホートからの非同定型経時的記録を含むINSPECTについて紹介する。
INSPECTには、CT画像、放射線医学報告印象セクション、構造化電子健康記録(EHR)データ(人口統計、診断、手順、バイタル、医薬品など)を含む19,402人のデータが含まれている。
論文 参考訳(メタデータ) (2023-11-17T07:28:16Z) - Attention based CNN-LSTM Network for Pulmonary Embolism Prediction on
Chest Computed Tomography Pulmonary Angiograms [22.62583095023903]
肺塞栓症(PE)は最も致命的な心血管疾患の一つである。
PE予測のための2段階注目型CNN-LSTMネットワークを提案する。
本フレームワークはマルチスライス手法を用いて放射線診断プロセスのミラーリングを行う。
論文 参考訳(メタデータ) (2021-07-13T17:58:15Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。