Fugu-MT 論文翻訳(概要): Medical Image Understanding Improves Survival Prediction via Visual Instruction Tuning

論文の概要: Medical Image Understanding Improves Survival Prediction via Visual Instruction Tuning

arxiv url: http://arxiv.org/abs/2604.18250v1
Date: Mon, 20 Apr 2026 13:27:39 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-21 21:52:52.901127
Title: Medical Image Understanding Improves Survival Prediction via Visual Instruction Tuning
Title（参考訳）: 医用画像理解による視覚指導による生存予測の改善
Authors: Xixi Liu, Jorge Lazo, Andreas Hallqvist, Mikael Johansson, Åse Johnsson, Jonas S Andersson, Ella Äng Eklund, Patrik Sund, Nasser Hosseini, Jennifer Alvén, Ida Häggström,
Abstract要約: 大規模オープンソースCT画像とラジオグラフィーレポートを利用した3次元CT画像理解のための視覚言語フレームワークを提案する。提案手法は,CT画像と臨床データからの生存予測を改善するとともに,既定質問に対する臨床的に意味のある言語応答を生成する。
参考スコア（独自算出の注目度）: 8.133715585842355
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Accurate prognostication and risk estimation are essential for guiding clinical decision-making and optimizing patient management. While radiologist-assessed features from CT scans provide valuable indicators of disease severity and outcomes, interpreting such images requires expert knowledge, and translating rich visual information into textual summaries inevitably leads to information loss. In this work, we propose a vision-language framework for 3D CT image understanding that leverages large-scale open-sourced CT images paired with radiology reports through visual instruction tuning. This pre-training enables the model to learn clinically meaningful visual-textual representations, which can then be adapted to downstream survival prediction tasks. By incorporating a survival prediction head on top of the pre-trained model, our approach improves survival prediction from CT images and clinical data while generating clinically meaningful language responses to predefined questions. Experimental results demonstrate that our method outperforms baseline methods in survival prediction, particularly, when clinical data alone is less predictive. The code will be released upon acceptance.
Abstract（参考訳）: 臨床意思決定の指導と患者管理の最適化には,正確な予後とリスク推定が不可欠である。放射線技師がCTスキャンで評価した特徴は、病気の重症度と結果の貴重な指標を提供するが、そのような画像の解釈には専門家の知識が必要であり、リッチな視覚情報をテキスト要約に翻訳することは必然的に情報損失につながる。本研究では,3次元CT画像理解のための視覚言語フレームワークを提案する。この事前学習により、臨床的に意味のある視覚・テクスチャ表現を学習し、下流の生存予測タスクに適応することができる。トレーニング済みモデルの上に生存予測ヘッドを組み込むことで,CT画像と臨床データから生存予測を改善するとともに,既定質問に対する臨床的に有意な言語応答を生成する。臨床データだけでの生存予測では,本手法は生存予測のベースライン法よりも優れていた。コードは受理時にリリースされます。

関連論文リスト

Dynamic Survival Prediction using Longitudinal Images based on Transformer [0.0]
本稿では,SurLonFormerについて紹介する。これはトランスフォーマーをベースとした新しいニューラルネットワークで,縦型医用画像と構造データを組み合わせて生存予測を行う。本アーキテクチャは,特徴を抽出するビジョン,空間的時間的情報を集約するシーケンス,Cox比例ハザードモデルに基づくサバイバルの3つの重要な構成要素から構成される。
論文参考訳（メタデータ） (2025-08-12T20:31:55Z)
Multi-task Learning Approach for Intracranial Hemorrhage Prognosis [0.0]
本稿では,Glasgow Coma Scale と Age の3次元マルチタスク画像モデルを提案する。提案手法は現状のベースライン画像モデルより優れており,CTスキャンのみを入力として用いた4名の脳神経科医と比較してICH予後に優れていた。
論文参考訳（メタデータ） (2024-08-16T14:56:17Z)
Radiology Report Generation Using Transformers Conditioned with Non-imaging Data [55.17268696112258]
本稿では,胸部X線画像と関連する患者の人口統計情報を統合したマルチモーダルトランスフォーマーネットワークを提案する。提案ネットワークは、畳み込みニューラルネットワークを用いて、CXRから視覚的特徴を抽出し、その視覚的特徴と患者の人口統計情報のセマンティックテキスト埋め込みを組み合わせたトランスフォーマーベースのエンコーダデコーダネットワークである。
論文参考訳（メタデータ） (2023-11-18T14:52:26Z)
Hypergraph Convolutional Networks for Fine-grained ICU Patient Similarity Analysis and Risk Prediction [15.06049250330114]
集中治療ユニット(ICU、Intensive Care Unit)は、重篤な患者を認め、継続的な監視と治療を提供する病院の最も重要な部分の1つである。臨床意思決定における医療従事者を支援するために,様々な患者結果予測手法が試みられている。
論文参考訳（メタデータ） (2023-08-24T05:26:56Z)
Vision-Language Modelling For Radiological Imaging and Reports In The Low Data Regime [70.04389979779195]
本稿では,視覚および言語入力を共通空間に埋め込んだ医用視覚言語モデル(VLM)について検討する。本稿では,新しい画像領域やテキスト領域への汎用事前学習モデルの適用など,低データ性能向上のためのいくつかの候補手法について検討する。テキスト・ツー・イメージ検索をベンチマークとして,2つの胸部X線および放射線学的報告を用いた可変サイズのトレーニングデータセットを用いて,これらの手法の性能評価を行った。
論文参考訳（メタデータ） (2023-03-30T18:20:00Z)
Temporal Context Matters: Enhancing Single Image Prediction with Disease Progression Representations [8.396615243014768]
本稿では,時間経過情報を活用した深層学習手法を提案する。本手法では, 自己注意に基づく時間的畳み込みネットワーク(TCN)を用いて, 疾患の軌跡を最も反映した表現を学習する。ビジョン変換器は、単点画像から特徴を抽出するために、自己教師型で事前訓練される。
論文参考訳（メタデータ） (2022-03-02T22:11:07Z)
Predicting Patient Readmission Risk from Medical Text via Knowledge Graph Enhanced Multiview Graph Convolution [67.72545656557858]
本稿では,電子健康記録の医用テキストを予測に用いる新しい手法を提案する。外部知識グラフによって強化された多視点グラフを有する患者の退院サマリーを表現している。実験により,本手法の有効性が証明され,最先端の性能が得られた。
論文参考訳（メタデータ） (2021-12-19T01:45:57Z)
Variational Knowledge Distillation for Disease Classification in Chest X-Rays [102.04931207504173]
我々は,X線に基づく疾患分類のための新しい確率的推論フレームワークである反復的知識蒸留(VKD)を提案する。提案手法の有効性を,X線画像とEHRを用いた3つの公開ベンチマークデータセットに示す。
論文参考訳（メタデータ） (2021-03-19T14:13:56Z)
Deep Co-Attention Network for Multi-View Subspace Learning [73.3450258002607]
マルチビューサブスペース学習のための深層コアテンションネットワークを提案する。共通情報と相補情報の両方を敵意で抽出することを目的としている。特に、新しいクロス再構成損失を使用し、ラベル情報を利用して潜在表現の構築を誘導する。
論文参考訳（メタデータ） (2021-02-15T18:46:44Z)
Clinical Outcome Prediction from Admission Notes using Self-Supervised Knowledge Integration [55.88616573143478]
臨床テキストからのアウトカム予測は、医師が潜在的なリスクを見落としないようにする。退院時の診断,手術手順,院内死亡率,長期予測は4つの一般的な結果予測対象である。複数の公開資料から得られた患者結果に関する知識を統合するために,臨床結果の事前学習を提案する。
論文参考訳（メタデータ） (2021-02-08T10:26:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。