Fugu-MT 論文翻訳(概要): CAG-VLM: Fine-Tuning of a Large-Scale Model to Recognize Angiographic Images for Next-Generation Diagnostic Systems

論文の概要: CAG-VLM: Fine-Tuning of a Large-Scale Model to Recognize Angiographic Images for Next-Generation Diagnostic Systems

arxiv url: http://arxiv.org/abs/2505.04964v2
Date: Sat, 07 Jun 2025 10:40:58 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-10 21:10:46.969537
Title: CAG-VLM: Fine-Tuning of a Large-Scale Model to Recognize Angiographic Images for Next-Generation Diagnostic Systems
Title（参考訳）: CAG-VLM:次世代診断システムにおける画像認識のための大規模モデルの微調整
Authors: Yuto Nakamura, Satoshi Kodera, Haruki Settai, Hiroki Shinohara, Masatsugu Tamura, Tomohiro Noguchi, Tatsuki Furusawa, Ryo Takizawa, Tempei Kabayama, Norihiko Takeda,
Abstract要約: 本稿では,2段階の医師培養パイプラインとバイリンガル(日本語/英語)CAG画像レポートデータセットを紹介する。 539の試験から14,686のフレームをサンプリングし、キーフレームの検出と左右のラテラルに注釈を付ける。我々はCNNを243の独立した試験に適用し,1,114のキーフレームを抽出し,その前処理レポートと専門家公認診断・治療概要とを組み合わせた。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Coronary angiography (CAG) is the gold-standard imaging modality for evaluating coronary artery disease, but its interpretation and subsequent treatment planning rely heavily on expert cardiologists. To enable AI-based decision support, we introduce a two-stage, physician-curated pipeline and a bilingual (Japanese/English) CAG image-report dataset. First, we sample 14,686 frames from 539 exams and annotate them for key-frame detection and left/right laterality; a ConvNeXt-Base CNN trained on this data achieves 0.96 F1 on laterality classification, even on low-contrast frames. Second, we apply the CNN to 243 independent exams, extract 1,114 key frames, and pair each with its pre-procedure report and expert-validated diagnostic and treatment summary, yielding a parallel corpus. We then fine-tune three open-source VLMs (PaliGemma2, Gemma3, and ConceptCLIP-enhanced Gemma3) via LoRA and evaluate them using VLScore and cardiologist review. Although PaliGemma2 w/LoRA attains the highest VLScore, Gemma3 w/LoRA achieves the top clinician rating (mean 7.20/10); we designate this best-performing model as CAG-VLM. These results demonstrate that specialized, fine-tuned VLMs can effectively assist cardiologists in generating clinical reports and treatment recommendations from CAG images.
Abstract（参考訳）: 冠動脈造影(CAG)は、冠動脈疾患を評価するための金標準画像法であるが、その解釈と治療計画は専門医に大きく依存している。 AIに基づく意思決定支援を実現するために,2段階の医師計算パイプラインとバイリンガル(日本語/英語)CAGイメージレポートデータセットを導入する。まず、539の試験から14,686のフレームをサンプリングし、キーフレームの検出と左右のラテラルのアノテートを行い、このデータに基づいてトレーニングされたConvNeXt-Base CNNは低コントラストフレームでもラテラル分類で0.96F1を達成する。第2に、CNNを243個の独立した試験に適用し、1,114個のキーフレームを抽出し、それぞれに前処理レポートと専門家が検証した診断と治療の要約を組み合わせ、並列コーパスを得る。次に,LoRAを用いて3つのオープンソースVLM(PaliGemma2,Gemma3,ConceptCLIP拡張Gemma3)を微調整し,VLScoreと心臓科医のレビューを用いて評価した。 PaliGemma2 w/LoRAはVLSスコアが最も高いが、Gemma3 w/LoRAは最も高い臨床評価(平均7.20/10)を得た。これらの結果から, 専門的, 微調整されたVLMは, CAG画像から臨床報告や治療レコメンデーションを生成する上で, 心臓科医を効果的に支援できることが示唆された。

関連論文リスト

RELICT: A Replica Detection Framework for Medical Image Generation [34.82692226532414]
生成モデルにおける記憶化は、意図しない機密情報漏洩とリミットモデルユーティリティを引き起こす可能性がある。合成医用画像データセットにおいて、複製、すなわち、ほぼ同一のトレーニングデータのコピーを識別するためのフレームワークを提案する。
論文参考訳（メタデータ） (2025-02-24T17:37:19Z)
A Federated Learning Framework for Stenosis Detection [70.27581181445329]
本研究は,冠動脈造影画像(CA)の狭窄検出におけるFL(Federated Learning)の使用について検討した。アンコナのOspedale Riuniti(イタリア)で取得した200人の患者1219枚の画像を含む2施設の異種データセットについて検討した。データセット2には、文献で利用可能な90人の患者からの7492のシーケンシャルな画像が含まれている。
論文参考訳（メタデータ） (2023-10-30T11:13:40Z)
Multivessel Coronary Artery Segmentation and Stenosis Localisation using Ensemble Learning [3.656984996633334]
そこで本研究では,MICCAI 2023 Automatic Region-based Coronary Artery Disease(冠状動脈疾患自動診断)のためのエンド・ツー・エンドの機械学習ソリューションを提案する。 X線冠動脈造影による冠動脈分画および狭窄性病変の局在性評価の方法の標準化を目的としている。冠状動脈セグメンテーションでは平均F1スコアが37.69%、狭窄局所化では39.41%であった。
論文参考訳（メタデータ） (2023-10-27T08:03:12Z)
YOLO-Angio: An Algorithm for Coronary Anatomy Segmentation [13.603729336413833]
われわれは,MICCAI 2023におけるX線アンギオグラフィー画像(ARCADE)を用いた自動冠状動脈疾患診断への取り組みについて報告する。我々の3段階のアプローチは、従来のコンピュータビジョンによる前処理と特徴選択を組み合わせて、船体コントラストを強化する。最終セグメンテーションは、グラフベースのソート法で冠状樹を再構築する論理に基づくアプローチに基づいている。
論文参考訳（メタデータ） (2023-10-24T15:02:02Z)
Machine Learning for Automated Mitral Regurgitation Detection from Cardiac Imaging [10.770989117724923]
僧帽弁閉鎖不全症(Mitral regurgitation, MR)は、心臓弁疾患の一種。従来の診断法は高価で、労働集約的であり、臨床専門知識を必要とする。 CUSSPと呼ばれるMR分類のための新しい半教師付きモデルを提案する。
論文参考訳（メタデータ） (2023-10-07T16:48:24Z)
SimLVSeg: Simplifying Left Ventricular Segmentation in 2D+Time Echocardiograms with Self- and Weakly-Supervised Learning [0.8672882547905405]
狭義の心エコービデオから一貫した左室(LV)セグメンテーションを行うビデオベースネットワークであるSimLVSegを開発した。 SimLVSegは、時間的マスキングによる自己教師付き事前トレーニングと、スパースアノテーションからのLVセグメンテーションに適した弱い教師付き学習で構成されている。我々は、SimLVSegが、最大の2D+時間心エコー画像データセットで93.32%のダイススコアを達成して、最先端のソリューションをいかに優れているかを実証する。
論文参考訳（メタデータ） (2023-09-30T18:13:41Z)
MyoPS: A Benchmark of Myocardial Pathology Segmentation Combining Three-Sequence Cardiac Magnetic Resonance Images [84.02849948202116]
本研究は,MyoPS(MyoPS)の医療画像解析における新たな課題を定義するものである。 myoPSは、MICCAI 2020とともにMyoPSチャレンジで最初に提案された3シーケンスの心臓磁気共鳴(CMR)画像を組み合わせている。この課題は45対のCMR画像と予め整列されたCMR画像を提供し、アルゴリズムは3つのCMRシーケンスから補完的な情報を結合して病理領域を分割することを可能にする。
論文参考訳（メタデータ） (2022-01-10T06:37:23Z)
Advancing COVID-19 Diagnosis with Privacy-Preserving Collaboration in Artificial Intelligence [79.038671794961]
我々はUCADI(Unified CT-COVID AI Diagnostic Initiative)を立ち上げ、各ホスト機関でAIモデルを分散的にトレーニングし、独立して実行することができる。本研究は,中国とイギリスに所在する23の病院で採取した3,336例の胸部CT9,573例について検討した。
論文参考訳（メタデータ） (2021-11-18T00:43:41Z)
Automated Deep Learning Analysis of Angiography Video Sequences for Coronary Artery Disease [4.233200689119682]
冠状動脈閉塞(狭窄)の評価は、現在、医師による冠動脈造影ビデオシーケンスの視覚的評価によって行われている。深層学習に基づく自動解析パイプラインを報告し,冠動脈血管造影を迅速かつ客観的に評価する。我々は、ResNetやU-Netといった強力なディープラーニングアプローチと、従来の画像処理と幾何解析を組み合わせた。
論文参考訳（メタデータ） (2021-01-29T10:23:49Z)
M3Lung-Sys: A Deep Learning System for Multi-Class Lung Pneumonia Screening from CT Imaging [85.00066186644466]
マルチタスク型マルチスライス深層学習システム(M3Lung-Sys)を提案する。 COVID-19とHealthy, H1N1, CAPとの鑑別に加えて, M3 Lung-Sysも関連病変の部位を特定できる。
論文参考訳（メタデータ） (2020-10-07T06:22:24Z)
A Benchmark for Studying Diabetic Retinopathy: Segmentation, Grading, and Transferability [76.64661091980531]
糖尿病患者は糖尿病網膜症(DR)を発症するリスクがあるコンピュータ支援型DR診断は、DRの早期検出と重度評価のための有望なツールである。このデータセットは、ピクセルレベルのDR関連病変アノテーションを持つ1,842枚の画像と、6人の眼科医によって評価された画像レベルのラベルを持つ1,000枚の画像を有する。
論文参考訳（メタデータ） (2020-08-22T07:48:04Z)
A Global Benchmark of Algorithms for Segmenting Late Gadolinium-Enhanced Cardiac Magnetic Resonance Imaging [90.29017019187282]
現在世界最大の心臓LGE-MRIデータセットである154個の3D LGE-MRIを用いた「2018 left Atrium Challenge」。技術および生物学的指標を用いた提案アルゴリズムの解析を行った。その結果, 最上部法は93.2%, 平均表面は0.7mmであった。
論文参考訳（メタデータ） (2020-04-26T08:49:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。