論文の概要: Leveraging Multimodal Models for Enhanced Neuroimaging Diagnostics in Alzheimer's Disease
- arxiv url: http://arxiv.org/abs/2411.07871v1
- Date: Tue, 12 Nov 2024 15:28:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-13 13:20:38.619242
- Title: Leveraging Multimodal Models for Enhanced Neuroimaging Diagnostics in Alzheimer's Disease
- Title(参考訳): アルツハイマー病における高次神経画像診断のためのマルチモーダルモデルの構築
- Authors: Francesco Chiumento, Mingming Liu,
- Abstract要約: 本稿では,OASIS-4データセットからの構造化データに基づいて,GPT-4o-miniを用いた総合診断レポートを生成する。
学習と検証のための基礎的真実として合成レポートを用いて,データセットの画像から直接神経学的レポートを生成した。
提案法はBLEU-4スコアが0.1827、ROUGE-Lスコアが0.3719、METEORスコアが0.4163であり、臨床的に関連性があり正確な診断報告を生成する可能性を示した。
- 参考スコア(独自算出の注目度): 0.7696359453385685
- License:
- Abstract: The rapid advancements in Large Language Models (LLMs) and Vision-Language Models (VLMs) have shown great potential in medical diagnostics, particularly in radiology, where datasets such as X-rays are paired with human-generated diagnostic reports. However, a significant research gap exists in the neuroimaging field, especially for conditions such as Alzheimer's disease, due to the lack of comprehensive diagnostic reports that can be utilized for model fine-tuning. This paper addresses this gap by generating synthetic diagnostic reports using GPT-4o-mini on structured data from the OASIS-4 dataset, which comprises 663 patients. Using the synthetic reports as ground truth for training and validation, we then generated neurological reports directly from the images in the dataset leveraging the pre-trained BiomedCLIP and T5 models. Our proposed method achieved a BLEU-4 score of 0.1827, ROUGE-L score of 0.3719, and METEOR score of 0.4163, revealing its potential in generating clinically relevant and accurate diagnostic reports.
- Abstract(参考訳): LLM(Large Language Models)やVLM(Vision-Language Models)の急速な進歩は、特に放射線学において、X線のようなデータセットと人為的な診断レポートを組み合わせた医療診断において大きな可能性を示している。
しかし、特にアルツハイマー病などの疾患では、モデル微調整に使用できる包括的診断報告が欠如しているため、神経画像領域に重要な研究ギャップが存在する。
本稿では,663例からなるOASIS-4データセットから得られた構造化データに基づいて,GPT-4o-miniを用いた総合診断レポートを作成することにより,このギャップに対処する。
トレーニングと検証のための基礎的真実として合成レポートを用いて,事前訓練されたBiomedCLIPとT5モデルを利用したデータセットの画像から直接神経学的レポートを生成した。
提案法はBLEU-4スコアが0.1827、ROUGE-Lスコアが0.3719、METEORスコアが0.4163であり、臨床的に関連性があり正確な診断報告を生成する可能性を示した。
関連論文リスト
- Fine-Tuning In-House Large Language Models to Infer Differential Diagnosis from Radiology Reports [1.5972172622800358]
本研究は, 放射線学報告と鑑別診断に適した社内LPMの開発パイプラインを提案する。
GPT-4と同等の92.1%のF1スコアが得られた。
論文 参考訳(メタデータ) (2024-10-11T20:16:25Z) - Knowledge-driven AI-generated data for accurate and interpretable breast ultrasound diagnoses [29.70102468004044]
本稿では, 知識駆動型生成モデルを構築し, 適切な合成データを生成するパイプラインTAILORを提案する。
生成モデルは、ソースデータとして3,749の病変を使用し、特にエラーを起こしやすいまれな症例において、数百万の乳房US画像を生成することができる。
今後の外部評価では, 同じ感度で9名の放射線技師の平均性能を33.5%向上させる。
論文 参考訳(メタデータ) (2024-07-23T16:49:01Z) - Potential of Multimodal Large Language Models for Data Mining of Medical Images and Free-text Reports [51.45762396192655]
特にGemini-Vision-Series (Gemini) と GPT-4-Series (GPT-4) は、コンピュータビジョンのための人工知能のパラダイムシフトを象徴している。
本研究は,14の医用画像データセットを対象に,Gemini,GPT-4,および4つの一般的な大規模モデルの性能評価を行った。
論文 参考訳(メタデータ) (2024-07-08T09:08:42Z) - The Impact of Auxiliary Patient Data on Automated Chest X-Ray Report Generation and How to Incorporate It [12.61239008314719]
本研究は,胸部X線自動レポート生成のための多モーダル言語モデルへの多様な患者データソースの統合について検討する。
MIMIC-CXRおよびMIMIC-IV-EDデータセットを用いて, 診断精度を高めるために, バイタルサイン周期, 医薬, 臨床歴などの詳細な患者情報を組み込んだ。
論文 参考訳(メタデータ) (2024-06-19T03:25:31Z) - Towards a clinically accessible radiology foundation model: open-access and lightweight, with automated evaluation [113.5002649181103]
オープンソースの小型マルチモーダルモデル(SMM)を訓練し、放射線学における未測定臨床ニーズに対する能力ギャップを埋める。
トレーニングのために,697万以上の画像テキストペアからなる大規模なデータセットを組み立てる。
評価のために,GPT-4に基づく実測値CheXpromptを提案する。
LlaVA-Radの推論は高速で、単一のV100 GPU上でプライベート設定で実行できる。
論文 参考訳(メタデータ) (2024-03-12T18:12:02Z) - Radiology Report Generation Using Transformers Conditioned with
Non-imaging Data [55.17268696112258]
本稿では,胸部X線画像と関連する患者の人口統計情報を統合したマルチモーダルトランスフォーマーネットワークを提案する。
提案ネットワークは、畳み込みニューラルネットワークを用いて、CXRから視覚的特徴を抽出し、その視覚的特徴と患者の人口統計情報のセマンティックテキスト埋め込みを組み合わせたトランスフォーマーベースのエンコーダデコーダネットワークである。
論文 参考訳(メタデータ) (2023-11-18T14:52:26Z) - ChatRadio-Valuer: A Chat Large Language Model for Generalizable
Radiology Report Generation Based on Multi-institution and Multi-system Data [115.0747462486285]
ChatRadio-Valuerは、一般化可能な表現を学習する自動放射線学レポート生成のための調整されたモデルである。
本研究で利用した臨床データセットは,textbf332,673の顕著な総計を含む。
ChatRadio-Valuerは、最先端のモデル、特にChatGPT(GPT-3.5-Turbo)やGPT-4などより一貫して優れている。
論文 参考訳(メタデータ) (2023-10-08T17:23:17Z) - CephGPT-4: An Interactive Multimodal Cephalometric Measurement and
Diagnostic System with Visual Large Language Model [4.64641334287597]
CephGPT-4モデルは優れた性能を示し、矯正的測定と診断の応用に革命をもたらす可能性がある。
これらの革新は矯正学の分野で革命的応用の可能性を持っている。
論文 参考訳(メタデータ) (2023-07-01T15:41:12Z) - Variational Knowledge Distillation for Disease Classification in Chest
X-Rays [102.04931207504173]
我々は,X線に基づく疾患分類のための新しい確率的推論フレームワークである反復的知識蒸留(VKD)を提案する。
提案手法の有効性を,X線画像とEHRを用いた3つの公開ベンチマークデータセットに示す。
論文 参考訳(メタデータ) (2021-03-19T14:13:56Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。