論文の概要: A Comparison and Evaluation of Fine-tuned Convolutional Neural Networks to Large Language Models for Image Classification and Segmentation of Brain Tumors on MRI
- arxiv url: http://arxiv.org/abs/2509.10683v1
- Date: Fri, 12 Sep 2025 20:26:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 17:26:22.727225
- Title: A Comparison and Evaluation of Fine-tuned Convolutional Neural Networks to Large Language Models for Image Classification and Segmentation of Brain Tumors on MRI
- Title(参考訳): MRIにおける脳腫瘍の画像分類と分類のための大言語モデルに対する微調整畳み込みニューラルネットワークの比較と評価
- Authors: Felicia Liu, Jay J. Yoo, Farzad Khalvati,
- Abstract要約: 大規模言語モデル(LLM)は、テキストベースの医療タスクにおいて高いパフォーマンスを示している。
画像診断におけるLLMの有用性,特にグリオーマ分類とセグメンテーションについて検討した。
従来の畳み込みニューラルネットワーク(CNN)と比較する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Large Language Models (LLMs) have shown strong performance in text-based healthcare tasks. However, their utility in image-based applications remains unexplored. We investigate the effectiveness of LLMs for medical imaging tasks, specifically glioma classification and segmentation, and compare their performance to that of traditional convolutional neural networks (CNNs). Using the BraTS 2020 dataset of multi-modal brain MRIs, we evaluated a general-purpose vision-language LLM (LLaMA 3.2 Instruct) both before and after fine-tuning, and benchmarked its performance against custom 3D CNNs. For glioma classification (Low-Grade vs. High-Grade), the CNN achieved 80% accuracy and balanced precision and recall. The general LLM reached 76% accuracy but suffered from a specificity of only 18%, often misclassifying Low-Grade tumors. Fine-tuning improved specificity to 55%, but overall performance declined (e.g., accuracy dropped to 72%). For segmentation, three methods - center point, bounding box, and polygon extraction, were implemented. CNNs accurately localized gliomas, though small tumors were sometimes missed. In contrast, LLMs consistently clustered predictions near the image center, with no distinction of glioma size, location, or placement. Fine-tuning improved output formatting but failed to meaningfully enhance spatial accuracy. The bounding polygon method yielded random, unstructured outputs. Overall, CNNs outperformed LLMs in both tasks. LLMs showed limited spatial understanding and minimal improvement from fine-tuning, indicating that, in their current form, they are not well-suited for image-based tasks. More rigorous fine-tuning or alternative training strategies may be needed for LLMs to achieve better performance, robustness, and utility in the medical space.
- Abstract(参考訳): 大規模言語モデル(LLM)は、テキストベースの医療タスクにおいて高いパフォーマンスを示している。
しかし、画像ベースのアプリケーションにおけるそれらの実用性は未解明のままである。
医用画像タスク,特にグリオーマ分類とセグメンテーションにおけるLLMの有効性について検討し,その性能を従来の畳み込みニューラルネットワーク(CNN)と比較した。
マルチモーダル脳MRIのBraTS 2020データセットを用いて、微調整前後の汎用視覚言語LLM(LLaMA 3.2インストラクト)を評価し、その性能をカスタム3D CNNと比較した。
グリオーマ分類(Low-Grade vs. High-Grade)では、CNNは80%の精度で精度とリコールのバランスが取れた。
LLMは76%の精度を示したが,18%の特異性に悩まされ,低グレード腫瘍の誤分類が多かった。
微調整により特異性が55%に向上したが、全体的な性能は低下した(例えば精度は72%に低下した)。
セグメンテーションでは,中心点,バウンディングボックス,ポリゴン抽出という3つの手法が実装された。
CNNはグリオーマを正確に局在させたが、小さな腫瘍は時々見逃された。
対照的にLLMは、グリオーマのサイズ、位置、配置を区別することなく、画像中心付近で一貫して予測をクラスタ化している。
微調整により出力フォーマットは改善されたが、空間精度は有意義に向上しなかった。
有界ポリゴン法はランダムで非構造的な出力を得た。
全体として、CNNは両方のタスクでLLMを上回った。
LLMは空間的理解が限られており、微調整による改善は最小限に抑えられた。
医療分野における優れた性能、堅牢性、有用性を達成するためには、より厳密な微調整や代替的な訓練戦略が必要である。
関連論文リスト
- GaMNet: A Hybrid Network with Gabor Fusion and NMamba for Efficient 3D Glioma Segmentation [2.3649376465820384]
深層学習は病変のセグメンテーションに役立つが、CNNとTransformerベースのモデルは文脈モデリングを欠いていることが多く、重い計算を必要とする。
グローバルモデリングのためのNMambaモジュールと,効率的な局所特徴抽出のためのマルチスケールCNNを組み合わせたGaMNetを提案する。
本手法はより少ないパラメータと高速な計算で高いセグメンテーション精度を実現する。
論文 参考訳(メタデータ) (2025-05-08T04:25:22Z) - Subclass Classification of Gliomas Using MRI Fusion Technique [0.0]
原発性脳腫瘍であるグリオーマは、様々な攻撃性レベルと予後を示す。
本研究の目的は,T1,T2,T1ce,および流体減衰インバージョン回復シーケンスからMRI画像を融合するアルゴリズムを開発することである。
提案手法は精度99.25%、精度99.30%、リコール99.10、F1スコア99.19%、インターセクションオーバーユニオン84.49%、特異度99.76を達成している。
論文 参考訳(メタデータ) (2025-02-26T03:10:33Z) - Brain Tumor Classification on MRI in Light of Molecular Markers [61.77272414423481]
1p/19q遺伝子の同時欠失は、低グレードグリオーマの臨床成績と関連している。
本研究の目的は,MRIを用いた畳み込みニューラルネットワークを脳がん検出に活用することである。
論文 参考訳(メタデータ) (2024-09-29T07:04:26Z) - 3DSAM-adapter: Holistic adaptation of SAM from 2D to 3D for promptable tumor segmentation [52.699139151447945]
医用画像の領域分割を行うために, SAMを2次元から3次元に変換する新しい適応法を提案する。
本モデルでは, 腎腫瘍, 膵腫瘍, 大腸癌の3つのタスクのうち8.25%, 29.87%, 10.11%の3つのタスクにおいて, ドメイン・オブ・ザ・アーティヴ・メディカル・イメージ・セグメンテーション・モデルより優れ, 肝腫瘍セグメンテーションでも同様の性能が得られる。
論文 参考訳(メタデータ) (2023-06-23T12:09:52Z) - Lightweight 3D Convolutional Neural Network for Schizophrenia diagnosis
using MRI Images and Ensemble Bagging Classifier [1.487444917213389]
本稿では,MRI画像を用いた統合失調症診断のための軽量3次元畳み込みニューラルネットワーク(CNN)フレームワークを提案する。
精度は92.22%、感度94.44%、特異度90%、精度90.43%、リコール94.44%、F1スコア92.39%、G平均92.19%である。
論文 参考訳(メタデータ) (2022-11-05T10:27:37Z) - Localized Perturbations For Weakly-Supervised Segmentation of Glioma
Brain Tumours [0.5801621787540266]
本研究は,脳腫瘍のセグメンテーションマスクを事前訓練した3次元分類モデルから抽出するための,局所摂動を弱教師付きソリューションとして用いることを提案する。
また,U-netアーキテクチャを用いて,任意の分類において最も関連性の高い領域を見つけるために,3次元スーパーピクセルを利用する新しい摂動法を提案する。
論文 参考訳(メタデータ) (2021-11-29T21:01:20Z) - Medulloblastoma Tumor Classification using Deep Transfer Learning with
Multi-Scale EfficientNets [63.62764375279861]
本稿では,エンド・ツー・エンドのMB腫瘍分類を提案し,様々な入力サイズとネットワーク次元の一致した移動学習を提案する。
161ケースのデータセットを用いて、より大規模な入力解像度を持つ事前学習されたEfficientNetが、大幅な性能改善をもたらすことを実証した。
論文 参考訳(メタデータ) (2021-09-10T13:07:11Z) - Effective Model Sparsification by Scheduled Grow-and-Prune Methods [73.03533268740605]
本稿では,高密度モデルの事前学習を伴わない新規なGrow-and-prune(GaP)手法を提案する。
実験により、そのようなモデルは様々なタスクにおいて80%の間隔で高度に最適化された高密度モデルの品質に適合または打ち勝つことができることが示された。
論文 参考訳(メタデータ) (2021-06-18T01:03:13Z) - Segmentation of the Left Ventricle by SDD double threshold selection and
CHT [18.104323389381126]
傾斜差分分布(SDD)二重閾値選択と円形ハフ変換(CHT)に基づくロバストなLVセグメンテーション法を提案する。
提案手法は, 自動心臓診断チャレンジ(ACDC)テストセットにおいて96.51%のDICEスコアを得た。
論文 参考訳(メタデータ) (2020-07-21T08:50:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。