論文の概要: Advancements in Medical Image Classification through Fine-Tuning Natural Domain Foundation Models
- arxiv url: http://arxiv.org/abs/2505.19779v1
- Date: Mon, 26 May 2025 10:04:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.346961
- Title: Advancements in Medical Image Classification through Fine-Tuning Natural Domain Foundation Models
- Title(参考訳): 微調整自然ドメインモデルによる医用画像分類の進歩
- Authors: Mobina Mansoori, Sajjad Shahabodini, Farnoush Bayatmakou, Jamshid Abouei, Konstantinos N. Plataniotis, Arash Mohammadi,
- Abstract要約: 膨大なデータセットを使用すると、ファンデーションモデルは広範囲のタスクを実行する大規模で事前訓練されたモデルである。
本研究では,最新の最先端基盤モデルであるDINOv2, MAE, VMamba, CoCa, SAM2, AIMv2の医療画像分類への応用について検討した。
- 参考スコア(独自算出の注目度): 17.571552686063335
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Using massive datasets, foundation models are large-scale, pre-trained models that perform a wide range of tasks. These models have shown consistently improved results with the introduction of new methods. It is crucial to analyze how these trends impact the medical field and determine whether these advancements can drive meaningful change. This study investigates the application of recent state-of-the-art foundation models, DINOv2, MAE, VMamba, CoCa, SAM2, and AIMv2, for medical image classification. We explore their effectiveness on datasets including CBIS-DDSM for mammography, ISIC2019 for skin lesions, APTOS2019 for diabetic retinopathy, and CHEXPERT for chest radiographs. By fine-tuning these models and evaluating their configurations, we aim to understand the potential of these advancements in medical image classification. The results indicate that these advanced models significantly enhance classification outcomes, demonstrating robust performance despite limited labeled data. Based on our results, AIMv2, DINOv2, and SAM2 models outperformed others, demonstrating that progress in natural domain training has positively impacted the medical domain and improved classification outcomes. Our code is publicly available at: https://github.com/sajjad-sh33/Medical-Transfer-Learning.
- Abstract(参考訳): 膨大なデータセットを使用すると、ファンデーションモデルは広範囲のタスクを実行する大規模で事前訓練されたモデルである。
これらのモデルは、新しい手法の導入により、一貫して改善された結果を示している。
これらの傾向が医療分野に与える影響を分析し、これらの進歩が有意義な変化をもたらすかどうかを判断することが重要である。
本研究では,最新の最先端基盤モデルであるDINOv2, MAE, VMamba, CoCa, SAM2, AIMv2の医療画像分類への応用について検討した。
マンモグラフィではCBIS-DDSM, 皮膚病変ではISIC2019, 糖尿病網膜症ではAPTOS2019, 胸部X線写真ではCHEXPERTが有効であった。
これらのモデルを微調整し、それらの構成を評価することにより、医用画像分類におけるこれらの進歩の可能性を理解することを目的とする。
その結果、ラベル付きデータに制限があるにもかかわらず、これらの高度なモデルにより分類結果が著しく向上し、堅牢な性能を示すことが示唆された。
以上の結果から,AIMv2,DINOv2,SAM2モデルが他のモデルよりも優れており,自然ドメイントレーニングの進歩が医学領域に肯定的な影響を及ぼし,分類結果が改善していることが示唆された。
私たちのコードは、https://github.com/sajjad-sh33/Medical-Transfer-Learning.comで公開されています。
関連論文リスト
- Can Score-Based Generative Modeling Effectively Handle Medical Image Classification? [0.257133335028485]
本研究では,医療画像の分類器としてのスコアベース生成モデルについて検討する。
提案手法により, CBIS-DDSM, Inbreast, Vin-Dr Mammoデータセットの分類精度が向上することが示唆された。
論文 参考訳(メタデータ) (2025-02-24T23:41:33Z) - Rethinking Foundation Models for Medical Image Classification through a Benchmark Study on MedMNIST [7.017817009055001]
医用画像分類タスクにおける基礎モデルの有用性について,MedMNISTデータセットのベンチマークによる検討を行った。
我々は畳み込みモデルからトランスフォーマーモデルまで様々な基礎モデルを採用し、すべての分類タスクに対してエンドツーエンドのトレーニングと線形探索の両方を実装している。
論文 参考訳(メタデータ) (2025-01-24T18:01:07Z) - Meta-Transfer Derm-Diagnosis: Exploring Few-Shot Learning and Transfer Learning for Skin Disease Classification in Long-Tail Distribution [1.8024397171920885]
本研究は, エピソードおよび従来の訓練手法の利点と欠点を詳細に検討する。
最小限のラベル付き例で、我々のモデルは以前トレーニングされたモデルと比較して、かなりの情報獲得と性能向上を示した。
実験は, 最大10例の2方向から5方向の分類から, 従来の移動学習手法における成功率の増大を示した。
論文 参考訳(メタデータ) (2024-04-25T17:56:45Z) - Comparative Analysis of ImageNet Pre-Trained Deep Learning Models and
DINOv2 in Medical Imaging Classification [7.205610366609243]
本稿では,脳MRIデータの3つの臨床的モダリティを用いたグリオーマグレーディングタスクを行った。
我々は、ImageNetやDINOv2をベースとした様々な事前学習深層学習モデルの性能を比較した。
臨床データでは,DINOv2 はImageNet ベースで事前訓練したモデルほど優れていなかった。
論文 参考訳(メタデータ) (2024-02-12T11:49:08Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - MedSegDiff-V2: Diffusion based Medical Image Segmentation with
Transformer [53.575573940055335]
我々は、MedSegDiff-V2と呼ばれるトランスフォーマーベースの拡散フレームワークを提案する。
画像の異なる20種類の画像分割作業において,その有効性を検証する。
論文 参考訳(メタデータ) (2023-01-19T03:42:36Z) - Understanding the Tricks of Deep Learning in Medical Image Segmentation:
Challenges and Future Directions [66.40971096248946]
本稿では,モデル実装の異なるフェーズに対して,MedISegの一連のトリックを収集する。
本稿では,これらの手法の有効性を一貫したベースライン上で実験的に検討する。
私たちはまた、それぞれのコンポーネントがプラグインとプレイの利点を持つ強力なMedISegリポジトリをオープンソースにしました。
論文 参考訳(メタデータ) (2022-09-21T12:30:05Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。