論文の概要: MediAug: Exploring Visual Augmentation in Medical Imaging
- arxiv url: http://arxiv.org/abs/2504.18983v1
- Date: Sat, 26 Apr 2025 17:56:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.074303
- Title: MediAug: Exploring Visual Augmentation in Medical Imaging
- Title(参考訳): MediAug: 医用画像の視覚増強を探る
- Authors: Xuyin Qi, Zeyu Zhang, Canxuan Gang, Hao Zhang, Lei Zhang, Zhiwei Zhang, Yang Zhao,
- Abstract要約: 医用画像における高度なデータ拡張のための総合的かつ再現可能なベンチマークであるMediAugを紹介する。
実験を通じて、MixUpは79.19%の精度でResNet-50の脳腫瘍分類タスクを最も改善することを示した。
また、ヨコはResNet-50の眼疾患分類タスクにおいて91.60%の精度で最大の改善をもたらすことを示した。
- 参考スコア(独自算出の注目度): 18.46222986016741
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Data augmentation is essential in medical imaging for improving classification accuracy, lesion detection, and organ segmentation under limited data conditions. However, two significant challenges remain. First, a pronounced domain gap between natural photographs and medical images can distort critical disease features. Second, augmentation studies in medical imaging are fragmented and limited to single tasks or architectures, leaving the benefits of advanced mix-based strategies unclear. To address these challenges, we propose a unified evaluation framework with six mix-based augmentation methods integrated with both convolutional and transformer backbones on brain tumour MRI and eye disease fundus datasets. Our contributions are threefold. (1) We introduce MediAug, a comprehensive and reproducible benchmark for advanced data augmentation in medical imaging. (2) We systematically evaluate MixUp, YOCO, CropMix, CutMix, AugMix, and SnapMix with ResNet-50 and ViT-B backbones. (3) We demonstrate through extensive experiments that MixUp yields the greatest improvement on the brain tumor classification task for ResNet-50 with 79.19% accuracy and SnapMix yields the greatest improvement for ViT-B with 99.44% accuracy, and that YOCO yields the greatest improvement on the eye disease classification task for ResNet-50 with 91.60% accuracy and CutMix yields the greatest improvement for ViT-B with 97.94% accuracy. Code will be available at https://github.com/AIGeeksGroup/MediAug.
- Abstract(参考訳): データ拡張は、限られたデータ条件下での分類精度、病変検出、臓器のセグメンテーションを改善するために、医療画像に不可欠である。
しかし、2つの大きな課題が残っている。
第一に、自然写真と医用画像とのドメインギャップは、重要な疾患の特徴を歪ませる可能性がある。
第二に、医用画像の強化研究は断片化され、単一のタスクやアーキテクチャに限られており、高度なミックスベースの戦略の利点ははっきりしないままである。
これらの課題に対処するために,脳腫瘍MRIおよび眼疾患データベース上の畳み込みバックボーンとトランスフォーマーの両バックボーンを統合した6つのミックスベース拡張手法を用いた統合評価フレームワークを提案する。
私たちの貢献は3倍です。
1) 医用画像における高度なデータ拡張のための総合的かつ再現可能なベンチマークであるMediAugを紹介する。
2) MixUp, YOCO, CropMix, CutMix, AugMix, SnapMix を ResNet-50 および ViT-B のバックボーンで体系的に評価した。
(3)MixUpはResNet-50の脳腫瘍分類タスクを79.19%精度で最大改善し、SnapMixは99.44%精度でViT-Bを最大改善し、YOCOは91.60%精度でResNet-50の眼疾患分類タスクを最大改善し、CutMixは97.94%精度でViT-Bを最大改善した。
コードはhttps://github.com/AIGeeksGroup/MediAug.comから入手できる。
関連論文リスト
- Medical Image Classification with KAN-Integrated Transformers and Dilated Neighborhood Attention [2.13145300583399]
一般的な医用画像分類のための医療ビジョン変換器(MedViTV2)を紹介する。
MedViTV2は前バージョンよりも計算効率が44%高い。
MedMNISTでは4.6%、NonMNISTでは5.8%、MedMNIST-Cベンチマークでは13.4%の精度向上を実現している。
論文 参考訳(メタデータ) (2025-02-19T13:05:50Z) - Enhancing Medical Image Analysis through Geometric and Photometric transformations [0.40964539027092917]
2つの異なる医用画像データセットにおけるデータ拡張手法の有効性を評価する。
最初のステップでは良性および悪性のクラスを含む皮膚がんデータセットにいくつかの変換手法を適用した。
第2ステップでは、網膜と血管のデータセットを用いて、2つのランダムな画像とそれに対応するマスクを混合することにより、Mixup手法を用いた。
論文 参考訳(メタデータ) (2025-01-23T13:21:14Z) - Enhancing Transfer Learning for Medical Image Classification with SMOTE: A Comparative Study [0.0]
本稿では,医療画像における多ラベル画像分類へのトランスファーラーニング(TL)の適用について検討し,拡張する。
以上の結果から, TLモデルは脳腫瘍の分類に優れ, ほぼ最適測定値が得られた。
我々は,SMOTE(Synthetic Minority Oversampling Computing Technique)とTLと従来の機械学習(ML)手法を統合し,精度を1.97%向上し,リコール(感度)を5.43%向上し,特異度を0.72%向上させる。
論文 参考訳(メタデータ) (2024-12-28T18:15:07Z) - DiffBoost: Enhancing Medical Image Segmentation via Text-Guided Diffusion Model [3.890243179348094]
医療応用のための堅牢で成功したディープラーニングモデルを開発するためには、大規模で大きな変動のある高品質なデータが不可欠である。
本稿では,DiffBoostと呼ばれる医用画像合成のための制御可能な拡散モデルを提案する。
近年の拡散確率モデルを利用して、現実的で多様な合成医用画像データを生成する。
論文 参考訳(メタデータ) (2023-10-19T16:18:02Z) - SupReMix: Supervised Contrastive Learning for Medical Imaging Regression with Mixup [21.32896544112748]
医用画像退行に対するコントラスト学習の可能性は,2つの重要な側面,すなわち常性意識と硬さの欠如により,隠蔽されていると論じる。
SupReMixを用いた医用画像回帰のための教師付きコントラスト学習を提案する。
アンカー・インクルージョン混合物(アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン
論文 参考訳(メタデータ) (2023-09-28T17:38:59Z) - Breast Ultrasound Tumor Classification Using a Hybrid Multitask
CNN-Transformer Network [63.845552349914186]
胸部超音波(BUS)画像分類において,グローバルな文脈情報の収集が重要な役割を担っている。
ビジョントランスフォーマーは、グローバルなコンテキスト情報をキャプチャする能力が改善されているが、トークン化操作によって局所的なイメージパターンを歪めてしまう可能性がある。
本研究では,BUS腫瘍分類とセグメンテーションを行うハイブリッドマルチタスクディープニューラルネットワークであるHybrid-MT-ESTANを提案する。
論文 参考訳(メタデータ) (2023-08-04T01:19:32Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z) - Harmonizing Pathological and Normal Pixels for Pseudo-healthy Synthesis [68.5287824124996]
そこで本研究では,新しいタイプの識別器であるセグメンタを提案し,病変の正確な特定と擬似健康画像の視覚的品質の向上を図っている。
医用画像強調に生成画像を適用し,低コントラスト問題に対処するために拡張結果を利用する。
BraTSのT2モダリティに関する総合的な実験により、提案手法は最先端の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2022-03-29T08:41:17Z) - CarveMix: A Simple Data Augmentation Method for Brain Lesion
Segmentation [38.785081940984135]
我々はCNNに基づく脳病変分類のための単純なデータ拡張手法であるCarveMixを提案する。
本手法は,他の単純なデータ拡張手法と比較してセグメンテーション精度を向上する。
論文 参考訳(メタデータ) (2021-08-16T03:54:52Z) - Vision Transformers for femur fracture classification [59.99241204074268]
Vision Transformer (ViT) はテスト画像の83%を正確に予測することができた。
史上最大かつ最もリッチなデータセットを持つサブフラクチャーで良い結果が得られた。
論文 参考訳(メタデータ) (2021-08-07T10:12:42Z) - Robust Deep AUC Maximization: A New Surrogate Loss and Empirical Studies
on Medical Image Classification [63.44396343014749]
AUCスコアに対する新たなマージンベースサロゲート損失関数を提案する。
一般的に使用されるものよりも頑丈である。
大規模な最適化の観点からも同じ利点を享受しながら、正方損失。
私たちの知る限りでは、DAMが大規模医療画像データセットで成功するのはこれが初めてです。
論文 参考訳(メタデータ) (2020-12-06T03:41:51Z) - SAG-GAN: Semi-Supervised Attention-Guided GANs for Data Augmentation on
Medical Images [47.35184075381965]
本稿では,GAN(Cycle-Consistency Generative Adversarial Networks)を用いた医用画像生成のためのデータ拡張手法を提案する。
提案モデルでは,正常画像から腫瘍画像を生成することができ,腫瘍画像から正常画像を生成することもできる。
本研究では,従来のデータ拡張手法と合成画像を用いた分類モデルを用いて,実画像を用いた分類モデルを訓練する。
論文 参考訳(メタデータ) (2020-11-15T14:01:24Z) - Classification of COVID-19 in CT Scans using Multi-Source Transfer
Learning [91.3755431537592]
我々は,従来のトランスファー学習の改良にマルチソース・トランスファー・ラーニングを応用して,CTスキャンによる新型コロナウイルスの分類を提案する。
マルチソースファインチューニングアプローチでは、ImageNetで微調整されたベースラインモデルよりも優れています。
我々の最高のパフォーマンスモデルは、0.893の精度と0.897のリコールスコアを達成でき、ベースラインのリコールスコアを9.3%上回った。
論文 参考訳(メタデータ) (2020-09-22T11:53:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。