論文の概要: A Leakage-Aware Comparative Benchmark of Machine Learning, Deep Learning, and Transformer Models for Reliable Leukemia Detection
- arxiv url: http://arxiv.org/abs/2606.24944v1
- Date: Tue, 23 Jun 2026 04:53:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 21:36:10.193653
- Title: A Leakage-Aware Comparative Benchmark of Machine Learning, Deep Learning, and Transformer Models for Reliable Leukemia Detection
- Title(参考訳): 信頼性白血病検出のための機械学習、ディープラーニング、トランスフォーマーモデルの漏洩認識比較ベンチマーク
- Authors: Nisreen Albzour,
- Abstract要約: 末梢血スミア画像からの急性リンパ性白血病(ALL)の自動分類は、C-NMC 2019データセットでほぼ完璧なパフォーマンスを報告されている。
画像レベルのランダムなパーティショニングによる患者レベルのデータ漏洩によって,そのような結果を膨らませることができることを示す。
我々は厳密な主観的解離プロトコルの下で漏洩認識ベンチマークを構築した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated classification of acute lymphoblastic leukemia (ALL) from peripheral blood smear images has often reported near-perfect performance on the C-NMC 2019 dataset. We show that such results can be inflated by patient-level data leakage caused by random image-level partitioning, where cells from the same subject may appear in both training and test folds. We establish a leakage-aware benchmark under a strict subject-disjoint protocol, comparing LightGBM, RBF-SVM, EfficientNet-B0, EfficientNet-B1, and ViT-Tiny. Models are developed using three subject-disjoint folds from 73 subjects and evaluated on an external preliminary-phase test set of 1,867 images from 28 unseen subjects with zero patient overlap. Beyond discrimination, we assess calibration using expected calibration error, Brier score, and temperature scaling. Under honest evaluation, EfficientNet-B1 achieves the best performance, with AUROC 0.913, sensitivity 0.87, specificity 0.80, and calibrated ECE 0.024. Frozen-feature classifiers and ViT-Tiny show high sensitivity but poor specificity, indicating a tendency to over-predict the malignant class. A random-versus-subject-disjoint ablation shows that random splitting inflates AUROC by about 0.04 even in the conservative frozen-feature setting. These findings caution against image-level evaluation on C-NMC 2019 and provide a reproducible, calibration-aware benchmark for future work.
- Abstract(参考訳): 末梢血スミア画像からの急性リンパ性白血病(ALL)の自動分類は、C-NMC 2019データセットでほぼ完璧なパフォーマンスを報告されている。
また, 画像レベルのランダムなパーティショニングによる患者レベルのデータ漏洩により, 同じ被験者の細胞がトレーニングとテストの両方に現れる可能性があることを示す。
光GBM, RBF-SVM, EfficientNet-B0, EfficientNet-B1, ViT-Tiny を比較し, 厳密な主観分離プロトコルに基づくリーク認識ベンチマークを構築した。
73人の被験者から得られた3つの被験者結合型フォールドを用いてモデルを構築し, 患者が重複しない28人の被験者から1,867枚の画像の外部予備相テストセットを用いて評価した。
判別以外にも、予測キャリブレーション誤差、ブライアスコア、温度スケーリングを用いてキャリブレーションを評価する。
正直な評価では、EfficientNet-B1 は AUROC 0.913、感度 0.87、特異度 0.80、校正ECE 0.024 で最高の性能を達成する。
凍結機能分類器とViT-Tinyは高い感度を示すが特異性は乏しく,悪性度を過度に予測する傾向を示した。
ランダム・ヴァース・サブジェクト・ディスジョイント・アブレーションは、保守的な凍結状態でもランダムな分裂がAUROCを約0.04に膨らませていることを示している。
これらの知見は、C-NMC 2019の画像レベル評価に注意し、将来の作業のために再現可能なキャリブレーション対応のベンチマークを提供する。
関連論文リスト
- Robust Multicentre Detection and Classification of Colorectal Liver Metastases on CT: Application of Foundation Models [11.274035647041762]
我々は,CT上のCRLMの患者レベル分類と病変レベル検出のための基礎モデルに基づくAIパイプラインを開発した。
UMedPTは最高の成績を示し,分類用頭部と病変検出用FCOSベースの頭部を微調整した。
論文 参考訳(メタデータ) (2026-01-12T14:35:29Z) - Improved cystic hygroma detection from prenatal imaging using ultrasound-specific self-supervised representation learning [0.18058404137575482]
嚢胞性横隔膜腫(Cystic hygroma)は、高リスク出生前超音波検査で、染色体異常、構造的異常、および妊娠の悪影響を呈する。
本研究は,第1トリメスター超音波画像において,超音波による自己教師付き事前訓練が,嚢胞性肥大症を高精度かつ堅牢に検出するのに役立つかどうかを検証した。
論文 参考訳(メタデータ) (2025-12-28T00:07:26Z) - MSRANetV2: An Explainable Deep Learning Architecture for Multi-class Classification of Colorectal Histopathological Images [3.4859776888706233]
大腸癌(CRC)は、世界中のがん関連死亡率の高い疾患である。
ディープラーニングアルゴリズムは、診断精度と効率を高めるための強力なアプローチとなっている。
大腸組織像の分類に最適化されたMSRANetV2という畳み込みニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-10-28T07:22:34Z) - Glaucoma Detection and Structured OCT Report Generation via a Fine-tuned Multimodal Large Language Model [1.0925680160683622]
このモデルは,品質評価,緑内障検出,RAF薄型分類の3つの課題に対して,ホールドアウトテストセットで評価した。
このモデルは、画像品質の問題を特定し、緑内障を検出する上で高い精度を実現した。
論文 参考訳(メタデータ) (2025-10-01T22:37:28Z) - A Novel Attention-Augmented Wavelet YOLO System for Real-time Brain Vessel Segmentation on Transcranial Color-coded Doppler [49.03919553747297]
我々は,脳動脈を効率よく捉えることができるAIを利用したリアルタイムCoW自動分割システムを提案する。
Transcranial Color-coded Doppler (TCCD) を用いたAIによる脳血管セグメンテーションの事前研究は行われていない。
提案したAAW-YOLOは, 異方性および対側性CoW容器のセグメンテーションにおいて高い性能を示した。
論文 参考訳(メタデータ) (2025-08-19T14:41:22Z) - Enhancing Diagnostic Reliability of Foundation Model with Uncertainty Estimation in OCT Images [41.002573031087856]
光コヒーレンストモグラフィー(OCT)における11個の網膜状態を検出するために,不確実性推定(FMUE)を用いた基礎モデルを開発した。
FMUEは2つの最先端アルゴリズムであるRETFoundとUIOSよりも96.76%高いF1スコアを獲得し、しきい値戦略を98.44%に改善した。
我々のモデルは、F1スコアが高い2人の眼科医(95.17%対61.93% &71.72%)より優れている。
論文 参考訳(メタデータ) (2024-06-18T03:04:52Z) - Uncertainty-inspired Open Set Learning for Retinal Anomaly
Identification [71.06194656633447]
9つの網膜条件の基底像をトレーニングし,不確実性に着想を得たオープンセット(UIOS)モデルを構築した。
しきい値戦略を持つUIOSモデルはF1スコア99.55%、97.01%、91.91%を達成した。
UIOSは、高い不確実性スコアを正しく予測し、非ターゲットの網膜疾患、低品質の眼底画像、および非基本画像のデータセットを手動でチェックする必要があることを示唆した。
論文 参考訳(メタデータ) (2023-04-08T10:47:41Z) - The Report on China-Spain Joint Clinical Testing for Rapid COVID-19 Risk
Screening by Eye-region Manifestations [59.48245489413308]
携帯電話カメラで中国とスペインで撮影された視線領域の画像を用いて、新型コロナウイルスの早期スクリーニングモデルを開発し、テストした。
AUC, 感度, 特異性, 精度, F1。
論文 参考訳(メタデータ) (2021-09-18T02:28:01Z) - Vision Transformers for femur fracture classification [59.99241204074268]
Vision Transformer (ViT) はテスト画像の83%を正確に予測することができた。
史上最大かつ最もリッチなデータセットを持つサブフラクチャーで良い結果が得られた。
論文 参考訳(メタデータ) (2021-08-07T10:12:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。