論文の概要: Systematic Evaluation of Vision Transformers for Automated Cervical Cancer Classification: Optimization, Statistical Validation, and Clinical Interpretability
- arxiv url: http://arxiv.org/abs/2605.17236v1
- Date: Sun, 17 May 2026 03:16:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:47.791145
- Title: Systematic Evaluation of Vision Transformers for Automated Cervical Cancer Classification: Optimization, Statistical Validation, and Clinical Interpretability
- Title(参考訳): 頸部癌自動分類のための視覚変換器の系統的評価:最適化,統計的検証,臨床解釈可能性
- Authors: Nisreen Albzour, Sarah S. Lam,
- Abstract要約: Herlevデータセット(画像917枚、正常242枚、異常675枚)は、ViT-Tinyを最適化するために使用された。
最適構成は94.9%-95.2%のクロスバリデーション精度を達成した。
- 参考スコア(独自算出の注目度): 3.093890460224435
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Manual Pap smear analysis for cervical cancer screening is limited by inter-observer variability, time constraints, and restricted expert availability. Although convolutional neural networks (CNNs) have automated cervical cell classification, they remain limited in modeling long-range spatial dependencies and often lack clinical interpretability. In this study, Vision Transformer (ViT) architectures were systematically optimized to enhance automated cervical cancer screening, which resulted in improved interpretability. The Herlev dataset (917 images: 242 normal, 675 abnormal) was utilized to optimize ViT-Tiny, a lightweight Vision Transformer architecture designed for reduced computational complexity, through a comprehensive evaluation of augmentation strategies, class weighting, and hyperparameters. The optimal configuration achieved 94.9%-95.2% cross-validation accuracy, in which random horizontal flipping and class weighting (0.7 x 1.3) were identified as most effective. Gradient-weighted Class Activation Mapping (Grad-CAM) analysis confirmed that model attention corresponded to clinically relevant morphological features, which include nuclear regions, cell boundaries, and chromatin texture, which align with cytopathological criteria. These findings indicate that Vision Transformers can deliver accurate and interpretable decision support for cervical cancer screening, which fulfills both clinical performance and transparency requirements essential for medical AI deployment.
- Abstract(参考訳): 頸部がん検診における手動Papスミア解析は、サーバ間変動、時間制限、専門家の可用性の制限によって制限される。
畳み込みニューラルネットワーク(CNN)は、自動化された頚細胞分類を持つが、長距離空間依存のモデリングには制限があり、臨床解釈性に欠けることが多い。
本研究では,視覚トランスフォーマー (ViT) アーキテクチャを体系的に最適化し,頸部癌検診の自動化を実現し,解釈性の向上を実現した。
Herlevデータセット(画像: 242 正常、675 の異常)は、拡張戦略、クラス重み付け、ハイパーパラメータの包括的な評価を通じて、計算複雑性の低減のために設計された軽量なViT-Tinyアーキテクチャの最適化に使用された。
最適構成は94.9%-95.2%のクロスバリデーション精度を達成し、ランダムな水平反転とクラス重み付け(0.7 x 1.3)が最も有効であることが判明した。
Grad-CAM (Grad-CAM) 解析により, 核領域, 細胞境界, クロマチンテクスチャを含む臨床形態学的特徴と, 細胞病理学的基準に沿ったモデル注意が一致していることが確認された。
これらの結果は、Vision Transformersが、医療用AIデプロイメントに必要な臨床的パフォーマンスと透明性の両方を満たす、頸部がん検診の正確かつ解釈可能な意思決定サポートを提供できることを示唆している。
関連論文リスト
- Clinically Aware Synthetic Image Generation for Concept Coverage in Chest X-ray Models [3.295369583957252]
CARSは臨床特徴ベクトルに標的摂動を適用し、病理所見の挿入と削除を制御できる。
CARS生成画像の微調整は、精度・リコール性能を一貫して改善し、予測の不確実性を低減し、モデルの校正を改善する。
論文 参考訳(メタデータ) (2026-03-16T16:48:51Z) - DeepHistoViT: An Interpretable Vision Transformer Framework for Histopathological Cancer Classification [0.0]
病理組織学は、組織形態の詳細な細胞レベル評価を提供するため、がん診断のゴールドスタンダードのままである。
近年の深層学習の進歩は、医療画像における複雑な空間依存をモデル化する強力な可能性を示している。
組織像の自動分類のためのトランスフォーマーベースのフレームワークであるDeepHistoViTを提案する。
論文 参考訳(メタデータ) (2026-03-12T00:29:19Z) - Enhanced SegNet with Integrated Grad-CAM for Interpretable Retinal Layer Segmentation in OCT Images [0.0]
そこで本研究では,SegNetによる網膜層分割の自動化と解釈のためのディープラーニングフレームワークを提案する。
改良されたプール戦略を含むアーキテクチャ上の革新は、ノイズの多いOCT画像からの特徴抽出を強化する。
Grad-CAMの可視化では、解剖学的に関連のある領域が強調され、セグメンテーションと臨床バイオマーカーが一致した。
論文 参考訳(メタデータ) (2025-09-09T14:31:51Z) - LGE-Guided Cross-Modality Contrastive Learning for Gadolinium-Free Cardiomyopathy Screening in Cine CMR [51.11296719862485]
CMRを用いたガドリニウムフリー心筋症スクリーニングのためのコントラシブラーニングおよびクロスモーダルアライメントフレームワークを提案する。
CMRとLate Gadolinium Enhancement (LGE) 配列の潜伏空間を整列させることにより, 本モデルでは線維症特異的な病理組織をCMR埋め込みにエンコードする。
論文 参考訳(メタデータ) (2025-08-23T07:21:23Z) - HistoViT: Vision Transformer for Accurate and Scalable Histopathological Cancer Diagnosis [1.5939351525664014]
マルチクラス腫瘍分類のためのトランスフォーマーに基づくディープラーニングフレームワークを提案する。
本手法は従来の畳み込みニューラルネットワークの限界に対処する。
アプローチ分類では, 乳がん, 前立腺癌, 骨癌, 頸部癌が99.32%, 96.92%, 95.28%, 96.94%であった。
論文 参考訳(メタデータ) (2025-08-15T03:10:52Z) - SurgeryLSTM: A Time-Aware Neural Model for Accurate and Explainable Length of Stay Prediction After Spine Surgery [44.119171920037196]
選択的脊椎手術における滞在時間(LOS)予測のための機械学習モデルの開発と評価を行った。
我々は,従来のMLモデルと,マスク付き双方向長短期記憶(BiLSTM)であるオペレーショナルLSTMを比較した。
決定係数(R2)を用いて性能を評価し,説明可能なAIを用いて鍵予測器を同定した。
論文 参考訳(メタデータ) (2025-07-15T01:18:28Z) - GS-TransUNet: Integrated 2D Gaussian Splatting and Transformer UNet for Accurate Skin Lesion Analysis [44.99833362998488]
本稿では,2次元ガウススプラッティングとTransformer UNetアーキテクチャを組み合わせた皮膚癌自動診断手法を提案する。
セグメンテーションと分類の精度は著しく向上した。
この統合は、新しいベンチマークをこの分野に設定し、マルチタスク医療画像解析手法のさらなる研究の可能性を強調している。
論文 参考訳(メタデータ) (2025-02-23T23:28:47Z) - Semi-supervised ViT knowledge distillation network with style transfer
normalization for colorectal liver metastases survival prediction [1.283897253352624]
本稿では,H&EおよびHPSで染色した組織学的スライドを用いて,自動予後予測のためのエンドツーエンドアプローチを提案する。
まずGAN(Generative Adversarial Network)を用いてスライス正規化を行い、染色のばらつきを低減し、予測パイプラインへの入力として使用される画像の全体的な品質を向上させる。
転移性結節および周囲組織から抽出した特徴を利用して予後モデルを訓練し,同時に知識蒸留フレームワークで視覚変換器(ViT)を訓練し,予後予測の性能を再現し,向上させる。
論文 参考訳(メタデータ) (2023-11-17T03:32:11Z) - Multi-Scale Hybrid Vision Transformer for Learning Gastric Histology:
AI-Based Decision Support System for Gastric Cancer Treatment [50.89811515036067]
胃内視鏡検査は、早期に適切な胃癌(GC)治療を判定し、GC関連死亡率を低下させる有効な方法である。
本稿では,一般のGC治療指導と直接一致する5つのGC病理のサブ分類を可能にする実用的なAIシステムを提案する。
論文 参考訳(メタデータ) (2022-02-17T08:33:52Z) - Lung Cancer Lesion Detection in Histopathology Images Using Graph-Based
Sparse PCA Network [93.22587316229954]
ヘマトキシリンとエオシン(H&E)で染色した組織学的肺スライドにおける癌病変の自動検出のためのグラフベーススパース成分分析(GS-PCA)ネットワークを提案する。
我々は,SVM K-rasG12D肺がんモデルから得られたH&Eスライダーの精度・リコール率,Fスコア,谷本係数,レシーバ演算子特性(ROC)の曲線下領域を用いて,提案アルゴリズムの性能評価を行った。
論文 参考訳(メタデータ) (2021-10-27T19:28:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。