論文の概要: Artificial intelligence application in lymphoma diagnosis with Vision Transformer using weakly supervised training
- arxiv url: http://arxiv.org/abs/2604.13795v1
- Date: Wed, 15 Apr 2026 12:33:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.53047
- Title: Artificial intelligence application in lymphoma diagnosis with Vision Transformer using weakly supervised training
- Title(参考訳): 弱教師付きトレーニングを用いたVision Transformerを用いた悪性リンパ腫診断における人工知能の応用
- Authors: Nghia, Nguyen, Amer Wahed, Andy Quesada, Yasir Ali, Hanadi El Achi, Y. Helen Zhang, Jocelyn Ursua, Alex Banerjee, Sahib Kalra, L. Jeffrey Medeiros, Jie Xu,
- Abstract要約: ビジョントランスフォーマー(ViT)は、より柔軟な特徴検出を可能にし、十分なデータで事前トレーニングされた場合、畳み込みニューラルネットワーク(CNN)より優れていることが示されている。
異形成性大細胞リンパ腫 (ALCL) と古典型ホジキンリンパ腫 (cHL) の鑑別に ViT を投与した。
我々のViTモデルは、10万のイメージパッチからなるより大きなデータセットに基づいてトレーニングされ、それぞれ91.85%、0.92、0.98の精度で評価指標が得られた。
- 参考スコア(独自算出の注目度): 3.881131438027152
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Vision transformers (ViT) have been shown to allow for more flexible feature detection and can outperform convolutional neural network (CNN) when pre-trained on sufficient data. Due to their promising feature detection capabilities, we deployed ViTs for morphological classification of anaplastic large cell lymphoma (ALCL) versus classic Hodgkin lymphoma (cHL). We had previously designed a ViT model which was trained on a small dataset of 1,200 image patches in fully supervised training. That model achieved a diagnostic accuracy of 100% and an F1 score of 1.0 on the independent test set. Since fully supervised training is not a practical method due to lack of expertise resources in both the training and testing phases, we conducted a recent study on a modified approach to training data (weakly supervised training) and show that labeling training image patch automatically at the slide level of each whole-slide-image is a more practical solution for clinical use of Vision Transformer. Our ViT model, trained on a larger dataset of 100,000 image patches, yields evaluation metrics with significant accuracy, F1 score, and area under the curve (AUC) at 91.85%, 0.92, and 0.98, respectively. These are respectable values that qualify this ViT model, with weakly supervised training, as a suitable tool for a deep learning module in clinical model development using automated image patch extraction.
- Abstract(参考訳): ビジョントランスフォーマー(ViT)は、より柔軟な特徴検出を可能にし、十分なデータで事前トレーニングされた場合、畳み込みニューラルネットワーク(CNN)より優れていることが示されている。
腫瘍性大細胞リンパ腫 (ALCL) と古典型ホジキンリンパ腫 (cHL) の鑑別に ViT を投与した。
私たちは以前、1200の画像パッチの小さなデータセットに基づいて、完全に教師付きトレーニングを行うViTモデルを設計しました。
そのモデルは診断精度100%、F1スコア1.0を独立テストセットで達成した。
完全教師付きトレーニングは,訓練段階とテスト段階の両方において専門知識が欠如しているため,近年,トレーニングデータに対する修正アプローチ(弱教師付きトレーニング)について検討し,各スライディングイメージのスライドレベルで自動的にラベル付けトレーニングイメージパッチが,視覚変換器の臨床応用のためのより実用的なソリューションであることを示す。
我々のViTモデルは、10万のイメージパッチからなるより大きなデータセットに基づいてトレーニングされ、それぞれ91.85%、0.92、0.98の精度で評価指標が得られた。
これらは、画像パッチの自動抽出を用いた臨床モデル開発において、深層学習モジュールに適したツールとして、弱教師付きトレーニングを備えた、このViTモデルに適合する優れた値である。
関連論文リスト
- An empirical study for the early detection of Mpox from skin lesion images using pretrained CNN models leveraging XAI technique [0.471858286267785]
Mpox(ムポックス)は、Mpoxウイルスによって引き起こされる動物性疾患で、他の皮膚疾患と類似点がある。
本研究の目的は,サルポックスの早期検出における事前学習CNNモデルの有効性を評価することである。
また、Grad-CAMとXAI技術を使ってモデルの解釈可能性を向上させることを目指している。
論文 参考訳(メタデータ) (2025-07-21T17:30:08Z) - Artificial intelligence application in lymphoma diagnosis: from Convolutional Neural Network to Vision Transformer [34.04248949660201]
我々は、視覚変換器の分類性能と、以前設計した同じデータセット上の畳み込みニューラルネットワークを比較した。
著者の知る限りでは、これは視覚変換器モデルと畳み込みニューラルネットワークモデルとの予測性能の初めての直接比較である。
論文 参考訳(メタデータ) (2025-04-05T02:33:34Z) - Explainable AI-Driven Detection of Human Monkeypox Using Deep Learning and Vision Transformers: A Comprehensive Analysis [0.20482269513546453]
mpoxは動物園で流行するウイルス病で、公衆衛生に重大な影響を及ぼす。
症状が麻疹や鶏痘の症状とどのように一致しているかから,早期臨床診断は困難である。
深層学習(DL)技術と併用した医用画像は, 皮膚領域を解析することにより, 疾患検出の改善を約束している。
本研究は,皮膚病変画像データセットを用いて,深層学習と視覚トランスフォーマーに基づくモデルをスクラッチからトレーニングする可能性について検討した。
論文 参考訳(メタデータ) (2025-04-03T19:45:22Z) - Designing Pre-training Datasets from Unlabeled Data for EEG Classification with Transformers [0.0]
本稿では,未ラベル脳波(EEG)データからラベル付きデータセットを設計する方法を提案する。
これらは、脳波信号の表現を学習するために、トランスフォーマーを事前訓練するために使用できる。
本手法を,テンプル大学清水検出コーパスのてんかん発作予知タスクで検証した。
論文 参考訳(メタデータ) (2024-09-23T13:26:13Z) - ExPLoRA: Parameter-Efficient Extended Pre-Training to Adapt Vision Transformers under Domain Shifts [52.1635661239108]
本稿では,事前学習された視覚変換器(ViT)のドメインシフト下での伝達学習を改善するために,ExPLoRAを提案する。
我々の実験は、衛星画像の最先端の成果を実証し、完全な事前学習や微調整のViTよりも優れています。
論文 参考訳(メタデータ) (2024-06-16T15:14:56Z) - Efficiently Training Vision Transformers on Structural MRI Scans for
Alzheimer's Disease Detection [2.359557447960552]
ビジョントランスフォーマー(ViT)は近年、コンピュータビジョンアプリケーションのためのCNNの代替として登場した。
難易度に基づいて,脳神経画像の下流タスクに対するViTアーキテクチャの変種を検証した。
合成および実MRIスキャンで事前訓練した微調整型視覚変換器モデルを用いて、5%と9-10%の性能向上を実現した。
論文 参考訳(メタデータ) (2023-03-14T20:18:12Z) - EfficientTrain: Exploring Generalized Curriculum Learning for Training
Visual Backbones [80.662250618795]
本稿では視覚バックボーン(例えば視覚変換器)の効率的なトレーニングのための新しいカリキュラム学習手法を提案する。
オフザシェルフ方式として、様々な人気モデルのウォールタイムトレーニングコストを、精度を犠牲にすることなく、ImageNet-1K/22Kで1.5倍に削減する。
論文 参考訳(メタデータ) (2022-11-17T17:38:55Z) - Self-supervised contrastive learning of echocardiogram videos enables
label-efficient cardiac disease diagnosis [48.64462717254158]
心エコービデオを用いた自己教師型コントラスト学習手法であるエコーCLRを開発した。
左室肥大症 (LVH) と大動脈狭窄症 (AS) の分類成績は,EchoCLR の訓練により有意に改善した。
EchoCLRは、医療ビデオの表現を学習する能力に特有であり、SSLがラベル付きデータセットからラベル効率の高い疾患分類を可能にすることを実証している。
論文 参考訳(メタデータ) (2022-07-23T19:17:26Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。