論文の概要: Benchmarking Image Transformers for Prostate Cancer Detection from Ultrasound Data
- arxiv url: http://arxiv.org/abs/2403.18233v1
- Date: Wed, 27 Mar 2024 03:39:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-28 18:26:17.628039
- Title: Benchmarking Image Transformers for Prostate Cancer Detection from Ultrasound Data
- Title(参考訳): 超音波による前立腺癌検出のためのベンチマーク画像変換器
- Authors: Mohamed Harmanani, Paul F. R. Wilson, Fahimeh Fooladgar, Amoon Jamzad, Mahdi Gilany, Minh Nguyen Nhat To, Brian Wodlinger, Purang Abolmaesumi, Parvin Mousavi,
- Abstract要約: 超音波画像における前立腺癌(PCa)の分類のための深層学習法は、通常、針トレース領域に沿った小さな領域(ROI)におけるがんを検出するために、畳み込みネットワーク(CNN)を用いている。
マルチ・インスタンス・ラーニング(MIL)を用いて複数のROIから癌を検出するために,トランスフォーマーの認識とCNN特徴抽出器を組み合わせることで,この問題を軽減するためのマルチスケールアプローチが提案されている。
本稿では、ROIスケールおよびマルチスケールの分類のための複数の画像トランスフォーマーアーキテクチャについて検討し、超音波による前立腺癌分類のためのCNNとトランスフォーマーの性能の比較を行った。
- 参考スコア(独自算出の注目度): 3.8208601340697386
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: PURPOSE: Deep learning methods for classifying prostate cancer (PCa) in ultrasound images typically employ convolutional networks (CNNs) to detect cancer in small regions of interest (ROI) along a needle trace region. However, this approach suffers from weak labelling, since the ground-truth histopathology labels do not describe the properties of individual ROIs. Recently, multi-scale approaches have sought to mitigate this issue by combining the context awareness of transformers with a CNN feature extractor to detect cancer from multiple ROIs using multiple-instance learning (MIL). In this work, we present a detailed study of several image transformer architectures for both ROI-scale and multi-scale classification, and a comparison of the performance of CNNs and transformers for ultrasound-based prostate cancer classification. We also design a novel multi-objective learning strategy that combines both ROI and core predictions to further mitigate label noise. METHODS: We evaluate 3 image transformers on ROI-scale cancer classification, then use the strongest model to tune a multi-scale classifier with MIL. We train our MIL models using our novel multi-objective learning strategy and compare our results to existing baselines. RESULTS: We find that for both ROI-scale and multi-scale PCa detection, image transformer backbones lag behind their CNN counterparts. This deficit in performance is even more noticeable for larger models. When using multi-objective learning, we can improve performance of MIL, with a 77.9% AUROC, a sensitivity of 75.9%, and a specificity of 66.3%. CONCLUSION: Convolutional networks are better suited for modelling sparse datasets of prostate ultrasounds, producing more robust features than transformers in PCa detection. Multi-scale methods remain the best architecture for this task, with multi-objective learning presenting an effective way to improve performance.
- Abstract(参考訳): PURPOSE: 超音波画像中の前立腺癌(PCa)を分類するための深層学習法は、通常、針のトレース領域に沿って小さな領域(ROI)のがんを検出するために、畳み込みネットワーク(CNN)を用いている。
しかし、この手法は個々のROIの特性を記述していないため、弱いラベル付けに悩まされる。
近年,MIL(Multiple-instance Learning)を用いた複数のROIから癌を検出するために,変換器のコンテキスト認識とCNN特徴抽出器を組み合わせたマルチスケールアプローチが試みられている。
本研究では、ROIスケールおよびマルチスケールの分類のための複数の画像トランスフォーマーアーキテクチャの詳細な研究と、超音波による前立腺癌分類のためのCNNとトランスフォーマーの性能の比較について述べる。
また、ROIとコア予測を組み合わせた新しい多目的学習戦略を設計し、ラベルノイズをさらに緩和する。
方法: ROIスケール癌分類における3つの画像変換器の評価を行い, 最強モデルを用いてマルチスケール分類器をMILでチューニングする。
我々は、新しい多目的学習戦略を用いてMILモデルを訓練し、その結果を既存のベースラインと比較する。
RESULTS: ROIスケールとマルチスケールのPCa検出では,画像トランスフォーマーのバックボーンがCNNのバックボーンに遅れていることがわかった。
この性能の欠如は、より大きなモデルにとってさらに顕著である。
多目的学習では、77.9%のAUROC、75.9%の感度、66.3%の特異性でMILの性能を向上させることができる。
ConCLUSION: 畳み込みネットワークは、前立腺超音波のスパースデータセットをモデル化するのに適しており、PCa検出におけるトランスフォーマーよりも堅牢な特徴を生み出す。
マルチスケールな手法はこのタスクに最適なアーキテクチャのままであり、多目的学習はパフォーマンスを改善する効果的な方法を示す。
関連論文リスト
- Towards a Benchmark for Colorectal Cancer Segmentation in Endorectal Ultrasound Videos: Dataset and Model Development [59.74920439478643]
本稿では,多様なERUSシナリオをカバーする最初のベンチマークデータセットを収集し,注釈付けする。
ERUS-10Kデータセットは77の動画と10,000の高解像度アノテートフレームで構成されています。
本稿では,ASTR (Adaptive Sparse-context TRansformer) という大腸癌セグメンテーションのベンチマークモデルを提案する。
論文 参考訳(メタデータ) (2024-08-19T15:04:42Z) - Segmentation of Non-Small Cell Lung Carcinomas: Introducing DRU-Net and Multi-Lens Distortion [0.1935997508026988]
我々は,ヒト非小細胞肺癌の悪性度を規定するセグメンテーションモデル(DRU-Net)を提案している。
我々は提案したモデルを作成するために2つのデータセット(ノルウェーの肺がんバイオバンクとHaukeland大学肺がんコホート)を使用した。
提案した空間拡張法(マルチレンズ歪み)により,ネットワーク性能は3%向上した。
論文 参考訳(メタデータ) (2024-06-20T13:14:00Z) - Affine-Consistent Transformer for Multi-Class Cell Nuclei Detection [76.11864242047074]
本稿では, 原子核位置を直接生成する新しいアフィン一貫性変換器 (AC-Former) を提案する。
本稿では,AAT (Adaptive Affine Transformer) モジュールを導入し,ローカルネットワークトレーニングのためのオリジナル画像をワープするための重要な空間変換を自動学習する。
実験結果から,提案手法は様々なベンチマークにおいて既存の最先端アルゴリズムを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2023-10-22T02:27:02Z) - Towards Optimal Patch Size in Vision Transformers for Tumor Segmentation [2.4540404783565433]
転移性大腸癌(mCRC)における腫瘍の検出は,肝癌の早期診断と治療において重要な役割を担っている。
完全畳み込みニューラルネットワーク(FCNN)によってバックボンドされたディープラーニングモデルは、3Dコンピュータ断層撮影(CT)スキャンのセグメンテーションにおいて支配的なモデルとなっている。
視覚変換器は、FCNNの受容野の局所性を解決するために導入された。
本稿では,転移病変の平均体積サイズに基づいて,視覚変換器の最適入力多重解像度画像パッチサイズを選択する手法を提案する。
論文 参考訳(メタデータ) (2023-08-31T09:57:27Z) - Breast Ultrasound Tumor Classification Using a Hybrid Multitask
CNN-Transformer Network [63.845552349914186]
胸部超音波(BUS)画像分類において,グローバルな文脈情報の収集が重要な役割を担っている。
ビジョントランスフォーマーは、グローバルなコンテキスト情報をキャプチャする能力が改善されているが、トークン化操作によって局所的なイメージパターンを歪めてしまう可能性がある。
本研究では,BUS腫瘍分類とセグメンテーションを行うハイブリッドマルチタスクディープニューラルネットワークであるHybrid-MT-ESTANを提案する。
論文 参考訳(メタデータ) (2023-08-04T01:19:32Z) - TRUSformer: Improving Prostate Cancer Detection from Micro-Ultrasound
Using Attention and Self-Supervision [7.503600085603685]
本研究の目的は,複数スケールのROIスケールと生検コアスケールのアプローチによるがん検出の改善である。
我々のモデルはROIスケールのみのモデルと比較して一貫した、実質的なパフォーマンス改善を示している。
論文 参考訳(メタデータ) (2023-03-03T18:12:46Z) - AMIGO: Sparse Multi-Modal Graph Transformer with Shared-Context
Processing for Representation Learning of Giga-pixel Images [53.29794593104923]
本稿では,スライド病理像全体に対する共有コンテキスト処理の新たな概念を提案する。
AMIGOは、組織内のセルラーグラフを使用して、患者に単一の表現を提供する。
我々のモデルは、データの20%以下で同じ性能を達成できる程度に、欠落した情報に対して強い堅牢性を示す。
論文 参考訳(メタデータ) (2023-03-01T23:37:45Z) - Hierarchical Transformer for Survival Prediction Using Multimodality
Whole Slide Images and Genomics [63.76637479503006]
下流タスクのためのギガピクセルレベルのスライド病理画像(WSI)の良質な表現を学習することが重要である。
本稿では,病理画像と対応する遺伝子間の階層的マッピングを学習する階層型マルチモーダルトランスフォーマーフレームワークを提案する。
より優れたWSI表現能力を維持しながら、ベンチマーク手法と比較してGPUリソースが少ないアーキテクチャです。
論文 参考訳(メタデータ) (2022-11-29T23:47:56Z) - Prostate Lesion Detection and Salient Feature Assessment Using
Zone-Based Classifiers [0.0]
マルチパラメトリックMRI(Multi-parametric magnetic resonance imaging)は前立腺癌の病変の検出において役割を担っている。
これらのスキャンを解釈する医療専門家は、コンピュータ支援検出システムを用いることで、ヒューマンエラーのリスクを低減することが重要である。
本稿では,各前立腺領域に最適な機械学習分類器について検討する。
論文 参考訳(メタデータ) (2022-08-24T13:08:56Z) - MSHT: Multi-stage Hybrid Transformer for the ROSE Image Analysis of
Pancreatic Cancer [5.604939010661757]
膵癌は世界で最も悪性ながんの1つであり、非常に高い死亡率で急速に悪化する。
自動ワークフローを実現するために,ハイブリッドな高性能ディープラーニングモデルを提案する。
4240個のROSE画像のデータセットを収集し、この未探索領域における手法を評価する。
論文 参考訳(メタデータ) (2021-12-27T05:04:11Z) - MS-Net: Multi-Site Network for Improving Prostate Segmentation with
Heterogeneous MRI Data [75.73881040581767]
本稿では,ロバスト表現を学習し,前立腺のセグメンテーションを改善するための新しいマルチサイトネットワーク(MS-Net)を提案する。
当社のMS-Netは,すべてのデータセットのパフォーマンスを一貫して改善し,マルチサイト学習における最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-02-09T14:11:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。