論文の概要: DCT-HistoTransformer: Efficient Lightweight Vision Transformer with DCT Integration for histopathological image analysis
- arxiv url: http://arxiv.org/abs/2410.19166v1
- Date: Thu, 24 Oct 2024 21:16:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-28 13:36:40.503127
- Title: DCT-HistoTransformer: Efficient Lightweight Vision Transformer with DCT Integration for histopathological image analysis
- Title(参考訳): DCT-Histo Transformer:DCTを併用した高能率軽視変換器の病理組織像解析への応用
- Authors: Mahtab Ranjbar, Mehdi Mohebbi, Mahdi Cherakhloo, Bijan Vosoughi. Vahdat,
- Abstract要約: 視覚変換器(ViTs)を用いた乳がんの新しい軽度分類法を提案する。
離散コサイン変換(DCT)アテンションとMobileConvの並列処理経路を組み込むことで、空間領域の画像データを周波数領域に変換し、画像内の高周波数をフィルタリングするといった利点を利用する。
提案モデルでは,バイナリ分類では96.00%$pm$0.48%,マルチクラス分類では87.85%$pm$0.93%の精度が得られた。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: In recent years, the integration of advanced imaging techniques and deep learning methods has significantly advanced computer-aided diagnosis (CAD) systems for breast cancer detection and classification. Transformers, which have shown great promise in computer vision, are now being applied to medical image analysis. However, their application to histopathological images presents challenges due to the need for extensive manual annotations of whole-slide images (WSIs), as these models require large amounts of data to work effectively, which is costly and time-consuming. Furthermore, the quadratic computational cost of Vision Transformers (ViTs) is particularly prohibitive for large, high-resolution histopathological images, especially on edge devices with limited computational resources. In this study, we introduce a novel lightweight breast cancer classification approach using transformers that operates effectively without large datasets. By incorporating parallel processing pathways for Discrete Cosine Transform (DCT) Attention and MobileConv, we convert image data from the spatial domain to the frequency domain to utilize the benefits such as filtering out high frequencies in the image, which reduces computational cost. This demonstrates the potential of our approach to improve breast cancer classification in histopathological images, offering a more efficient solution with reduced reliance on extensive annotated datasets. Our proposed model achieves an accuracy of 96.00% $\pm$ 0.48% for binary classification and 87.85% $\pm$ 0.93% for multiclass classification, which is comparable to state-of-the-art models while significantly reducing computational costs. This demonstrates the potential of our approach to improve breast cancer classification in histopathological images, offering a more efficient solution with reduced reliance on extensive annotated datasets.
- Abstract(参考訳): 近年,高度なイメージング技術とディープラーニング技術の統合により,乳がんの診断・分類のためのコンピュータ支援診断システム(CAD)が大幅に進歩している。
コンピュータビジョンにおいて大きな可能性を秘めているトランスフォーマーは、現在医療画像解析に応用されている。
しかし、それらの病理像への応用は、コストと時間を要する大量のデータを必要とするため、全スライディング画像(WSI)の広範な手動アノテーションの必要性から、課題を呈している。
さらに、視覚変換器(ViT)の二次計算コストは、特に大きな、高解像度の病理像、特に限られた計算資源を持つエッジデバイスでは禁止されている。
本研究では,大規模なデータセットを使わずに効果的に機能するトランスフォーマーを用いた,乳がんの新しい軽度分類手法を提案する。
離散コサイン変換(DCT)アテンションとMobileConvの並列処理経路を組み込むことで、空間領域から周波数領域へ画像データを変換し、画像中の高頻度をフィルタリングするといった利点を活用し、計算コストを低減させる。
このことは,病理組織像における乳癌分類の改善へのアプローチの可能性を示し,広範囲な注釈付きデータセットへの依存を減らし,より効率的な解決策を提供する。
提案モデルでは,2進分類では96.00%$\pm$0.48%,マルチクラス分類では87.85%$\pm$0.93%の精度が得られた。
このことは,病理組織像における乳癌分類の改善へのアプローチの可能性を示し,広範囲な注釈付きデータセットへの依存を減らし,より効率的な解決策を提供する。
関連論文リスト
- Efficient Visual State Space Model for Image Deblurring [83.57239834238035]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
論文 参考訳(メタデータ) (2024-05-23T09:13:36Z) - Application of Gated Recurrent Units for CT Trajectory Optimization [3.4916237834391874]
本稿では, Gated Recurrent Units (GRUs) を用いたCTスキャントラジェクトリの最適化手法を提案する。
我々はコーンビームCTに焦点をあて、吸収、画素強度、コントラスト・ツー・ノイズ比、データの完全性など、プロジェクションに基づくいくつかの指標を用いている。
その結果,GRU最適化スキャントラジェクトリは,画像品質の指標から従来の円形CTトラジェクトリよりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-05-15T13:33:23Z) - Deep Few-view High-resolution Photon-counting Extremity CT at Halved Dose for a Clinical Trial [8.393536317952085]
ニュージーランドの臨床試験において,PCCT画像の半減量と2倍の速度で再現する深層学習に基づくアプローチを提案する。
本稿では,GPUメモリの制限を緩和するパッチベースのボリュームリファインメントネットワーク,合成データを用いたトレーニングネットワーク,およびモデルベースの反復リファインメントを用いて,合成データと実世界のギャップを埋める。
論文 参考訳(メタデータ) (2024-03-19T00:07:48Z) - Rapid hyperspectral photothermal mid-infrared spectroscopic imaging from
sparse data for gynecologic cancer tissue subtyping [3.550171634694342]
ミドル赤外線(Mid-Infrared、MIR)は、ラベルなし、生化学的に定量的な技術である。
この研究は、MIR光熱画像への新しいアプローチを示し、その速度を桁違いに向上させる。
論文 参考訳(メタデータ) (2024-02-28T00:57:35Z) - SeUNet-Trans: A Simple yet Effective UNet-Transformer Model for Medical
Image Segmentation [0.0]
医用画像セグメンテーションのためのシンプルなUNet-Transformer(seUNet-Trans)モデルを提案する。
提案手法では,UNetモデルを特徴抽出器として設計し,入力画像から複数の特徴マップを生成する。
UNetアーキテクチャと自己認識機構を活用することで、我々のモデルはローカルとグローバルの両方のコンテキスト情報を保存するだけでなく、入力要素間の長距離依存関係をキャプチャできる。
論文 参考訳(メタデータ) (2023-10-16T01:13:38Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - Preservation of High Frequency Content for Deep Learning-Based Medical
Image Classification [74.84221280249876]
大量の胸部ラジオグラフィーの効率的な分析は、医師や放射線技師を助けることができる。
本稿では,視覚情報の効率的な識別と符号化のための離散ウェーブレット変換(DWT)を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:29:54Z) - Incremental Cross-view Mutual Distillation for Self-supervised Medical
CT Synthesis [88.39466012709205]
本稿では,スライス間の分解能を高めるために,新しい医療スライスを構築した。
臨床実践において, 根本・中間医療スライスは常に欠落していることを考慮し, 相互蒸留の段階的相互蒸留戦略を導入する。
提案手法は,最先端のアルゴリズムよりも明確なマージンで優れる。
論文 参考訳(メタデータ) (2021-12-20T03:38:37Z) - A Multi-Stage Attentive Transfer Learning Framework for Improving
COVID-19 Diagnosis [49.3704402041314]
新型コロナの診断を改善するための多段階集中移動学習フレームワークを提案する。
提案するフレームワークは、複数のソースタスクと異なるドメインのデータから知識を学習し、正確な診断モデルを訓練する3つの段階からなる。
本稿では,肺CT画像のマルチスケール表現を学習するための自己教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2021-01-14T01:39:19Z) - Boosted EfficientNet: Detection of Lymph Node Metastases in Breast
Cancer Using Convolutional Neural Network [6.444922476853511]
The Convolutional Neutral Network (CNN) は乳癌のリンパ節転移の予測と分類に応用されている。
そこで本研究では,小さな解像度画像を容易にするためのRandom Center Cropping (RCC) という新しいデータ拡張手法を提案する。
論文 参考訳(メタデータ) (2020-10-10T15:18:56Z) - Pathological Retinal Region Segmentation From OCT Images Using Geometric
Relation Based Augmentation [84.7571086566595]
本稿では,幾何学と形状の内在的関係を共同で符号化することで,従来のGANベースの医用画像合成法よりも優れた手法を提案する。
提案手法は,取得手順の異なる画像を有する公開RETOUCHデータセット上で,最先端のセグメンテーション手法より優れている。
論文 参考訳(メタデータ) (2020-03-31T11:50:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。