論文の概要: Dual-Task Vision Transformer for Rapid and Accurate Intracerebral Hemorrhage CT Image Classification
- arxiv url: http://arxiv.org/abs/2405.06814v3
- Date: Fri, 2 Aug 2024 18:40:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-07 18:52:52.121680
- Title: Dual-Task Vision Transformer for Rapid and Accurate Intracerebral Hemorrhage CT Image Classification
- Title(参考訳): 高速・高精度脳内出血CT画像分類のためのデュアルタスク・ビジョン・トランス
- Authors: Jialiang Fan, Xinhui Fan, Chengyan Song, Xiaofan Wang, Bingdong Feng, Lucan Li, Guoyu Lu,
- Abstract要約: 脳内出血 (ICH) は、脳血管の破裂によって引き起こされる疾患である。
ICH画像の自動分類と診断のためのニューラルネットワーク構造であるDouble-task Vision Transformer(DTViT)を提案する。
- 参考スコア(独自算出の注目度): 9.058538258023383
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Intracerebral hemorrhage (ICH) is a severe and sudden medical condition caused by the rupture of blood vessels in the brain, leading to permanent damage to brain tissue and often resulting in functional disabilities or death in patients. Diagnosis and analysis of ICH typically rely on brain CT imaging. Given the urgency of ICH conditions, early treatment is crucial, necessitating rapid analysis of CT images to formulate tailored treatment plans. However, the complexity of ICH CT images and the frequent scarcity of specialist radiologists pose significant challenges. Therefore, we collect a dataset from the real world for ICH and normal classification and three types of ICH image classification based on the hemorrhage location, i.e., Deep, Subcortical, and Lobar. In addition, we propose a neural network structure, dual-task vision transformer (DTViT), for the automated classification and diagnosis of ICH images. The DTViT deploys the encoder from the Vision Transformer (ViT), employing attention mechanisms for feature extraction from CT images. The proposed DTViT framework also incorporates two multilayer perception (MLP)-based decoders to simultaneously identify the presence of ICH and classify the three types of hemorrhage locations. Experimental results demonstrate that DTViT performs well on the real-world test dataset. The code and newly collected dataset for this work are available at: https://github.com/jfan1997/DTViT.
- Abstract(参考訳): 脳内出血 (ICH) は、脳血管の破裂によって引き起こされる重篤で急激な医学的症状であり、脳組織に永続的な損傷を与え、しばしば機能障害や死亡を引き起こす。
ICHの診断と解析は、通常、脳のCT画像に頼っている。
ICH 条件の緊急性を考えると,早期治療は極めて重要である。
しかし、ICHCT画像の複雑さと専門医の頻繁な不足は重要な課題である。
そこで本研究では,ICHと正常分類のための実世界からデータセットを収集し,出血位置,すなわちDeep,Subcortical,Lobarの3種類のICH画像分類を行う。
さらに、ICH画像の自動分類と診断のためのニューラルネットワーク構造であるDouble-task Vision Transformer(DTViT)を提案する。
DTViTは、視覚変換器(ViT)からエンコーダをデプロイし、CT画像からの特徴抽出に注意機構を用いる。
提案するDTViTフレームワークは、2つの多層認識(MLP)ベースのデコーダを組み込んで、ICHの存在を同時に識別し、3種類の出血部位を分類する。
実験の結果,DTViTは実世界のテストデータセットで良好に動作することがわかった。
この作業のためのコードと新たに収集されたデータセットは、https://github.com/jfan 1997/DTViT.comで公開されている。
関連論文リスト
- Deep Learning for Vascular Segmentation and Applications in Phase
Contrast Tomography Imaging [33.23991248643144]
本稿では,多様な臓器にまたがる機械学習技術の現状を概説する。
我々のゴールは、このトピックの基礎を提供し、新しい画像モダリティで血管セグメンテーションに適用するための堅牢なベースラインモデルを特定することである。
HiP CTは、1ボクセルあたり20mmという前例のない解像度で、完全な臓器の3Dイメージングを可能にする。
論文 参考訳(メタデータ) (2023-11-22T11:15:38Z) - Identification of Hemorrhage and Infarct Lesions on Brain CT Images
using Deep Learning [3.5263317784479953]
頭部CTスキャンにおける異常脳組織の手動アノテーションの基準は、重大な欠点を伴っている。
頭蓋内出血 (ICH) と梗塞の判定は, 画像テクスチャ, ボリュームサイズ, スキャン品質の変動が原因で困難である。
本研究は,頭部CTスキャンからICHと梗塞を同定するDLベースのアルゴリズムを検証した。
論文 参考訳(メタデータ) (2023-07-10T09:00:12Z) - Deep learning network to correct axial and coronal eye motion in 3D OCT
retinal imaging [65.47834983591957]
深層学習に基づくニューラルネットワークを用いて,OCTの軸運動とコロナ運動のアーチファクトを1つのスキャンで補正する。
実験結果から, 提案手法は動作アーチファクトを効果的に補正し, 誤差が他の方法よりも小さいことを示す。
論文 参考訳(メタデータ) (2023-05-27T03:55:19Z) - Data-Efficient Vision Transformers for Multi-Label Disease
Classification on Chest Radiographs [55.78588835407174]
視覚変換器(ViT)は一般的な画像の分類性能が高いにもかかわらず、このタスクには適用されていない。
ViTは、畳み込みではなくパッチベースの自己アテンションに依存しており、CNNとは対照的に、ローカル接続に関する事前の知識は存在しない。
以上の結果から,ViTとCNNのパフォーマンスはViTの利点に匹敵するものの,DeiTsはトレーニング用に適度に大規模なデータセットが利用可能であれば,前者よりも優れることがわかった。
論文 参考訳(メタデータ) (2022-08-17T09:07:45Z) - Slice-level Detection of Intracranial Hemorrhage on CT Using Deep
Descriptors of Adjacent Slices [0.31317409221921133]
そこで本研究では,隣接するスライスのディスクリプタに基づいて,CTスキャンでエンフスライスレベルの分類器を訓練する新しい手法を提案する。
我々は、RSNA頭蓋内出血データセットの課題における、最高のパフォーマンスソリューションの上位4%において、単一のモデルを得る。
提案手法は汎用的であり,MRIなどの他の3次元診断タスクにも適用可能である。
論文 参考訳(メタデータ) (2022-08-05T23:20:37Z) - UniToBrain dataset: a Brain Perfusion Dataset [2.02258267891574]
では、UniToBrainを紹介します。
本稿では,画像処理と深層学習モデル開発のために,欧州のECVLとEDDLを用いたニューラルネットワークに基づく新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-01T07:16:02Z) - Robust Weakly Supervised Learning for COVID-19 Recognition Using
Multi-Center CT Images [8.207602203708799]
重症急性呼吸器症候群ウイルス2(SARS-CoV-2)による新型コロナウイルス感染症2019(COVID-19)
異なる病院にあるCTスキャナの様々な技術的仕様のため、CT画像の出現は、多くの自動画像認識アプローチの失敗に繋がる。
新型コロナウイルスのCTスキャン認識モデル、すなわち新型コロナウイルス情報融合診断ネットワーク(CIFD-Net)を提案する。
本モデルでは,CTスキャン画像の外観の相違を,他の最先端手法と比較して精度が高く,確実かつ効率的に解決することができる。
論文 参考訳(メタデータ) (2021-12-09T15:22:03Z) - CyTran: A Cycle-Consistent Transformer with Multi-Level Consistency for
Non-Contrast to Contrast CT Translation [56.622832383316215]
コントラストCTを非コントラストCTに変換する手法を提案する。
提案手法は、CyTranを略して、サイクル一貫性のある生成逆転変換器に基づいている。
実験の結果、CyTranは競合するすべての手法より優れています。
論文 参考訳(メタデータ) (2021-10-12T23:25:03Z) - COVIDNet-CT: A Tailored Deep Convolutional Neural Network Design for
Detection of COVID-19 Cases from Chest CT Images [75.74756992992147]
我々は、胸部CT画像からCOVID-19の症例を検出するのに適した、深層畳み込みニューラルネットワークアーキテクチャであるCOVIDNet-CTを紹介した。
また,中国生体情報センターが収集したCT画像データから得られたベンチマークCT画像データセットであるCOVIDx-CTも紹介した。
論文 参考訳(メタデータ) (2020-09-08T15:49:55Z) - A Benchmark for Studying Diabetic Retinopathy: Segmentation, Grading,
and Transferability [76.64661091980531]
糖尿病患者は糖尿病網膜症(DR)を発症するリスクがある
コンピュータ支援型DR診断は、DRの早期検出と重度評価のための有望なツールである。
このデータセットは、ピクセルレベルのDR関連病変アノテーションを持つ1,842枚の画像と、6人の眼科医によって評価された画像レベルのラベルを持つ1,000枚の画像を有する。
論文 参考訳(メタデータ) (2020-08-22T07:48:04Z) - Synergistic Learning of Lung Lobe Segmentation and Hierarchical
Multi-Instance Classification for Automated Severity Assessment of COVID-19
in CT Images [61.862364277007934]
3次元CT画像におけるCOVID-19の重症度自動評価のための相乗的学習フレームワークを提案する。
マルチタスクのディープネットワーク(M$2$UNet)が開発され、新型コロナウイルス患者の重症度を評価する。
われわれのM$2$UNetはパッチレベルのエンコーダと肺葉分画のためのセグメンテーションサブネットワークと重度評価のための分類サブネットワークから構成されている。
論文 参考訳(メタデータ) (2020-05-08T03:16:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。