論文の概要: ViPTT-Net: Video pretraining of spatio-temporal model for tuberculosis
type classification from chest CT scans
- arxiv url: http://arxiv.org/abs/2105.12810v1
- Date: Wed, 26 May 2021 20:00:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-29 12:32:10.129164
- Title: ViPTT-Net: Video pretraining of spatio-temporal model for tuberculosis
type classification from chest CT scans
- Title(参考訳): ViPTT-Net:胸部CTによる結核型分類のための時空間モデルの作成
- Authors: Hasib Zunair, Aimon Rahman, and Nabeel Mohammed
- Abstract要約: 事前学習は、限られたデータから学習し、一般化を改善する深層学習への関心を喚起した。
我々は、現実的なビデオでモデルを事前訓練することで、モデルをゼロからトレーニングするよりも、パフォーマンスを向上させることができるかどうかを考察する。
我々のモデルは ViPTT-Net と呼ばれ、人間の活動のラベル付き1300本以上のビデオクリップで訓練され、その後、結核型のラベル付き胸部CTスキャンで微調整された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pretraining has sparked groundswell of interest in deep learning workflows to
learn from limited data and improve generalization. While this is common for 2D
image classification tasks, its application to 3D medical imaging tasks like
chest CT interpretation is limited. We explore the idea of whether pretraining
a model on realistic videos could improve performance rather than training the
model from scratch, intended for tuberculosis type classification from chest CT
scans. To incorporate both spatial and temporal features, we develop a hybrid
convolutional neural network (CNN) and recurrent neural network (RNN) model,
where the features are extracted from each axial slice of the CT scan by a CNN,
these sequence of image features are input to a RNN for classification of the
CT scan. Our model termed as ViPTT-Net, was trained on over 1300 video clips
with labels of human activities, and then fine-tuned on chest CT scans with
labels of tuberculosis type. We find that pretraining the model on videos lead
to better representations and significantly improved model validation
performance from a kappa score of 0.17 to 0.35, especially for
under-represented class samples. Our best method achieved 2nd place in the
ImageCLEF 2021 Tuberculosis - TBT classification task with a kappa score of
0.20 on the final test set with only image information (without using clinical
meta-data). All codes and models are made available.
- Abstract(参考訳): 事前トレーニングは、限られたデータから学習し、一般化を改善するためのディープラーニングワークフローへの関心を喚起した。
これは2次元画像分類タスクに共通しているが、胸部CT解釈のような3次元医療画像タスクへの応用は限られている。
胸部CT画像から結核型分類を意図した,現実的なビデオの事前学習が,スクラッチからモデルをトレーニングするよりも,パフォーマンスを向上させることができるかどうかを検討する。
空間的特徴と時間的特徴の両方を組み込んだハイブリッド畳み込みニューラルネットワーク(CNN)とリカレントニューラルネットワーク(RNN)モデルを構築し、CTスキャンの各軸スライスから特徴を抽出し、これらの特徴のシーケンスをCTスキャンの分類のためにRNNに入力する。
我々のモデルは ViPTT-Net と呼ばれ、人間の活動のラベル付き1300本以上のビデオクリップで訓練され、その後、結核型のラベル付き胸部CTスキャンで微調整された。
ビデオ上での事前学習により表現性が向上し,カッパスコア0.17から0.35までのモデル検証性能が大幅に向上することが判明した。
ImageCLEF 2021 tuberculosis - Kappaスコア0.20のTBT分類タスクにおいて,画像情報のみを用いた最終テストにおいて,臨床メタデータを使用しない2位に到達した。
すべてのコードとモデルは利用可能である。
関連論文リスト
- Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - Strong Baseline and Bag of Tricks for COVID-19 Detection of CT Scans [2.696776905220987]
従来のディープラーニングフレームワークは、CT画像のスライス数や解像度の変化によって互換性の問題に直面する。
この制限に対処するために,各CTデータセットに対して新しいスライス選択法を提案する。
上記の方法に加えて、様々な高性能分類モデルについて検討し、最終的には有望な結果を得る。
論文 参考訳(メタデータ) (2023-03-15T09:52:28Z) - CNN Filter Learning from Drawn Markers for the Detection of Suggestive
Signs of COVID-19 in CT Images [58.720142291102135]
畳み込みニューラルネットワーク(CNN)のフィルタを推定するために,大規模な注釈付きデータセットやバックプロパゲーションを必要としない手法を提案する。
少数のCT画像に対して、ユーザは、代表的な正常領域と異常領域にマーカーを描画する。
本発明の方法は、カーネルがマークされたものに似た拡張領域に特有な一連の畳み込み層からなる特徴抽出器を生成する。
論文 参考訳(メタデータ) (2021-11-16T15:03:42Z) - Data Augmentation and CNN Classification For Automatic COVID-19
Diagnosis From CT-Scan Images On Small Dataset [0.0]
肺CT画像からのCOVID1-19自動診断フレームワークを提案する。
本論文では,複数のHounsfield Unit(HU)正規化ウィンドウを用いた一意かつ効果的なデータ拡張手法を提案する。
トレーニング・検証データセットでは,患者の分類精度は93.39%である。
論文 参考訳(メタデータ) (2021-08-16T15:23:00Z) - ViViT: A Video Vision Transformer [75.74690759089529]
ビデオ分類にpure-transformerベースのモデルを提案する。
本モデルでは,入力ビデオから時間トークンを抽出し,一連のトランスフォーマー層で符号化する。
トレーニング中にモデルを効果的に正規化し、トレーニング済みの画像モデルを利用して比較的小さなデータセットでトレーニングできることを示します。
論文 参考訳(メタデータ) (2021-03-29T15:27:17Z) - COVID-19 identification from volumetric chest CT scans using a
progressively resized 3D-CNN incorporating segmentation, augmentation, and
class-rebalancing [4.446085353384894]
新型コロナウイルスは世界的なパンデミックの流行だ。
高い感度のコンピュータ支援スクリーニングツールは、疾患の診断と予後に不可欠である。
本稿では,3次元畳み込みニューラルネットワーク(CNN)に基づく分類手法を提案する。
論文 参考訳(メタデータ) (2021-02-11T18:16:18Z) - Automated Model Design and Benchmarking of 3D Deep Learning Models for
COVID-19 Detection with Chest CT Scans [72.04652116817238]
3D胸部CTスキャン分類のための3D DLモデルを自動的に検索するための差別化可能なニューラルネットワーク探索(DNAS)フレームワークを提案する。
また,我々のモデルのクラスアクティベーションマッピング(cam)技術を利用して,結果の解釈可能性を提供する。
論文 参考訳(メタデータ) (2021-01-14T03:45:01Z) - A Multi-Stage Attentive Transfer Learning Framework for Improving
COVID-19 Diagnosis [49.3704402041314]
新型コロナの診断を改善するための多段階集中移動学習フレームワークを提案する。
提案するフレームワークは、複数のソースタスクと異なるドメインのデータから知識を学習し、正確な診断モデルを訓練する3つの段階からなる。
本稿では,肺CT画像のマルチスケール表現を学習するための自己教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2021-01-14T01:39:19Z) - Classification of COVID-19 in CT Scans using Multi-Source Transfer
Learning [91.3755431537592]
我々は,従来のトランスファー学習の改良にマルチソース・トランスファー・ラーニングを応用して,CTスキャンによる新型コロナウイルスの分類を提案する。
マルチソースファインチューニングアプローチでは、ImageNetで微調整されたベースラインモデルよりも優れています。
我々の最高のパフォーマンスモデルは、0.893の精度と0.897のリコールスコアを達成でき、ベースラインのリコールスコアを9.3%上回った。
論文 参考訳(メタデータ) (2020-09-22T11:53:06Z) - Improving Automated COVID-19 Grading with Convolutional Neural Networks
in Computed Tomography Scans: An Ablation Study [3.072491397378425]
本稿では,CNNに基づくCT画像からのCOVID-19グレーティングのためのアルゴリズムの性能向上に寄与する各種成分を同定する。
これらの成分を用いた3D CNNは, テストセット105CTでは0.934のLOC曲線 (AUC) , 公開されている742CTでは0.923のAUCを達成した。
論文 参考訳(メタデータ) (2020-09-21T09:58:57Z) - Accurate and Efficient Intracranial Hemorrhage Detection and Subtype
Classification in 3D CT Scans with Convolutional and Long Short-Term Memory
Neural Networks [20.4701676109641]
RSNA頭蓋内出血検出のためのシステムについて紹介する。
提案システムは,畳み込みニューラルネットワーク(CNN)を用いた軽量深層ニューラルネットワークアーキテクチャに基づいている。
最終テストセットの重み付き平均ログ損失は0.04989で、合計1345名から上位30名(2%)にランクインした。
論文 参考訳(メタデータ) (2020-08-01T17:28:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。