論文の概要: Benchmarking CNN on 3D Anatomical Brain MRI: Architectures, Data
Augmentation and Deep Ensemble Learning
- arxiv url: http://arxiv.org/abs/2106.01132v2
- Date: Mon, 17 Apr 2023 12:48:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-19 01:20:45.658503
- Title: Benchmarking CNN on 3D Anatomical Brain MRI: Architectures, Data
Augmentation and Deep Ensemble Learning
- Title(参考訳): 3次元解剖学的脳MRIにおけるCNNのベンチマーク:アーキテクチャ、データ拡張、ディープラーニング
- Authors: Benoit Dufumier, Pietro Gori, Ilaria Battaglia, Julie Victor, Antoine
Grigis, Edouard Duchesnay
- Abstract要約: 我々は最近のSOTA(State-of-the-art)3D CNNの広範なベンチマークを提案し、データ拡張と深層アンサンブル学習の利点も評価した。
年齢予測,性別分類,統合失調症診断の3つの課題について,N=10kスキャンを含む多地点の脳解剖学的MRIデータセットを用いて実験を行った。
その結果,VBM画像の予測精度は擬似RAWデータよりも有意に向上した。
DenseNetとSmall-DenseNetは、私たちが提案したより軽量なバージョンで、すべてのデータレシエーションのパフォーマンスにおいて優れた妥協を提供する。
- 参考スコア(独自算出の注目度): 2.1446056201053185
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Deep Learning (DL) and specifically CNN models have become a de facto method
for a wide range of vision tasks, outperforming traditional machine learning
(ML) methods. Consequently, they drew a lot of attention in the neuroimaging
field in particular for phenotype prediction or computer-aided diagnosis.
However, most of the current studies often deal with small single-site cohorts,
along with a specific pre-processing pipeline and custom CNN architectures,
which make them difficult to compare to. We propose an extensive benchmark of
recent state-of-the-art (SOTA) 3D CNN, evaluating also the benefits of data
augmentation and deep ensemble learning, on both Voxel-Based Morphometry (VBM)
pre-processing and quasi-raw images. Experiments were conducted on a large
multi-site 3D brain anatomical MRI data-set comprising N=10k scans on 3
challenging tasks: age prediction, sex classification, and schizophrenia
diagnosis. We found that all models provide significantly better predictions
with VBM images than quasi-raw data. This finding evolved as the training set
approaches 10k samples where quasi-raw data almost reach the performance of
VBM. Moreover, we showed that linear models perform comparably with SOTA CNN on
VBM data. We also demonstrated that DenseNet and tiny-DenseNet, a lighter
version that we proposed, provide a good compromise in terms of performance in
all data regime. Therefore, we suggest to employ them as the architectures by
default. Critically, we also showed that current CNN are still very biased
towards the acquisition site, even when trained with N=10k multi-site images.
In this context, VBM pre-processing provides an efficient way to limit this
site effect. Surprisingly, we did not find any clear benefit from data
augmentation techniques. Finally, we proved that deep ensemble learning is well
suited to re-calibrate big CNN models without sacrificing performance.
- Abstract(参考訳): ディープラーニング(DL)、特にCNNモデルは、さまざまなビジョンタスクのデファクトメソッドとなり、従来の機械学習(ML)メソッドよりも優れています。
その結果、特に表現型予測やコンピュータ支援診断において、神経画像の分野で多くの注目を集めた。
しかしながら、現在の研究の多くは、特定の前処理パイプラインやカスタムCNNアーキテクチャとともに、小さなシングルサイトコホートを扱うことが多いため、比較するのは困難である。
本稿では,Voxel-Based Morphometry(VBM)前処理と準RAW画像の両面から,データ拡張と深層アンサンブル学習の利点を評価するため,最近のSOTA(State-of-the-art)3D CNNの広範なベンチマークを提案する。
年齢予測,性別分類,統合失調症診断の3つの課題について,N=10kスキャンを含む多地点脳解剖学的MRIデータセットを用いて実験を行った。
その結果,VBM画像の予測精度は準RAWデータよりも有意に向上した。
トレーニングセットが10kサンプルに近づき、準ローデータがほぼVBMの性能に達すると、この発見は進化した。
さらに,線形モデルはVBMデータ上でSOTA CNNと同等に動作することを示した。
また、DenseNetとSmall-DenseNetは、私たちが提案したより軽量なバージョンで、すべてのデータ構造のパフォーマンスにおいて良い妥協をもたらすことを実証しました。
したがって、既定のアーキテクチャとして採用することを提案する。
また,N=10kのマルチサイトイメージをトレーニングしても,現在のCNNは依然として買収サイトに偏っていることも確認した。
この文脈では、VBM前処理は、このサイト効果を制限する効率的な方法を提供する。
驚いたことに、データ拡張技術の明確なメリットは見つからなかった。
最後に,大規模CNNモデルの校正に深層アンサンブル学習が適していることを確認した。
関連論文リスト
- MedSegMamba: 3D CNN-Mamba Hybrid Architecture for Brain Segmentation [15.514511820130474]
我々は皮質下脳分割のための3DパッチベースのハイブリッドCNN-Mambaモデルを開発した。
モデルの性能をいくつかのベンチマークで検証した。
論文 参考訳(メタデータ) (2024-09-12T02:19:19Z) - Hybrid CNN Bi-LSTM neural network for Hyperspectral image classification [1.2691047660244332]
本稿では,3次元CNN,2次元CNN,Bi-LSTMを組み合わせたニューラルネットワークを提案する。
99.83、99.98、100%の精度を達成でき、それぞれIP、PU、SAデータセットにおける最先端モデルのトレーニング可能なパラメータは30%に過ぎなかった。
論文 参考訳(メタデータ) (2024-02-15T15:46:13Z) - Masked LoGoNet: Fast and Accurate 3D Image Analysis for Medical Domain [48.440691680864745]
我々はLoGoNetと呼ばれる新しいニューラルネットワークアーキテクチャを導入する。
LoGoNetは、LKA(Large Kernel Attention)とデュアルエンコーディング戦略を利用して、U字型アーキテクチャに新しい特徴抽出器を統合する。
大規模ラベル付きデータセットの欠如を補うために,3次元画像に適した新しいSSL方式を提案する。
論文 参考訳(メタデータ) (2024-02-09T05:06:58Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Delving Deeper into Data Scaling in Masked Image Modeling [145.36501330782357]
視覚認識のためのマスク付き画像モデリング(MIM)手法のスケーリング能力に関する実証的研究を行った。
具体的には、Webで収集したCoyo-700Mデータセットを利用する。
我々のゴールは、データとモデルのサイズの異なるスケールでダウンストリームタスクのパフォーマンスがどのように変化するかを調べることです。
論文 参考訳(メタデータ) (2023-05-24T15:33:46Z) - Classification of diffraction patterns using a convolutional neural
network in single particle imaging experiments performed at X-ray
free-electron lasers [53.65540150901678]
X線自由電子レーザー(XFEL)における単一粒子イメージング(SPI)は、その自然環境における粒子の3次元構造を決定するのに特に適している。
再建を成功させるためには、単一のヒットに由来する回折パターンを多数の取得パターンから分離する必要がある。
本稿では,この課題を画像分類問題として定式化し,畳み込みニューラルネットワーク(CNN)アーキテクチャを用いて解決することを提案する。
論文 参考訳(メタデータ) (2021-12-16T17:03:14Z) - 3DVNet: Multi-View Depth Prediction and Volumetric Refinement [68.68537312256144]
3DVNetは、新しいマルチビューステレオ(MVS)深度予測法である。
私たちのキーとなるアイデアは、粗い深度予測を反復的に更新する3Dシーンモデリングネットワークを使用することです。
本手法は, 深度予測と3次元再構成の両指標において, 最先端の精度を超えることを示す。
論文 参考訳(メタデータ) (2021-12-01T00:52:42Z) - Contrastive Learning with Continuous Proxy Meta-Data for 3D MRI
Classification [1.714108629548376]
我々は、y-Aware InfoNCE Losという新たな損失を導入することで、対照的な学習フレームワークにおいて、継続的なプロキシメタデータを活用することを提案する。
104ドルの健康脳MRIスキャンで事前訓練された3D CNNモデルは、3つの分類タスクに関連する特徴を抽出することができる。
微調整された場合、これらのタスクをスクラッチからトレーニングした3D CNNと、最先端の自己管理手法を上回ります。
論文 参考訳(メタデータ) (2021-06-16T14:17:04Z) - Combining Deep Transfer Learning with Signal-image Encoding for
Multi-Modal Mental Wellbeing Classification [2.513785998932353]
本稿では,複数のマルチモーダルデータセット上で感情状態認識を行う際の限界に対処する枠組みを提案する。
5-point Likertスケールで評価された実世界の幸福度を推定する際のモデル性能は,我々のフレームワークを用いて向上できることを示す。
論文 参考訳(メタデータ) (2020-11-20T13:37:23Z) - Improving Automated COVID-19 Grading with Convolutional Neural Networks
in Computed Tomography Scans: An Ablation Study [3.072491397378425]
本稿では,CNNに基づくCT画像からのCOVID-19グレーティングのためのアルゴリズムの性能向上に寄与する各種成分を同定する。
これらの成分を用いた3D CNNは, テストセット105CTでは0.934のLOC曲線 (AUC) , 公開されている742CTでは0.923のAUCを達成した。
論文 参考訳(メタデータ) (2020-09-21T09:58:57Z) - Fed-Sim: Federated Simulation for Medical Imaging [131.56325440976207]
本稿では、2つの学習可能なニューラルモジュールからなる物理駆動型生成手法を提案する。
データ合成フレームワークは、複数のデータセットの下流セグメンテーション性能を改善する。
論文 参考訳(メタデータ) (2020-09-01T19:17:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。