論文の概要: Deep Learning in current Neuroimaging: a multivariate approach with
power and type I error control but arguable generalization ability
- arxiv url: http://arxiv.org/abs/2103.16685v1
- Date: Tue, 30 Mar 2021 21:15:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-02 09:04:26.607068
- Title: Deep Learning in current Neuroimaging: a multivariate approach with
power and type I error control but arguable generalization ability
- Title(参考訳): ニューロイメージングにおける深層学習--パワーとI型エラー制御を用いた多変量アプローチと議論可能な一般化能力
- Authors: Carmen Jim\'enez-Mesa, Javier Ram\'irez, John Suckling, Jonathan
V\"oglein, Johannes Levin, Juan Manuel G\'orriz, Alzheimer's Disease
Neuroimaging Initiative ADNI, Dominantly Inherited Alzheimer Network DIAN
- Abstract要約: ディープラーニングアーキテクチャを用いた分類の統計的意義を推定する非パラメトリックフレームワークを提案する。
ラベル置換試験は, クロスバリデーション (CV) と上界補正 (RUB) を併用した再置換を検証法として提案した。
我々は, CV法とRUB法が有意レベルに近い偽陽性率と許容可能な統計的力を提供することを置換試験で発見した。
- 参考スコア(独自算出の注目度): 0.158310730488265
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Discriminative analysis in neuroimaging by means of deep/machine learning
techniques is usually tested with validation techniques, whereas the associated
statistical significance remains largely under-developed due to their
computational complexity. In this work, a non-parametric framework is proposed
that estimates the statistical significance of classifications using deep
learning architectures. In particular, a combination of autoencoders (AE) and
support vector machines (SVM) is applied to: (i) a one-condition, within-group
designs often of normal controls (NC) and; (ii) a two-condition, between-group
designs which contrast, for example, Alzheimer's disease (AD) patients with NC
(the extension to multi-class analyses is also included). A random-effects
inference based on a label permutation test is proposed in both studies using
cross-validation (CV) and resubstitution with upper bound correction (RUB) as
validation methods. This allows both false positives and classifier overfitting
to be detected as well as estimating the statistical power of the test. Several
experiments were carried out using the Alzheimer's Disease Neuroimaging
Initiative (ADNI) dataset, the Dominantly Inherited Alzheimer Network (DIAN)
dataset, and a MCI prediction dataset. We found in the permutation test that CV
and RUB methods offer a false positive rate close to the significance level and
an acceptable statistical power (although lower using cross-validation). A
large separation between training and test accuracies using CV was observed,
especially in one-condition designs. This implies a low generalization ability
as the model fitted in training is not informative with respect to the test
set. We propose as solution by applying RUB, whereby similar results are
obtained to those of the CV test set, but considering the whole set and with a
lower computational cost per iteration.
- Abstract(参考訳): 深層/機械学習技術による神経画像の識別分析は通常検証技術でテストされるが、関連する統計学的意義は計算の複雑さのためにほとんど未発達のままである。
本研究では,ディープラーニングアーキテクチャを用いた分類の統計的意義を推定する非パラメトリックフレームワークを提案する。
特に、オートエンコーダ (AE) とサポートベクターマシン (SVM) の組み合わせは、 (i) 正規制御 (NC) の 1 条件内設計 (i) および (ii) NC のアルツハイマー病 (AD) 患者と対照的な 2 条件間設計 (例えば、マルチクラス解析の拡張も含む) に適用される。
クロスバリデーション(cv)とアッパーバウンド補正(rub)による再置換を検証法として,ラベル置換テストに基づくランダム効果推定を提案する。
これにより、偽陽性と分類器オーバーフィットの両方を検出でき、またテストの統計的パワーを推定できる。
The Alzheimer's Disease Neuroimaging Initiative (ADNI) データセット、Dominantly Inherited Alzheimer Network (DIAN) データセット、MCI予測データセットを用いて、いくつかの実験を行った。
その結果,CV法とRUB法では,有意値に近い偽陽性率と許容可能な統計的パワーが得られた(クロスバリデーションでは低い)。
CVを用いた訓練と試験精度の大きな分離が観察され, 特に一条件設計で観察された。
これは、トレーニングに適合するモデルはテストセットに関して情報提供されないため、一般化能力が低いことを意味する。
CVテストセットに類似した結果が得られるRUBを適用して解法として提案するが、全セットを考慮し、1イテレーションあたりの計算コストを低く抑える。
関連論文リスト
- Intuitionistic Fuzzy Universum Twin Support Vector Machine for Imbalanced Data [0.0]
機械学習手法の大きな問題の1つは、不均衡なデータセットを分類することである。
不均衡データ(IFUTSVM-ID)のための直観的ファジィユニバームツインサポートベクトルマシンを提案する。
雑音や外周の影響を軽減するため,直観主義的なファジィ・メンバシップ・スキームを用いる。
論文 参考訳(メタデータ) (2024-10-27T04:25:42Z) - Is K-fold cross validation the best model selection method for Machine Learning? [0.0]
K-fold cross-validation (CV) は、機械学習の結果が偶然に生成される可能性を確認する最も一般的な手法である。
K-fold CVと実際のリスクの上界(K-fold CUBV)に基づく新しい統計試験が提案されている。
論文 参考訳(メタデータ) (2024-01-29T18:46:53Z) - Precise Error Rates for Computationally Efficient Testing [75.63895690909241]
本稿では,計算複雑性に着目した単純な対数-単純仮説テストの問題を再考する。
線形スペクトル統計に基づく既存の試験は、I型とII型の誤差率の間の最良のトレードオフ曲線を達成する。
論文 参考訳(メタデータ) (2023-11-01T04:41:16Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Analysis of Diagnostics (Part I): Prevalence, Uncertainty Quantification, and Machine Learning [0.0]
この写本は、分類理論と有病率のより深い関係を研究する二部作の最初のものである。
そこで本稿では,有病率重み付き経験誤差を最小化することにより,Bstar (q)$を推定する数値ホモトピーアルゴリズムを提案する。
合成データとSARS-CoV-2酵素結合免疫測定法(ELISA)を用いて本法の有効性を検証した。
論文 参考訳(メタデータ) (2023-08-30T13:26:49Z) - Hierarchical Semi-Supervised Contrastive Learning for
Contamination-Resistant Anomaly Detection [81.07346419422605]
異常検出は、通常のデータ分布から逸脱したサンプルを特定することを目的としている。
コントラスト学習は、異常の効果的な識別を可能にする表現のサンプル化に成功している。
汚染耐性異常検出のための新しい階層型半教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-24T18:49:26Z) - Statistical and Computational Phase Transitions in Group Testing [73.55361918807883]
本研究の目的は、希少な疾患を患っているk人の集団を同定することである。
個々人のテストを割り当てるための2つの異なる単純なランダムな手順を考える。
論文 参考訳(メタデータ) (2022-06-15T16:38:50Z) - Statistical quantification of confounding bias in predictive modelling [0.0]
未確立モデルと完全構築モデルのnull仮説を探索する部分的および完全共創テストを提案する。
このテストは、非正規および非線形依存の予測であっても、I型エラーと高い統計的パワーに対して厳格な制御を提供する。
論文 参考訳(メタデータ) (2021-11-01T10:35:24Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。