論文の概要: Quantity versus Diversity: Influence of Data on Detecting EEG Pathology with Advanced ML Models
- arxiv url: http://arxiv.org/abs/2411.17709v1
- Date: Wed, 13 Nov 2024 16:15:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-01 04:42:45.139650
- Title: Quantity versus Diversity: Influence of Data on Detecting EEG Pathology with Advanced ML Models
- Title(参考訳): 量対多様性:高度なMLモデルを用いた脳波診断におけるデータの影響
- Authors: Martyna Poziomska, Marian Dovgialo, Przemysław Olbratowski, Paweł Niedbalski, Paweł Ogniewski, Joanna Zych, Jacek Rogala, Jarosław Żygierewicz,
- Abstract要約: 本研究では,脳波の一般的な病態を検出するための各種機械学習モデルの性能に及ぼすデータ量と多様性の影響について検討した。
我々は、テンプル大学病院の2,993件の脳波データと、Elmiko Biosignals sp. z o.oの55,787件の脳波データを利用する。
以上の結果から,小規模で一貫したデータセットにより,広範囲のモデルで高い精度を達成できることが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This study investigates the impact of quantity and diversity of data on the performance of various machine-learning models for detecting general EEG pathology. We utilized an EEG dataset of 2,993 recordings from Temple University Hospital and a dataset of 55,787 recordings from Elmiko Biosignals sp. z o.o. The latter contains data from 39 hospitals and a diverse patient set with varied conditions. Thus, we introduce the Elmiko dataset - the largest publicly available EEG corpus. Our findings show that small and consistent datasets enable a wide range of models to achieve high accuracy; however, variations in pathological conditions, recording protocols, and labeling standards lead to significant performance degradation. Nonetheless, increasing the number of available recordings improves predictive accuracy and may even compensate for data diversity, particularly in neural networks based on attention mechanism or transformer architecture. A meta-model that combined these networks with a gradient-boosting approach using handcrafted features demonstrated superior performance across varied datasets.
- Abstract(参考訳): 本研究では,脳波の一般的な病態を検出するための各種機械学習モデルの性能に及ぼすデータ量と多様性の影響について検討した。
我々は、テンプル大学病院の2,993件の脳波データと、Elmiko Biosignals spの55,787件の脳波データを用いた。
後者は39の病院とさまざまな状況の多彩な患者からのデータを含んでいる。
このように、エルミコデータセットは、公開可能な最大のEEGコーパスである。
以上の結果から,小規模で一貫したデータセットにより,広範囲のモデルで高い精度を達成できることが示唆された。
それでも、利用可能な記録数を増やすことで予測精度が向上し、特にアテンションメカニズムやトランスフォーマーアーキテクチャに基づいたニューラルネットワークにおいて、データの多様性を補うことができる。
これらのネットワークを手作り特徴を用いた勾配ブースティング手法と組み合わせたメタモデルは、様々なデータセットで優れた性能を示した。
関連論文リスト
- Geodesic Optimization for Predictive Shift Adaptation on EEG data [53.58711912565724]
ドメイン適応メソッドは、$X$と$y$で分散シフトが同時に発生したときに苦労する。
本稿では,GOPSA(Geodesic Optimization for Predictive Shift Adaptation)と呼ばれる新しい手法を提案する。
GOPSAは、脳波のバイオメディカル応用のための混合効果モデリングと機械学習を併用する可能性を持っている。
論文 参考訳(メタデータ) (2024-07-04T12:15:42Z) - hvEEGNet: exploiting hierarchical VAEs on EEG data for neuroscience
applications [3.031375888004876]
脳波の既存のDLベースのモデリング手法に2つの課題がある。
被験者間の高いばらつきと低信号対雑音比は、脳波データの良好な品質を確保するのを困難にしている。
本稿では,高忠実度脳波再構成問題を対象とした2つの変分オートエンコーダモデル,すなわちvEEGNet-ver3とhvEEGNetを提案する。
論文 参考訳(メタデータ) (2023-11-20T15:36:31Z) - Reducing Intraspecies and Interspecies Covariate Shift in Traumatic
Brain Injury EEG of Humans and Mice Using Transfer Euclidean Alignment [4.264615907591813]
被験者間の高いばらつきは、現実世界の分類タスクのための機械学習モデルをデプロイすることに関して、大きな課題となる。
そのような場合、特定のデータセットで例外的なパフォーマンスを示す機械学習モデルは、同じタスクに対して異なるデータセットに適用した場合、必ずしも同様の習熟度を示すとは限らない。
本稿では,人間の生体医学的データの堅牢性に対処し,深層学習モデルの訓練を行うトランスファーユークリッドアライメントについて紹介する。
論文 参考訳(メタデータ) (2023-10-03T19:48:02Z) - Amplifying Pathological Detection in EEG Signaling Pathways through
Cross-Dataset Transfer Learning [10.212217551908525]
実世界の病理分類課題におけるデータとモデルスケーリングとデータセット間の知識伝達の有効性について検討する。
ネガティブトランスファーの可能性の課題を特定し、いくつかの重要なコンポーネントの重要性を強調する。
以上の結果から,小規模で汎用的なモデル(ShallowNetなど)は単一データセット上では良好に動作するが,大規模なモデル(TCNなど)では,大規模かつ多様なデータセットからの転送や学習がより優れていることが示唆された。
論文 参考訳(メタデータ) (2023-09-19T20:09:15Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Convolutional Monge Mapping Normalization for learning on sleep data [63.22081662149488]
我々は、CMMN(Convolutional Monge Mapping Normalization)と呼ばれる新しい手法を提案する。
CMMNは、そのパワースペクトル密度(PSD)をトレーニングデータに基づいて推定されるワッサーシュタインバリセンタに適応させるために、信号をフィルタリングする。
睡眠脳波データに関する数値実験により、CMMNはニューラルネットワークアーキテクチャから独立して、顕著で一貫したパフォーマンス向上をもたらすことが示された。
論文 参考訳(メタデータ) (2023-05-30T08:24:01Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z) - Data augmentation for learning predictive models on EEG: a systematic
comparison [79.84079335042456]
脳波(EEG)分類タスクの深層学習は、ここ数年急速に増加している。
EEG分類タスクのディープラーニングは、比較的小さなEEGデータセットによって制限されている。
データ拡張は、コンピュータビジョンや音声などのアプリケーションにまたがる最先端のパフォーマンスを得るために重要な要素となっている。
論文 参考訳(メタデータ) (2022-06-29T09:18:15Z) - Improving the efficacy of Deep Learning models for Heart Beat detection
on heterogeneous datasets [0.0]
ヘテロジニアスデータセットにディープラーニングモデルを適用する際の問題点について検討する。
本研究では,健常者からのデータに基づいてトレーニングしたモデルの性能が,心疾患患者に適用した場合に低下することを示す。
次に、異なるデータセットにモデルを適応させるためのTransfer Learningの使用を評価します。
論文 参考訳(メタデータ) (2021-10-26T14:26:55Z) - Uncovering the structure of clinical EEG signals with self-supervised
learning [64.4754948595556]
教師付き学習パラダイムは、しばしば利用可能なラベル付きデータの量によって制限される。
この現象は脳波(EEG)などの臨床関連データに特に問題となる。
ラベルのないデータから情報を抽出することで、ディープニューラルネットワークとの競合性能に到達することができるかもしれない。
論文 参考訳(メタデータ) (2020-07-31T14:34:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。