論文の概要: Ensemble learning using individual neonatal data for seizure detection
- arxiv url: http://arxiv.org/abs/2204.07043v1
- Date: Mon, 11 Apr 2022 08:46:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-16 09:28:56.343114
- Title: Ensemble learning using individual neonatal data for seizure detection
- Title(参考訳): 個々の新生児データを用いたアンサンブル学習による発作検出
- Authors: Ana Borovac, Steinn Gudmundsson, Gardar Thorvardsson, Saeed M.
Moghadam, P\"aivi Nevalainen, Nathan Stevenson, Sampsa Vanhatalo, Thomas P.
Runarsson
- Abstract要約: 我々は、公開データセットを個々の機関におけるデータを表す不整合集合に分割することで、データを共有できない場合をシミュレートする。
4つのアグリゲーションスキーム、すなわち、多数決、平均、重み付け平均、ダウィド・スケン法を比較する。
アンサンブルは、各機関で十分な量のデータが利用できる場合、すべてのデータで訓練された単一の検出器に匹敵する精度に達する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sharing medical data between institutions is difficult in practice due to
data protection laws and official procedures within institutions. Therefore,
most existing algorithms are trained on relatively small electroencephalogram
(EEG) data sets which is likely to be detrimental to prediction accuracy. In
this work, we simulate a case when the data can not be shared by splitting the
publicly available data set into disjoint sets representing data in individual
institutions. We propose to train a (local) detector in each institution and
aggregate their individual predictions into one final prediction. Four
aggregation schemes are compared, namely, the majority vote, the mean, the
weighted mean and the Dawid-Skene method. The approach allows different
detector architectures amongst the institutions. The method was validated on an
independent data set using only a subset of EEG channels. The ensemble reaches
accuracy comparable to a single detector trained on all the data when
sufficient amount of data is available in each institution. The weighted mean
aggregation scheme showed best overall performance, it was only marginally
outperformed by the Dawid-Skene method when local detectors approach
performance of a single detector trained on all available data.
- Abstract(参考訳): 機関間の医療データの共有は、データ保護法や機関内の公式な手続きのため、実際には困難である。
したがって、既存のアルゴリズムのほとんどは、予測精度に有害な比較的小さな脳波(eeg)データセットで訓練されている。
本研究では、公開データセットを個々の機関におけるデータを表す非結合集合に分割することにより、データを共有できない場合をシミュレートする。
各機関で(ローカルな)検出器を訓練し、個々の予測を1つの最終予測に集約する。
4つの集計方式、すなわち多数票、平均、重み付け平均、ダウィド・スキーン法を比較した。
このアプローチは、機関間で異なる検出器アーキテクチャを可能にする。
この手法はEEGチャネルのサブセットのみを用いて独立したデータセット上で検証された。
アンサンブルは、各機関で十分な量のデータが利用できる場合、すべてのデータで訓練された単一の検出器に匹敵する精度に達する。
重み付け平均凝集方式は,全データで訓練された単一検出器の性能にローカル検出器が接近した場合,dawid-skene法よりもわずかに優れていた。
関連論文リスト
- Approaching Metaheuristic Deep Learning Combos for Automated Data Mining [0.5419570023862531]
本研究では,メタヒューリスティック手法を従来の分類器やニューラルネットワークと組み合わせて自動データマイニングを行う手法を提案する。
手書き文字認識のためのMNISTデータセットの実験を行った。
根拠真理ラベル付きデータセットの検証精度は、これまで見つからなかった他のデータインスタンスのラベルを修正するのに不十分である、という実証的な観察がなされた。
論文 参考訳(メタデータ) (2024-10-16T10:28:22Z) - Provably Reliable Conformal Prediction Sets in the Presence of Data Poisoning [53.42244686183879]
コンフォーマル予測は、モデルに依存しない、分布のない不確実性定量化を提供する。
しかし、敵が訓練データと校正データを操作した場合の毒殺攻撃では、共形予測は信頼性が低い。
信頼性予測セット (RPS): 汚染下での信頼性保証を証明可能な共形予測セットを構築するための最初の効率的な方法を提案する。
論文 参考訳(メタデータ) (2024-10-13T15:37:11Z) - Training on the Benchmark Is Not All You Need [52.01920740114261]
本稿では,複数選択肢の内容に基づいた簡易かつ効果的なデータ漏洩検出手法を提案する。
本手法は,モデルトレーニングデータや重みを使用せずに,ブラックボックス条件下で動作することができる。
我々は,4つのベンチマークデータセットを用いて,31個の主要なオープンソースLCMのデータ漏洩の程度を評価する。
論文 参考訳(メタデータ) (2024-09-03T11:09:44Z) - Data Collaboration Analysis applied to Compound Datasets and the
Introduction of Projection data to Non-IID settings [6.037276428689637]
フェデレートラーニングは複合データセットに適用され、予測精度を高めつつ、潜在的にプロプライエタリな情報を保護している。
データ協調分析(DCPd)と呼ばれる,オープンソースからの化学合成データに対する分散機械学習の代替手法を提案する。
DCPdはラベルバイアスの程度が異なる実験では分類精度が無視できる低下を示した。
論文 参考訳(メタデータ) (2023-08-01T04:37:08Z) - Mean Estimation with User-level Privacy under Data Heterogeneity [54.07947274508013]
異なるユーザーは、非常に多くの異なるデータポイントを持っているかもしれない。
すべてのユーザが同じディストリビューションからサンプルを採取していると仮定することはできない。
本研究では,データの分布と量の両方でユーザデータが異なる異質なユーザデータの単純なモデルを提案する。
論文 参考訳(メタデータ) (2023-07-28T23:02:39Z) - PILLAR: How to make semi-private learning more effective [12.292092677396347]
Semi-Supervised Semi-Private (SP)学習では、学習者は公開されていないラベル付きデータとプライベートラベル付きデータの両方にアクセスすることができる。
そこで本研究では,実世界のデータセット上で効率よく動作可能な,プライベートラベル付きサンプルの複雑さを著しく低減する計算効率のよいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-06T18:45:05Z) - DRFLM: Distributionally Robust Federated Learning with Inter-client
Noise via Local Mixup [58.894901088797376]
連合学習は、生データをリークすることなく、複数の組織のデータを使用してグローバルモデルをトレーニングするための有望なアプローチとして登場した。
上記の2つの課題を同時に解決するための一般的な枠組みを提案する。
我々は、ロバストネス解析、収束解析、一般化能力を含む包括的理論的解析を提供する。
論文 参考訳(メタデータ) (2022-04-16T08:08:29Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Self-Trained One-class Classification for Unsupervised Anomaly Detection [56.35424872736276]
異常検出(AD)は、製造から医療まで、さまざまな分野に応用されている。
本研究は、トレーニングデータ全体がラベル付けされておらず、正規サンプルと異常サンプルの両方を含む可能性のある、教師なしAD問題に焦点を当てる。
この問題に対処するため,データリファインメントによる堅牢な一級分類フレームワークを構築した。
本手法は6.3AUCと12.5AUCの平均精度で最先端の1クラス分類法より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-11T01:36:08Z) - Sharing Models or Coresets: A Study based on Membership Inference Attack [17.562474629669513]
分散機械学習は、すべてのデータを集中した場所に集めることなく、分散データに基づいてグローバルモデルをトレーニングすることを目的としている。
ローカルモデル(フェデレーション学習)の収集と集約、代表データ要約(コアセット)の収集とトレーニングの2つのアプローチが提案されている。
本実験は,各アプローチの精度・プライバシ・コストのトレードオフを定量化し,モデルトレーニングプロセスの設計の指針となる非自明な比較を明らかにする。
論文 参考訳(メタデータ) (2020-07-06T18:06:53Z) - Secure Metric Learning via Differential Pairwise Privacy [36.946123614592054]
本稿では,距離メトリック学習において,攻撃者に対してペアワイズ情報を漏洩させる方法について,初めて検討する。
我々は、標準微分プライバシーの定義を一般化し、安全な計量学習のための微分ペアプライバシー(DPP)を開発する。
論文 参考訳(メタデータ) (2020-03-30T12:47:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。