論文の概要: A Comparative Study of Sampling Methods with Cross-Validation in the FedHome Framework
- arxiv url: http://arxiv.org/abs/2406.01950v1
- Date: Tue, 4 Jun 2024 04:03:07 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-05 18:00:19.094543
- Title: A Comparative Study of Sampling Methods with Cross-Validation in the FedHome Framework
- Title(参考訳): FedHomeフレームワークにおけるクロスバリデーションを用いたサンプリング手法の比較検討
- Authors: Arash Ahmadi, Sarah S. Sharif, Yaser M. Banad,
- Abstract要約: 本稿では,家庭内健康モニタリングの個人化を目的としたFedHomeフレームワークにおけるサンプリング手法の比較検討を行った。
SMOTE, Borderline-SMOTE, Random OverSampler, SMOTE-Tomek, SVM-SMOTE, SMOTE-ENN の6つのオーバーサンプリング手法について検討した。
SMOTE-ENNは、標準偏差範囲0.0167-0.0176の最も一貫したテスト精度を達成し、他のサンプルよりも安定した性能を示す。
- 参考スコア(独自算出の注目度): 0.5266869303483376
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a comparative study of sampling methods within the FedHome framework, designed for personalized in-home health monitoring. FedHome leverages federated learning (FL) and generative convolutional autoencoders (GCAE) to train models on decentralized edge devices while prioritizing data privacy. A notable challenge in this domain is the class imbalance in health data, where critical events such as falls are underrepresented, adversely affecting model performance. To address this, the research evaluates six oversampling techniques using Stratified K-fold cross-validation: SMOTE, Borderline-SMOTE, Random OverSampler, SMOTE-Tomek, SVM-SMOTE, and SMOTE-ENN. These methods are tested on FedHome's public implementation over 200 training rounds with and without stratified K-fold cross-validation. The findings indicate that SMOTE-ENN achieves the most consistent test accuracy, with a standard deviation range of 0.0167-0.0176, demonstrating stable performance compared to other samplers. In contrast, SMOTE and SVM-SMOTE exhibit higher variability in performance, as reflected by their wider standard deviation ranges of 0.0157-0.0180 and 0.0155-0.0180, respectively. Similarly, the Random OverSampler method shows a significant deviation range of 0.0155-0.0176. SMOTE-Tomek, with a deviation range of 0.0160-0.0175, also shows greater stability but not as much as SMOTE-ENN. This finding highlights the potential of SMOTE-ENN to enhance the reliability and accuracy of personalized health monitoring systems within the FedHome framework.
- Abstract(参考訳): 本稿では,家庭内健康モニタリングの個人化を目的としたFedHomeフレームワークにおけるサンプリング手法の比較検討を行った。
FedHomeは、フェデレーション学習(FL)とジェネレーティブ畳み込みオートエンコーダ(GCAE)を活用して、データのプライバシを優先しながら、分散型エッジデバイス上でモデルをトレーニングする。
この領域で注目すべき課題は、転倒などの重要な事象が不足し、モデルのパフォーマンスに悪影響を及ぼす健康データにおけるクラス不均衡である。
そこで本研究では,SMOTE,Borderline-SMOTE,Random OverSampler,SMOTE-Tomek,SVM-SMOTE,SMOTE-ENNの6つのオーバーサンプリング手法を評価する。
これらの手法は、K-foldクロスバリデーションを成層化せずに200回以上のトレーニングラウンドでFedHomeの公開実装でテストされる。
その結果,SMOTE-ENNは標準偏差範囲0.0167-0.0176であり,他の試料より安定した性能を示した。
対照的に、SMOTEとSVM-SMOTEは、それぞれ0.0157-0.0180と0.0155-0.0180のより広い標準偏差範囲で反映されるように、性能の多様性が高い。
同様に、ランダムオーバーサンプラー法は0.0155-0.0176の偏差範囲を示す。
SMOTE-Tomekは0.0160-0.0175の範囲で、安定性も高いが、SMOTE-ENNほどではない。
この発見は、FedHomeフレームワーク内のパーソナライズされた健康モニタリングシステムの信頼性と精度を高めるSMOTE-ENNの可能性を強調している。
関連論文リスト
- Deep Unlearn: Benchmarking Machine Unlearning [7.450700594277741]
機械学習(MU)は、訓練された機械学習モデルの学習可能なパラメータから、特定のデータポイントの影響を取り除くことを目的としている。
本稿では,様々なベンチマークデータセットおよびモデルを対象とした18種類の最先端MU手法について検討する。
論文 参考訳(メタデータ) (2024-10-02T06:41:58Z) - PrivFED -- A Framework for Privacy-Preserving Federated Learning in Enhanced Breast Cancer Diagnosis [0.0]
本研究では、ウィスコンシンデータセットに基づいてトレーニングされたフェデレーション学習フレームワークを導入し、データの不足や不均衡といった課題を軽減する。
このモデルの平均精度はエッジデバイスで99.95%、中央サーバで98%である。
論文 参考訳(メタデータ) (2024-05-13T18:01:57Z) - A Channel-ensemble Approach: Unbiased and Low-variance Pseudo-labels is Critical for Semi-supervised Classification [61.473485511491795]
半教師付き学習(SSL)はコンピュータビジョンにおける実践的な課題である。
Pseudo-label (PL) メソッド、例えば FixMatch や FreeMatch は SSL で State of The Art (SOTA) のパフォーマンスを取得する。
本稿では,複数の下位PLを理論的に保証された非偏りと低分散のPLに集約する,軽量なチャネルベースアンサンブル法を提案する。
論文 参考訳(メタデータ) (2024-03-27T09:49:37Z) - Uncertainty-aware Sampling for Long-tailed Semi-supervised Learning [89.98353600316285]
擬似ラベルサンプリングのモデル化プロセスに不確実性を導入し、各クラスにおけるモデル性能が異なる訓練段階によって異なることを考慮した。
このアプローチにより、モデルは異なる訓練段階における擬似ラベルの不確かさを認識でき、それによって異なるクラスの選択閾値を適応的に調整できる。
FixMatchのような他の手法と比較して、UDTSは自然シーン画像データセットの精度を少なくとも5.26%、1.75%、9.96%、1.28%向上させる。
論文 参考訳(メタデータ) (2024-01-09T08:59:39Z) - Consistency Trajectory Models: Learning Probability Flow ODE Trajectory of Diffusion [56.38386580040991]
Consistency Trajectory Model (CTM) は Consistency Models (CM) の一般化である
CTMは、対戦訓練とスコアマッチング損失を効果的に組み合わせることで、パフォーマンスを向上させる。
CMとは異なり、CTMのスコア関数へのアクセスは、確立された制御可能/条件生成メソッドの採用を合理化することができる。
論文 参考訳(メタデータ) (2023-10-01T05:07:17Z) - Instance-based Learning with Prototype Reduction for Real-Time
Proportional Myocontrol: A Randomized User Study Demonstrating
Accuracy-preserving Data Reduction for Prosthetic Embedded Systems [0.0]
本研究は, 義肢制御におけるジェスチャー検出のためのkNNスキームに基づく学習手法の設計, 実装, 検証を行う。
8チャンネルSEMGアームバンドを用いて,パラメータ化と比例スキームの変化の影響を解析した。
論文 参考訳(メタデータ) (2023-08-21T20:15:35Z) - Uncertainty-inspired Open Set Learning for Retinal Anomaly
Identification [71.06194656633447]
9つの網膜条件の基底像をトレーニングし,不確実性に着想を得たオープンセット(UIOS)モデルを構築した。
しきい値戦略を持つUIOSモデルはF1スコア99.55%、97.01%、91.91%を達成した。
UIOSは、高い不確実性スコアを正しく予測し、非ターゲットの網膜疾患、低品質の眼底画像、および非基本画像のデータセットを手動でチェックする必要があることを示唆した。
論文 参考訳(メタデータ) (2023-04-08T10:47:41Z) - Cross-device Federated Learning for Mobile Health Diagnostics: A First
Study on COVID-19 Detection [17.60965121379399]
フェデレートラーニング(FL)は、健康診断モデルに多数の個人用エッジデバイスからのデータを組み込むことができる。
このような医療診断のためのデバイス横断FLアプローチは、ローカルデータ不均衡とグローバルデータ不均衡の両方のために、依然として多くの課題を課している。
健康診断のためのクロスデバイスFLフレームワークであるFedLossを提案する。
論文 参考訳(メタデータ) (2023-03-13T12:42:02Z) - MAPS: A Noise-Robust Progressive Learning Approach for Source-Free
Domain Adaptive Keypoint Detection [76.97324120775475]
クロスドメインキーポイント検出方法は、常に適応中にソースデータにアクセスする必要がある。
本稿では、ターゲット領域に十分に訓練されたソースモデルのみを提供する、ソースフリーなドメイン適応キーポイント検出について考察する。
論文 参考訳(メタデータ) (2023-02-09T12:06:08Z) - Diffusion Denoising Process for Perceptron Bias in Out-of-distribution
Detection [67.49587673594276]
我々は、識別器モデルが入力の特定の特徴に対してより敏感であることを示唆する新しいパーセプトロンバイアスの仮定を導入し、過度な問題を引き起こした。
DMの拡散分解過程 (DDP) が非対称の新たな形態として機能し, 入力を高め, 過信問題を緩和するのに適していることを示す。
CIFAR10, CIFAR100, ImageNetによる実験により, 提案手法がSOTA手法より優れていることが示された。
論文 参考訳(メタデータ) (2022-11-21T08:45:08Z) - Predicting microsatellite instability and key biomarkers in colorectal
cancer from H&E-stained images: Achieving SOTA with Less Data using Swin
Transformer [3.6695403836792493]
シフトウインドウ(Swin-T)を用いた大腸癌バイオマーカーの効率的なワークフローを開発した。
Swin-Tは小さなトレーニングデータセットを使用して極めて効率的で、200-500のトレーニングサンプルだけで堅牢な予測性能を示す。
これらのデータは、Swin-Tが現在のMSIの最先端アルゴリズムよりも5~10倍効率が高いことを示している。
論文 参考訳(メタデータ) (2022-08-22T02:32:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。