Fugu-MT 論文翻訳(概要): A Comparative Study of Sampling Methods with Cross-Validation in the FedHome Framework

論文の概要: A Comparative Study of Sampling Methods with Cross-Validation in the FedHome Framework

arxiv url: http://arxiv.org/abs/2406.01950v1
Date: Tue, 4 Jun 2024 04:03:07 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-05 18:00:19.094543
Title: A Comparative Study of Sampling Methods with Cross-Validation in the FedHome Framework
Title（参考訳）: FedHomeフレームワークにおけるクロスバリデーションを用いたサンプリング手法の比較検討
Authors: Arash Ahmadi, Sarah S. Sharif, Yaser M. Banad,
Abstract要約: 本稿では,家庭内健康モニタリングの個人化を目的としたFedHomeフレームワークにおけるサンプリング手法の比較検討を行った。 SMOTE, Borderline-SMOTE, Random OverSampler, SMOTE-Tomek, SVM-SMOTE, SMOTE-ENN の6つのオーバーサンプリング手法について検討した。 SMOTE-ENNは、標準偏差範囲0.0167-0.0176の最も一貫したテスト精度を達成し、他のサンプルよりも安定した性能を示す。
参考スコア（独自算出の注目度）: 0.5266869303483376
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper presents a comparative study of sampling methods within the FedHome framework, designed for personalized in-home health monitoring. FedHome leverages federated learning (FL) and generative convolutional autoencoders (GCAE) to train models on decentralized edge devices while prioritizing data privacy. A notable challenge in this domain is the class imbalance in health data, where critical events such as falls are underrepresented, adversely affecting model performance. To address this, the research evaluates six oversampling techniques using Stratified K-fold cross-validation: SMOTE, Borderline-SMOTE, Random OverSampler, SMOTE-Tomek, SVM-SMOTE, and SMOTE-ENN. These methods are tested on FedHome's public implementation over 200 training rounds with and without stratified K-fold cross-validation. The findings indicate that SMOTE-ENN achieves the most consistent test accuracy, with a standard deviation range of 0.0167-0.0176, demonstrating stable performance compared to other samplers. In contrast, SMOTE and SVM-SMOTE exhibit higher variability in performance, as reflected by their wider standard deviation ranges of 0.0157-0.0180 and 0.0155-0.0180, respectively. Similarly, the Random OverSampler method shows a significant deviation range of 0.0155-0.0176. SMOTE-Tomek, with a deviation range of 0.0160-0.0175, also shows greater stability but not as much as SMOTE-ENN. This finding highlights the potential of SMOTE-ENN to enhance the reliability and accuracy of personalized health monitoring systems within the FedHome framework.
Abstract（参考訳）: 本稿では,家庭内健康モニタリングの個人化を目的としたFedHomeフレームワークにおけるサンプリング手法の比較検討を行った。 FedHomeは、フェデレーション学習(FL)とジェネレーティブ畳み込みオートエンコーダ(GCAE)を活用して、データのプライバシを優先しながら、分散型エッジデバイス上でモデルをトレーニングする。この領域で注目すべき課題は、転倒などの重要な事象が不足し、モデルのパフォーマンスに悪影響を及ぼす健康データにおけるクラス不均衡である。そこで本研究では,SMOTE,Borderline-SMOTE,Random OverSampler,SMOTE-Tomek,SVM-SMOTE,SMOTE-ENNの6つのオーバーサンプリング手法を評価する。これらの手法は、K-foldクロスバリデーションを成層化せずに200回以上のトレーニングラウンドでFedHomeの公開実装でテストされる。その結果,SMOTE-ENNは標準偏差範囲0.0167-0.0176であり,他の試料より安定した性能を示した。対照的に、SMOTEとSVM-SMOTEは、それぞれ0.0157-0.0180と0.0155-0.0180のより広い標準偏差範囲で反映されるように、性能の多様性が高い。同様に、ランダムオーバーサンプラー法は0.0155-0.0176の偏差範囲を示す。 SMOTE-Tomekは0.0160-0.0175の範囲で、安定性も高いが、SMOTE-ENNほどではない。この発見は、FedHomeフレームワーク内のパーソナライズされた健康モニタリングシステムの信頼性と精度を高めるSMOTE-ENNの可能性を強調している。

関連論文リスト

STAR : Bridging Statistical and Agentic Reasoning for Large Model Performance Prediction [78.0692157478247]
本稿では,知識駆動型エージェント推論を用いて,データ駆動型静的予測を橋渡しするフレームワークSTARを提案する。 STARはスコアベースとランクベースの両方の基準線を一貫して上回ることを示す。
論文参考訳（メタデータ） (2026-02-12T16:30:07Z)
Performance Consistency of Learning Methods for Information Retrieval Tasks [3.2228025627337864]
ランダム性を用いて、従来の統計学習モデルとトランスフォーマーに基づく学習モデルについて検討する。統計モデルは安定しているが、変圧器モデルは種子が変化するにつれて大きな変動を示す。以上の結果から,トランスフォーマーモデルによる不安定性のトレーニングや,過去の結果の信頼性に関する疑問が浮き彫りになった。
論文参考訳（メタデータ） (2025-09-25T06:33:40Z)
Fusion Sampling Validation in Data Partitioning for Machine Learning [0.0]
本研究では、単純なランダムサンプリング(SRS)とK-Fold Cross-Validation(KFCV)を組み合わせたハイブリッドモデルFusion Smpling Validation(FSV)を提案する。 FSVは、バイアスを最小化し、SRSとKFCVの精度をマージすることを目的としている。データパーティショニング、特にリソース制約のある環境では、精度と信頼性が優れていた。
論文参考訳（メタデータ） (2025-08-02T11:32:47Z)
ZS-VCOS: Zero-Shot Video Camouflaged Object Segmentation By Optical Flow and Open Vocabulary Object Detection [7.457821910654639]
本研究は,SAM-2やOwl-v2といった大規模事前学習モデルと時間的情報をモジュールパイプラインに統合することにより,トレーニングを回避する方法を研究する。また,F対策を0.476から0.628に増やした。
論文参考訳（メタデータ） (2025-04-10T06:24:54Z)
Revisit the Stability of Vanilla Federated Learning Under Diverse Conditions [3.237380113935023]
Federated Learning(FL)は分散機械学習のパラダイムであり、分散化されたクライアント間で協調的なモデルトレーニングを可能にする。種々の条件下でのバニラFedAvgアルゴリズムの安定性を再検討する。
論文参考訳（メタデータ） (2025-02-27T07:47:59Z)
Real-Time Anomaly Detection with Synthetic Anomaly Monitoring (SAM) [2.055524866851853]
異常検出は、財務、サイバーセキュリティ、ネットワーク監視など、さまざまな領域にわたる稀で重要な事象を特定するために不可欠である。本稿では、因果推論から合成制御手法を適用し、異常検出プロセスの精度と解釈性を向上させる革新的なアプローチであるSynthetic Anomaly Monitoring(SAM)を提案する。
論文参考訳（メタデータ） (2025-01-30T15:15:17Z)
Deep Unlearn: Benchmarking Machine Unlearning [7.450700594277741]
機械学習(MU)は、訓練された機械学習モデルの学習可能なパラメータから、特定のデータポイントの影響を取り除くことを目的としている。本稿では,様々なベンチマークデータセットおよびモデルを対象とした18種類の最先端MU手法について検討する。
論文参考訳（メタデータ） (2024-10-02T06:41:58Z)
PrivFED -- A Framework for Privacy-Preserving Federated Learning in Enhanced Breast Cancer Diagnosis [0.0]
本研究では、ウィスコンシンデータセットに基づいてトレーニングされたフェデレーション学習フレームワークを導入し、データの不足や不均衡といった課題を軽減する。このモデルの平均精度はエッジデバイスで99.95%、中央サーバで98%である。
論文参考訳（メタデータ） (2024-05-13T18:01:57Z)
A Channel-ensemble Approach: Unbiased and Low-variance Pseudo-labels is Critical for Semi-supervised Classification [61.473485511491795]
半教師付き学習(SSL)はコンピュータビジョンにおける実践的な課題である。 Pseudo-label (PL) メソッド、例えば FixMatch や FreeMatch は SSL で State of The Art (SOTA) のパフォーマンスを取得する。本稿では,複数の下位PLを理論的に保証された非偏りと低分散のPLに集約する,軽量なチャネルベースアンサンブル法を提案する。
論文参考訳（メタデータ） (2024-03-27T09:49:37Z)
Uncertainty-aware Sampling for Long-tailed Semi-supervised Learning [89.98353600316285]
擬似ラベルサンプリングのモデル化プロセスに不確実性を導入し、各クラスにおけるモデル性能が異なる訓練段階によって異なることを考慮した。このアプローチにより、モデルは異なる訓練段階における擬似ラベルの不確かさを認識でき、それによって異なるクラスの選択閾値を適応的に調整できる。 FixMatchのような他の手法と比較して、UDTSは自然シーン画像データセットの精度を少なくとも5.26%、1.75%、9.96%、1.28%向上させる。
論文参考訳（メタデータ） (2024-01-09T08:59:39Z)
Consistency Trajectory Models: Learning Probability Flow ODE Trajectory of Diffusion [56.38386580040991]
Consistency Trajectory Model (CTM) は Consistency Models (CM) の一般化である CTMは、対戦訓練とスコアマッチング損失を効果的に組み合わせることで、パフォーマンスを向上させる。 CMとは異なり、CTMのスコア関数へのアクセスは、確立された制御可能/条件生成メソッドの採用を合理化することができる。
論文参考訳（メタデータ） (2023-10-01T05:07:17Z)
Instance-based Learning with Prototype Reduction for Real-Time Proportional Myocontrol: A Randomized User Study Demonstrating Accuracy-preserving Data Reduction for Prosthetic Embedded Systems [0.0]
本研究は, 義肢制御におけるジェスチャー検出のためのkNNスキームに基づく学習手法の設計, 実装, 検証を行う。 8チャンネルSEMGアームバンドを用いて,パラメータ化と比例スキームの変化の影響を解析した。
論文参考訳（メタデータ） (2023-08-21T20:15:35Z)
Uncertainty-inspired Open Set Learning for Retinal Anomaly Identification [71.06194656633447]
9つの網膜条件の基底像をトレーニングし,不確実性に着想を得たオープンセット(UIOS)モデルを構築した。しきい値戦略を持つUIOSモデルはF1スコア99.55%、97.01%、91.91%を達成した。 UIOSは、高い不確実性スコアを正しく予測し、非ターゲットの網膜疾患、低品質の眼底画像、および非基本画像のデータセットを手動でチェックする必要があることを示唆した。
論文参考訳（メタデータ） (2023-04-08T10:47:41Z)
Cross-device Federated Learning for Mobile Health Diagnostics: A First Study on COVID-19 Detection [17.60965121379399]
フェデレートラーニング(FL)は、健康診断モデルに多数の個人用エッジデバイスからのデータを組み込むことができる。このような医療診断のためのデバイス横断FLアプローチは、ローカルデータ不均衡とグローバルデータ不均衡の両方のために、依然として多くの課題を課している。健康診断のためのクロスデバイスFLフレームワークであるFedLossを提案する。
論文参考訳（メタデータ） (2023-03-13T12:42:02Z)
MAPS: A Noise-Robust Progressive Learning Approach for Source-Free Domain Adaptive Keypoint Detection [76.97324120775475]
クロスドメインキーポイント検出方法は、常に適応中にソースデータにアクセスする必要がある。本稿では、ターゲット領域に十分に訓練されたソースモデルのみを提供する、ソースフリーなドメイン適応キーポイント検出について考察する。
論文参考訳（メタデータ） (2023-02-09T12:06:08Z)
Diffusion Denoising Process for Perceptron Bias in Out-of-distribution Detection [67.49587673594276]
我々は、識別器モデルが入力の特定の特徴に対してより敏感であることを示唆する新しいパーセプトロンバイアスの仮定を導入し、過度な問題を引き起こした。 DMの拡散分解過程 (DDP) が非対称の新たな形態として機能し, 入力を高め, 過信問題を緩和するのに適していることを示す。 CIFAR10, CIFAR100, ImageNetによる実験により, 提案手法がSOTA手法より優れていることが示された。
論文参考訳（メタデータ） (2022-11-21T08:45:08Z)
Predicting microsatellite instability and key biomarkers in colorectal cancer from H&E-stained images: Achieving SOTA with Less Data using Swin Transformer [3.6695403836792493]
シフトウインドウ(Swin-T)を用いた大腸癌バイオマーカーの効率的なワークフローを開発した。 Swin-Tは小さなトレーニングデータセットを使用して極めて効率的で、200-500のトレーニングサンプルだけで堅牢な予測性能を示す。これらのデータは、Swin-Tが現在のMSIの最先端アルゴリズムよりも5～10倍効率が高いことを示している。
論文参考訳（メタデータ） (2022-08-22T02:32:30Z)
Rethinking Sampling Strategies for Unsupervised Person Re-identification [59.47536050785886]
我々は,同じフレームワーク下での各種サンプリング戦略と損失関数のパフォーマンス差の理由を解析した。グループサンプリングを提案し、同じクラスのサンプルをグループに集める。 Market-1501、DukeMTMC-reID、MSMT17の実験は、グループサンプリングが最先端の手法に匹敵する性能を達成することを示した。
論文参考訳（メタデータ） (2021-07-07T05:39:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。