論文の概要: Sample Selection Using Multi-Task Autoencoders in Federated Learning with Non-IID Data
- arxiv url: http://arxiv.org/abs/2604.26116v1
- Date: Tue, 28 Apr 2026 21:08:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.169689
- Title: Sample Selection Using Multi-Task Autoencoders in Federated Learning with Non-IID Data
- Title(参考訳): 非IIDデータを用いたフェデレーション学習におけるマルチタスクオートエンコーダを用いたサンプル選択
- Authors: Emre Ardıç, Yakup Genç,
- Abstract要約: フェデレーション・ラーニング(Federated Learning)は、中央サーバの監督下で複数のデバイスが協調的にモデルをトレーニングする機械学習パラダイムである。
本稿では,マルチタスクオートエンコーダを用いた画像分類のための新しいサンプル選択手法を提案する。
提案手法では,一級サポートベクターマシン(OCSVM),アイソレーションフォレスト(IF),中央サーバが管理するアダプティブ・ロスしきい値(AT)を用いて,教師なしの外れ値検出を行う。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Federated learning is a machine learning paradigm in which multiple devices collaboratively train a model under the supervision of a central server while ensuring data privacy. However, its performance is often hindered by redundant, malicious, or abnormal samples, leading to model degradation and inefficiency. To overcome these issues, we propose novel sample selection methods for image classification, employing a multitask autoencoder to estimate sample contributions through loss and feature analysis. Our approach incorporates unsupervised outlier detection, using one-class support vector machine (OCSVM), isolation forest (IF), and adaptive loss threshold (AT) methods managed by a central server to filter noisy samples on clients. We also propose a multi-class deep support vector data description (SVDD) loss controlled by a central server to enhance feature-based sample selection. We validate our methods on CIFAR10 and MNIST datasets across varying numbers of clients, non-IID distributions, and noise levels up to 40%. The results show significant accuracy improvements with loss-based sample selection, achieving gains of up to 7.02% on CIFAR10 with OCSVM and 1.83% on MNIST with AT. Additionally, our federated SVDD loss further improves feature-based sample selection, yielding accuracy gains of up to 0.99% on CIFAR10 with OCSVM. These results show the effectiveness of our methods in improving model accuracy across various client counts and noise conditions.
- Abstract(参考訳): フェデレーション学習(Federated Learning)は、複数のデバイスがデータプライバシを確保しながら、中央サーバの監督下でモデルを協調的にトレーニングする、機械学習パラダイムである。
しかし、その性能は、しばしば冗長、悪意、または異常なサンプルによって妨げられ、モデル劣化と非効率をもたらす。
これらの課題を克服するために,マルチタスクオートエンコーダを用いた画像分類のための新しいサンプル選択手法を提案する。
提案手法では,一級サポートベクターマシン(OCSVM),アイソレーションフォレスト(IF),および中央サーバが管理するアダプティブ・ロスしきい値(AT)を用いて,クライアント上のノイズの多いサンプルをフィルタリングする。
また,中央サーバが制御する多クラスディープサポートベクターデータ記述(SVDD)の損失も提案し,特徴量に基づくサンプル選択を向上する。
我々は,CIFAR10およびMNISTデータセットを用いて,クライアント数,非IID分布,ノイズレベルを最大40%まで検証した。
CIFAR10では最大7.02%、OCSVMでは最大1.83%、ATではMNISTでは1.83%の精度向上が見られた。
さらに,フェデレートされたSVDDの損失により,機能ベースのサンプル選択が向上し,CSVMを用いたCIFAR10では最大0.99%の精度が得られた。
これらの結果から,各種クライアント数および雑音条件におけるモデル精度の向上に本手法の有効性が示唆された。
関連論文リスト
- Oversampling and Downsampling with Core-Boundary Awareness: A Data Quality-Driven Approach [2.334306891078381]
本稿では,2種類のデータを系統的に識別し,識別する手法を提案する。
高品質な意思決定関連データを優先順位付けすることで、私たちのアプローチはテキスト、マルチモーダル、そして自己教師型学習シナリオにまで拡張できます。
この研究は、データ効率の学習における将来の研究の道を開いた。
論文 参考訳(メタデータ) (2025-09-24T07:55:07Z) - Crucial-Diff: A Unified Diffusion Model for Crucial Image and Annotation Synthesis in Data-scarce Scenarios [65.97836905826145]
医療、産業、自動運転といったさまざまなシナリオにおけるデータの不足は、モデルの過度な適合とデータセットの不均衡につながる。
重要なサンプルを合成するドメインに依存しないフレームワークであるCrucial-Diffを提案する。
我々のフレームワークは多様な高品質なトレーニングデータを生成し、ピクセルレベルのAPは83.63%、F1-MAXは78.12%である。
論文 参考訳(メタデータ) (2025-07-14T04:41:38Z) - AdaDeDup: Adaptive Hybrid Data Pruning for Efficient Large-Scale Object Detection Training [33.01500681857408]
我々は、密度に基づくプルーニングとモデルインフォームドフィードバックをクラスタ適応的に統合する新しいフレームワークであるAdaptive De-Duplication (AdaDeDup)を紹介した。
これは、顕著なベースラインを著しく上回り、性能劣化を著しく低減し、20%のデータを刈り取りながら、ほぼオリジナルに近いモデル性能を達成する。
論文 参考訳(メタデータ) (2025-06-24T22:35:51Z) - Satori-SWE: Evolutionary Test-Time Scaling for Sample-Efficient Software Engineering [51.7496756448709]
言語モデル(LM)は、コーディングベンチマークではうまく機能するが、現実のソフトウェア工学のタスクでは苦労する。
既存のアプローチは、高品質なデータによる教師付き微調整に依存している。
本研究では, 生成を進化過程として扱うサンプル効率の高い手法であるテスト時間スケーリング(EvoScale)を提案する。
論文 参考訳(メタデータ) (2025-05-29T16:15:36Z) - iHHO-SMOTe: A Cleansed Approach for Handling Outliers and Reducing Noise to Improve Imbalanced Data Classification [0.0]
不均衡データセットの分類は、マシンラーニングにおいて依然として大きな課題である。
SMOTE(Synthetic Minority Over-Sampling Technique)は、表現不足のマイノリティクラスのための新しいインスタンスを生成する。
提案手法であるiHHO-SMOTeは,まずノイズ点からデータを浄化することにより,SMOTEの限界に対処する。
論文 参考訳(メタデータ) (2025-04-17T11:17:53Z) - Federated Learning Clients Clustering with Adaptation to Data Drifts [27.974937897248132]
フェデレートラーニング(FL)は、生データを集中することなく、エッジデバイスをまたいだディープモデルをトレーニングし、ユーザのプライバシを保護します。
低オーバーヘッドで多種多様なデータドリフトを処理するためのフレームワークであるFIELdingを提案する。
実験の結果、FIELDINGは最終モデルの精度を1.9-5.9%向上し、目標の精度は既存の最先端CFL法よりも1.16x-2.23倍向上した。
論文 参考訳(メタデータ) (2024-11-03T14:13:38Z) - Fed-CBS: A Heterogeneity-Aware Client Sampling Mechanism for Federated
Learning via Class-Imbalance Reduction [76.26710990597498]
本研究では,ランダムに選択したクライアントからのグループデータのクラス不均衡が,性能の大幅な低下につながることを示す。
我々のキーとなる観測に基づいて、我々は効率的なクライアントサンプリング機構、すなわちフェデレートクラスバランスサンプリング(Fed-CBS)を設計する。
特に、クラス不均衡の尺度を提案し、その後、同型暗号化を用いてプライバシー保護方式でこの尺度を導出する。
論文 参考訳(メタデータ) (2022-09-30T05:42:56Z) - Federated Multi-Target Domain Adaptation [99.93375364579484]
フェデレートされた学習手法により、プライバシを保護しながら、分散ユーザデータ上で機械学習モデルをトレーニングすることが可能になります。
分散クライアントデータがラベル付けされず、集中型ラベル付きデータセットがサーバ上で利用可能となる、より実用的なシナリオを考えます。
本稿では,新しい課題に対処する効果的なDualAdapt法を提案する。
論文 参考訳(メタデータ) (2021-08-17T17:53:05Z) - Auto-weighted Robust Federated Learning with Corrupted Data Sources [7.475348174281237]
フェデレーション学習はコミュニケーション効率とプライバシ保護のトレーニングプロセスを提供する。
平均損失関数をナイーブに最小化する標準的なフェデレーション学習技術は、データの破損に弱い。
破損したデータソースに対して堅牢性を提供するために、自動重み付けロバストフェデレーテッドラーニング(arfl)を提案します。
論文 参考訳(メタデータ) (2021-01-14T21:54:55Z) - Multi-Scale Positive Sample Refinement for Few-Shot Object Detection [61.60255654558682]
Few-shot Object Detection (FSOD) は、ディテクターがトレーニングインスタンスをほとんど持たない未確認のクラスに適応するのに役立つ。
FSODにおけるオブジェクトスケールを拡張化するためのMPSR(Multi-scale Positive Sample Refinement)アプローチを提案する。
MPSRは、オブジェクトピラミッドとして多スケールの正のサンプルを生成し、様々なスケールで予測を洗練させる。
論文 参考訳(メタデータ) (2020-07-18T09:48:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。