論文の概要: Self-Supervised Federated Learning under Data Heterogeneity for Label-Scarce Diatom Classification
- arxiv url: http://arxiv.org/abs/2603.29633v1
- Date: Tue, 31 Mar 2026 11:59:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:03.593505
- Title: Self-Supervised Federated Learning under Data Heterogeneity for Label-Scarce Diatom Classification
- Title(参考訳): ラベル・スカース珪藻分類のためのデータ不均一性を考慮した自己教師付きフェデレーション学習
- Authors: Mingkun Tan, Xilu Wang, Michael Kloster, Tim W. Nattkemper,
- Abstract要約: 実世界の代表的事例として、珪藻分類のための自己教師付きフェデレーションラーニング(SSFL)を紹介した。
本研究では,下流微調整におけるラベル付きデータ量の変化とラベル空間のミスアライメントについて検討した。
広範な実験により、SSFLは均質な条件と異質な条件の両方で、局所的な訓練よりも一貫して優れていた。
- 参考スコア(独自算出の注目度): 1.1860671888891074
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Label-scarce visual classification under decentralized and heterogeneous data is a fundamental challenge in pattern recognition, especially when sites exhibit partially overlapping class sets. While self-supervised federated learning (SSFL) offers a promising solution, existing studies commonly assume the same data heterogeneity pattern throughout pre-training and fine-tuning. Moreover, current partitioning schemes often fail to generate pure partially class-disjoint data settings, limiting controllable simulation of real-world label-space heterogeneity. In this work, we introduce SSFL for diatom classification as a representative real-world instance and systematically investigate stage-specific data heterogeneity. We study cross-site variation in unlabeled data volume during pre-training and label-space misalignment during downstream fine-tuning. To study the latter in a controllable setting, we propose PreDi, a partitioning scheme that disentangles label-space heterogeneity into two orthogonal dimensions, namely class Prevalence and class-set size Disparity, enabling separate analysis of their effects. Guided by the resulting insights, we further propose PreP-WFL (Prevalence-based Personalized Weighted Federated Learning) to adaptively strengthen rare-class representations in low-prevalence scenarios. Extensive experiments show that SSFL consistently outperforms local-only training under both homogeneous and heterogeneous settings. The pronounced heterogeneity in unlabeled data volume is associated with improved representation pre-training, whereas under label-space heterogeneity, prevalence dominates performance and disparity has a smaller effect. PreP-WFL effectively mitigates this degradation, with gains increasing as prevalence decreases. These findings provide a mechanistic basis for characterizing label-space heterogeneity in decentralized recognition systems.
- Abstract(参考訳): 分散データおよび異種データに基づくラベル・スカース視覚分類は、特にサイトが部分的に重複するクラスセットを示す場合、パターン認識における根本的な課題である。
自己教師付き連合学習(SSFL)は有望な解決策を提供するが、既存の研究では、事前学習と微調整を通して同じデータ均一性パターンを仮定することが一般的である。
さらに、現在のパーティショニングスキームは、純粋にクラス非結合なデータ設定を生成することができず、実世界のラベル空間の不均一性の制御可能なシミュレーションを制限している。
本研究では,実世界の代表例として珪藻分類のためのSSFLを導入し,ステージ固有のデータ不均一性を体系的に検討する。
本研究では,下流微調整におけるラベル付きデータ量の変化とラベル空間のミスアライメントについて検討した。
後者を制御可能な環境で研究するために,ラベル空間の不均一性を2つの直交次元,すなわちクラス前値とクラスサイズ不一致に分解する分割スキームであるPreDiを提案する。
この結果から,低頻度シナリオにおけるレアクラスの表現を適応的に強化するPreP-WFL(Prevalence-based Personalized Weighted Federated Learning)を提案する。
広範な実験により、SSFLは均質な条件と異質な条件の両方で、局所的な訓練よりも一貫して優れていた。
ラベル付きデータボリュームの顕著な不均一性は、表現事前訓練の改善に関連付けられるが、ラベル空間の不均一性の下では、頻度が性能を上回り、不均一性がより小さい効果を持つ。
PreP-WFLはこの劣化を効果的に軽減し、頻度が減少するにつれて上昇する。
これらの知見は、分散認識システムにおけるラベル空間の不均一性を特徴づける機械的基盤を提供する。
関連論文リスト
- A Unified Framework for Heterogeneous Semi-supervised Learning [26.87757610311636]
Heterogeneous Semi-Supervised Learning (HSSL) と呼ばれる新しい問題設定を導入する。
HSSLは、半教師付き学習(SSL)タスクと教師なしドメイン適応(UDA)タスクをブリッジすることで、ユニークな課題を提示している。
本稿では,HSSLに対処するための新しい手法であるUnified Framework for Heterogeneous Semi-supervised Learning (Uni-HSSL)を提案する。
論文 参考訳(メタデータ) (2025-03-01T01:32:02Z) - Comparative Evaluation of Clustered Federated Learning Methods [0.5242869847419834]
CFL(Clustered Federated Learning)は、クライアントを均質なグループに分割することを目的としている。
本稿では,2つの最先端CFLアルゴリズムの性能について,フェデレートラーニング(FL)におけるデータ不均一性の分類法を提案する。
我々の目的は、CFLのパフォーマンスとデータ異種シナリオの関係をより明確に理解することである。
論文 参考訳(メタデータ) (2024-10-18T07:01:56Z) - Exploring Vacant Classes in Label-Skewed Federated Learning [113.65301899666645]
本稿では,ラベルスキュード・フェデレーション学習の新しいアプローチであるFedVLSを紹介する。
空のクラス蒸留とロジット抑制を同時に統合する。
FedVLSの有効性を検証する実験は、従来のSOTA(State-of-the-art)法と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2024-01-04T16:06:31Z) - Combining propensity score methods with variational autoencoders for
generating synthetic data in presence of latent sub-groups [0.0]
ヘテロジニティは、例えば、サブグループラベルによって示されるように知られ、あるいは未知であり、双曲性や歪みのような分布の性質にのみ反映されるかもしれない。
本研究では,変分オートエンコーダ(VAE)から合成データを取得する際に,このような異種性をどのように保存し,制御するかを検討する。
論文 参考訳(メタデータ) (2023-12-12T22:49:24Z) - Learning Invariant Molecular Representation in Latent Discrete Space [52.13724532622099]
本稿では,分散シフトに対する不変性とロバスト性を示す分子表現を学習するための新しい枠組みを提案する。
我々のモデルは、様々な分布シフトが存在する場合に、最先端のベースラインに対してより強力な一般化を実現する。
論文 参考訳(メタデータ) (2023-10-22T04:06:44Z) - Generalizable Heterogeneous Federated Cross-Correlation and Instance
Similarity Learning [60.058083574671834]
本稿では,新しいFCCL+,フェデレーション相関と非ターゲット蒸留との類似性学習を提案する。
不均一な問題に対しては、無関係な公開データを通信に活用する。
局所的な更新段階における破滅的な忘れ物として、FCCL+はFederated Non Target Distillationを導入している。
論文 参考訳(メタデータ) (2023-09-28T09:32:27Z) - Rethinking Data Heterogeneity in Federated Learning: Introducing a New
Notion and Standard Benchmarks [65.34113135080105]
我々は、現在のセットアップにおけるデータ不均一性の問題が必ずしも問題であるだけでなく、FL参加者にとって有益であることを示す。
私たちの観察は直感的である。
私たちのコードはhttps://github.com/MMorafah/FL-SC-NIIDで利用可能です。
論文 参考訳(メタデータ) (2022-09-30T17:15:19Z) - No Fear of Heterogeneity: Classifier Calibration for Federated Learning
with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。
このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。
実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文 参考訳(メタデータ) (2021-06-09T12:02:29Z) - Supercharging Imbalanced Data Learning With Energy-based Contrastive
Representation Transfer [72.5190560787569]
コンピュータビジョンにおいて、長い尾のデータセットからの学習は、特に自然画像データセットの繰り返しのテーマである。
本稿では,データ生成機構がラベル条件と特徴分布の間で不変であるメタ分散シナリオを提案する。
これにより、因果データインフレーションの手順を利用してマイノリティクラスの表現を拡大できる。
論文 参考訳(メタデータ) (2020-11-25T00:13:11Z) - Fuzziness-based Spatial-Spectral Class Discriminant Information
Preserving Active Learning for Hyperspectral Image Classification [0.456877715768796]
本研究では,局所的・グローバルな識別情報保存手法の内外におけるファジィに基づく空間スペクトルを提案する。
ベンチマークHSIデータセットによる実験結果から,FLG法が生成,極端学習機械,スパース多相ロジスティック回帰に与える影響が示された。
論文 参考訳(メタデータ) (2020-05-28T18:58:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。