論文の概要: Semi-Supervised Federated Multi-Label Feature Selection with Fuzzy Information Measures
- arxiv url: http://arxiv.org/abs/2511.17796v1
- Date: Fri, 21 Nov 2025 21:41:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.432567
- Title: Semi-Supervised Federated Multi-Label Feature Selection with Fuzzy Information Measures
- Title(参考訳): ファジィ情報量を考慮した半監督型フェデレーション・マルチラベル特徴選択
- Authors: Afsaneh Mahanipour, Hana Khamfroush,
- Abstract要約: マルチラベル特徴選択(FS)は、無関係、ノイズ、冗長な特徴を取り除き、マルチラベルデータの次元性を減少させる。
既存の方法は一般的に集中的なデータを必要とするため、分散およびフェデレーションされた環境には適さない。
本研究では、クライアントがラベル付きデータのみを保持するSSFMLFSと呼ばれるセミスーパービジョンのフェデレーション付きマルチラベル特徴選択手法を提案し、サーバにはラベル付きデータしか持たない。
- 参考スコア(独自算出の注目度): 1.5870512175595712
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-label feature selection (FS) reduces the dimensionality of multi-label data by removing irrelevant, noisy, and redundant features, thereby boosting the performance of multi-label learning models. However, existing methods typically require centralized data, which makes them unsuitable for distributed and federated environments where each device/client holds its own local dataset. Additionally, federated methods often assume that clients have labeled data, which is unrealistic in cases where clients lack the expertise or resources to label task-specific data. To address these challenges, we propose a Semi-Supervised Federated Multi-Label Feature Selection method, called SSFMLFS, where clients hold only unlabeled data, while the server has limited labeled data. SSFMLFS adapts fuzzy information theory to a federated setting, where clients compute fuzzy similarity matrices and transmit them to the server, which then calculates feature redundancy and feature-label relevancy degrees. A feature graph is constructed by modeling features as vertices, assigning relevancy and redundancy degrees as vertex weights and edge weights, respectively. PageRank is then applied to rank the features by importance. Extensive experiments on five real-world datasets from various domains, including biology, images, music, and text, demonstrate that SSFMLFS outperforms other federated and centralized supervised and semi-supervised approaches in terms of three different evaluation metrics in non-IID data distribution setting.
- Abstract(参考訳): マルチラベル特徴選択(FS)は、無関係、ノイズ、冗長な特徴を取り除き、マルチラベル学習モデルの性能を高めることで、マルチラベルデータの次元性を低下させる。
しかし、既存のメソッドは一般的に集中型データを必要とするため、各デバイス/クライアントが独自のローカルデータセットを保持する分散およびフェデレーション環境には適さない。
さらに、フェデレートされたメソッドは、クライアントがデータにラベルをつけたと仮定することが多く、クライアントがタスク固有のデータにラベル付けする専門知識やリソースを欠いている場合、非現実的である。
これらの課題に対処するために、クライアントがラベル付きデータのみを保持するSSFMLFSと呼ばれるセミスーパービジョン・フェデレーション・マルチラベル特徴選択手法を提案し、サーバにはラベル付きデータしか持たない。
SSFMLFSはファジィ情報理論をファジィ類似度行列を計算してサーバに送信し、特徴冗長性と特徴ラベル関連度を計算するフェデレーション設定に適合させる。
特徴グラフは特徴を頂点としてモデル化し、関連度と冗長度を頂点重みとエッジ重みに割り当てる。
次に、PageRankが重要度で機能のランク付けに適用される。
生物学、画像、音楽、テキストを含む5つの現実世界のデータセットに対する大規模な実験は、SSFMLFSが、非IIDデータ分散設定における3つの異なる評価指標の観点から、他のフェデレーションおよび集中型および半教師付きアプローチより優れていることを示した。
関連論文リスト
- Boosting Federated Learning with FedEntOpt: Mitigating Label Skew by Entropy-Based Client Selection [13.851391819710367]
ディープラーニングドメインは通常、最適なパフォーマンスのために大量のデータを必要とします。
FedEntOptは、ラベル配布スキューによるパフォーマンスの問題を軽減するように設計されている。
低い参加率とクライアントのドロップアウトのシナリオでは、堅牢で優れたパフォーマンスを示す。
論文 参考訳(メタデータ) (2024-11-02T13:31:36Z) - FMLFS: A Federated Multi-Label Feature Selection Based on Information Theory in IoT Environment [1.749521391198341]
Internet-of-Things(IoT)デバイスは、大量のマルチラベルデータセットを生成し、収集する。
これらのデータセットにおけるノイズ、冗長、あるいは無関係な特徴の存在は、次元性の呪いとともに、マルチラベル分類器の課題を提起する。
本稿では,最初のフェデレーション付きマルチラベル特徴選択法であるFMLFSを紹介する。
論文 参考訳(メタデータ) (2024-05-01T13:58:28Z) - Causal Multi-Label Feature Selection in Federated Setting [11.713722451298171]
3つの新しいサブルーチンを持つフェデレート因果多ラベル特徴選択(FedCMFS)アルゴリズムを提案する。
FedCMFSはまずFedCFLサブルーチンを使用し、ラベルラベル、ラベル機能、機能機能間の相関を考慮し、関連する特徴を学習する。
第二に、FedCMFSはFedCFRサブルーチンを使用して、紛失した真の関連する機能を選択的に回収する。
論文 参考訳(メタデータ) (2024-03-11T04:11:48Z) - infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z) - Federated Multi-Target Domain Adaptation [99.93375364579484]
フェデレートされた学習手法により、プライバシを保護しながら、分散ユーザデータ上で機械学習モデルをトレーニングすることが可能になります。
分散クライアントデータがラベル付けされず、集中型ラベル付きデータセットがサーバ上で利用可能となる、より実用的なシナリオを考えます。
本稿では,新しい課題に対処する効果的なDualAdapt法を提案する。
論文 参考訳(メタデータ) (2021-08-17T17:53:05Z) - Exploiting Shared Representations for Personalized Federated Learning [54.65133770989836]
本稿では,クライアント間の共有データ表現と,クライアント毎のユニークなローカルヘッダを学習するための,新しいフェデレーション学習フレームワークとアルゴリズムを提案する。
提案アルゴリズムは, クライアント間の分散計算能力を利用して, 表現の更新毎に低次元の局所パラメータに対して, 多数の局所更新を行う。
この結果は、データ分布間の共有低次元表現を学習することを目的とした、幅広い種類の問題に対するフェデレーション学習以上の関心を持っている。
論文 参考訳(メタデータ) (2021-02-14T05:36:25Z) - Federated Unsupervised Representation Learning [56.715917111878106]
フェデレート非教師表現学習(FURL)と呼ばれるフェデレーション学習における新しい問題を定式化し、教師なしの共通表現モデルを学習する。
FedCAは2つの主要なモジュールで構成されている: 辞書モジュールは、各クライアントからのサンプルの表現を集約し、表現空間の整合性のためにすべてのクライアントと共有し、アライメントモジュールは、公開データに基づいてトレーニングされたベースモデル上で各クライアントの表現を整合させる。
論文 参考訳(メタデータ) (2020-10-18T13:28:30Z) - Federated Semi-Supervised Learning with Inter-Client Consistency &
Disjoint Learning [78.88007892742438]
ラベル付きデータの位置に基づくFSSL(Federated Semi-Supervised Learning)の2つの重要なシナリオについて検討する。
フェデレートマッチング(FedMatch)と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2020-06-22T09:43:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。