論文の概要: FMLFS: A federated multi-label feature selection based on information theory in IoT environment
- arxiv url: http://arxiv.org/abs/2405.00524v1
- Date: Wed, 1 May 2024 13:58:28 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-02 15:37:50.365052
- Title: FMLFS: A federated multi-label feature selection based on information theory in IoT environment
- Title(参考訳): FMLFS:IoT環境における情報理論に基づく連合型マルチラベル特徴選択
- Authors: Afsaneh Mahanipour, Hana Khamfroush,
- Abstract要約: Internet-of-Things(IoT)デバイスは、大量のマルチラベルデータセットを生成し、収集する。
これらのデータセットにおけるノイズ、冗長、あるいは無関係な特徴の存在は、次元性の呪いとともに、マルチラベル分類器の課題を提起する。
本稿では,最初のフェデレーション付きマルチラベル特徴選択法であるFMLFSを紹介する。
- 参考スコア(独自算出の注目度): 1.749521391198341
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In certain emerging applications such as health monitoring wearable and traffic monitoring systems, Internet-of-Things (IoT) devices generate or collect a huge amount of multi-label datasets. Within these datasets, each instance is linked to a set of labels. The presence of noisy, redundant, or irrelevant features in these datasets, along with the curse of dimensionality, poses challenges for multi-label classifiers. Feature selection (FS) proves to be an effective strategy in enhancing classifier performance and addressing these challenges. Yet, there is currently no existing distributed multi-label FS method documented in the literature that is suitable for distributed multi-label datasets within IoT environments. This paper introduces FMLFS, the first federated multi-label feature selection method. Here, mutual information between features and labels serves as the relevancy metric, while the correlation distance between features, derived from mutual information and joint entropy, is utilized as the redundancy measure. Following aggregation of these metrics on the edge server and employing Pareto-based bi-objective and crowding distance strategies, the sorted features are subsequently sent back to the IoT devices. The proposed method is evaluated through two scenarios: 1) transmitting reduced-size datasets to the edge server for centralized classifier usage, and 2) employing federated learning with reduced-size datasets. Evaluation across three metrics - performance, time complexity, and communication cost - demonstrates that FMLFS outperforms five other comparable methods in the literature and provides a good trade-off on three real-world datasets.
- Abstract(参考訳): ヘルス監視ウェアラブルやトラフィック監視システムなどの新興アプリケーションでは、IoT(Internet-of-Things)デバイスが大量のマルチラベルデータセットを生成し、収集する。
これらのデータセットの中で、各インスタンスはラベルのセットにリンクされる。
これらのデータセットにおけるノイズ、冗長、あるいは無関係な特徴の存在は、次元性の呪いとともに、マルチラベル分類器の課題を提起する。
特徴選択(FS)は、分類器の性能を高め、これらの課題に対処するための効果的な戦略であることが証明されている。
しかし、現時点では、IoT環境内の分散マルチラベルデータセットに適した文献に記録されている、既存の分散マルチラベルFSメソッドは存在しない。
本稿では,最初のフェデレーション付きマルチラベル特徴選択法であるFMLFSを紹介する。
ここでは、特徴とラベルの相互情報が関連度指標として機能し、相互情報と共同エントロピーから導かれる特徴間の相関距離が冗長度尺度として利用される。
エッジサーバ上のこれらのメトリクスの集約と、Paretoベースの双方向および集団距離戦略の採用に続いて、ソートされた機能は、その後IoTデバイスに送信される。
提案手法は2つのシナリオで評価される。
1)縮小サイズデータセットをエッジサーバに送信し、集中型分類器の使用、及び
2) 規模を縮小したデータセットを用いたフェデレーション学習。
パフォーマンス、時間的複雑さ、通信コストの3つの指標による評価は、FMLFSが文学における他の5つの同等のメソッドより優れており、3つの実世界のデータセットに対して良好なトレードオフを提供することを示している。
関連論文リスト
- Causal Multi-Label Feature Selection in Federated Setting [12.567019739483886]
3つの新しいサブルーチンを持つフェデレート因果多ラベル特徴選択(FedCMFS)アルゴリズムを提案する。
FedCMFSはまずFedCFLサブルーチンを使用し、ラベルラベル、ラベル機能、機能機能間の相関を考慮し、関連する特徴を学習する。
第二に、FedCMFSはFedCFRサブルーチンを使用して、紛失した真の関連する機能を選択的に回収する。
論文 参考訳(メタデータ) (2024-03-11T04:11:48Z) - Empowering HWNs with Efficient Data Labeling: A Clustered Federated
Semi-Supervised Learning Approach [2.046985601687158]
CFL(Clustered Federated Multitask Learning)は,統計的課題を克服するための効果的な戦略として注目されている。
本稿では,より現実的なHWNシナリオ用に設計された新しいフレームワークであるClustered Federated Semi-Supervised Learning (CFSL)を紹介する。
その結果,ラベル付きデータとラベル付きデータの比率が異なる場合,CFSLはテスト精度,ラベル付け精度,ラベル付け遅延などの重要な指標を著しく改善することがわかった。
論文 参考訳(メタデータ) (2024-01-19T11:47:49Z) - Multi-label affordance mapping from egocentric vision [3.683202928838613]
本稿では, 精度の高い多ラベルセグメンテーションを実現するために, 空き感に対する新しいアプローチを提案する。
我々の手法は、ファースト・パーソン・ビデオから空き地を自動的に抽出するために利用できる。
相互作用ホットスポットのマップを構築するために、メトリック表現をどのように活用できるかを示します。
論文 参考訳(メタデータ) (2023-09-05T10:56:23Z) - A Unified One-Step Solution for Aspect Sentiment Quad Prediction [3.428123050377681]
アスペクトベースの感情分析において、アスペクト感情クワッド予測(ASQP)は難しいが重要なサブタスクである。
我々はASQPのための2つの新しいデータセットをリリースし、このデータセットには、より大きなサイズ、サンプルあたりの単語数、より高密度の2つの特徴が含まれている。
そこで我々は,ASQPを統一したワンステップソリューションであるOne-ASQPを提案し,アスペクトカテゴリを検出し,アスペクト-オピニオン-感覚三重項を同時に同定する。
論文 参考訳(メタデータ) (2023-06-07T05:00:01Z) - infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z) - Multi-view Multi-label Anomaly Network Traffic Classification based on
MLP-Mixer Neural Network [55.21501819988941]
畳み込みニューラルネットワーク(CNN)に基づく既存のネットワークトラフィック分類は、グローバルな情報関連を無視しながら、トラフィックデータの局所的なパターンを強調することが多い。
本稿では,エンドツーエンドのネットワークトラフィック分類手法を提案する。
論文 参考訳(メタデータ) (2022-10-30T01:52:05Z) - Detection Hub: Unifying Object Detection Datasets via Query Adaptation
on Language Embedding [137.3719377780593]
新しいデザイン(De Detection Hubという名前)は、データセット認識とカテゴリ整列である。
データセットの不整合を緩和し、検出器が複数のデータセットをまたいで学習するための一貫性のあるガイダンスを提供する。
データセット間のカテゴリは、ワンホットなカテゴリ表現を単語埋め込みに置き換えることで、意味的に統一された空間に整列される。
論文 参考訳(メタデータ) (2022-06-07T17:59:44Z) - Learning Semantic Segmentation from Multiple Datasets with Label Shifts [101.24334184653355]
本論文では,ラベル空間が異なる複数のデータセットを対象としたモデルの自動学習手法であるUniSegを提案する。
具体的には,ラベルの相反と共起を考慮に入れた2つの損失を提案する。
論文 参考訳(メタデータ) (2022-02-28T18:55:19Z) - Dual-Refinement: Joint Label and Feature Refinement for Unsupervised
Domain Adaptive Person Re-Identification [51.98150752331922]
Unsupervised Domain Adaptive (UDA) Person Re-identification (再ID) は、ターゲットドメインデータのラベルが欠落しているため、難しい作業です。
オフラインクラスタリングフェーズにおける擬似ラベルとオンライントレーニングフェーズにおける特徴を共同で改良する,デュアルリファインメントと呼ばれる新しいアプローチを提案する。
本手法は最先端手法を大きなマージンで上回っている。
論文 参考訳(メタデータ) (2020-12-26T07:35:35Z) - Segment as Points for Efficient Online Multi-Object Tracking and
Segmentation [66.03023110058464]
本稿では,コンパクトな画像表現を非秩序な2次元点クラウド表現に変換することで,セグメントに基づくインスタンス埋め込みの学習に有効な方法を提案する。
本手法は,画像ではなく,ランダムに選択された点から識別インスタンスの埋め込みを学習する,新たなトラッキング・バイ・ポイントのパラダイムを生成する。
PointTrackという名前のオンラインMOTSフレームワークは、最先端のすべてのメソッドを大きなマージンで上回っている。
論文 参考訳(メタデータ) (2020-07-03T08:29:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。