論文の概要: FedRS-Bench: Realistic Federated Learning Datasets and Benchmarks in Remote Sensing
- arxiv url: http://arxiv.org/abs/2505.08325v1
- Date: Tue, 13 May 2025 08:04:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-14 20:57:54.48098
- Title: FedRS-Bench: Realistic Federated Learning Datasets and Benchmarks in Remote Sensing
- Title(参考訳): FedRS-Bench: リモートセンシングにおける現実的なフェデレーション学習データセットとベンチマーク
- Authors: Haodong Zhao, Peng Peng, Chiyu Chen, Linqing Huang, Gongshen Liu,
- Abstract要約: Federated Learning (FL)は、分散リモートセンシング(RS)データソース間で、生データを公開せずに協調的なモデルトレーニングを可能にするソリューションを提供する。
本稿では,現実的な運用シナリオを表す,FedRSと呼ばれる現実的なフェデレーションRSデータセットを提案する。
総合的なFedRS-Benchを構築するために,10のベースラインFLアルゴリズムと評価指標を実装した。
- 参考スコア(独自算出の注目度): 13.10438674331326
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Remote sensing (RS) images are usually produced at an unprecedented scale, yet they are geographically and institutionally distributed, making centralized model training challenging due to data-sharing restrictions and privacy concerns. Federated learning (FL) offers a solution by enabling collaborative model training across decentralized RS data sources without exposing raw data. However, there lacks a realistic federated dataset and benchmark in RS. Prior works typically rely on manually partitioned single dataset, which fail to capture the heterogeneity and scale of real-world RS data, and often use inconsistent experimental setups, hindering fair comparison. To address this gap, we propose a realistic federated RS dataset, termed FedRS. FedRS consists of eight datasets that cover various sensors and resolutions and builds 135 clients, which is representative of realistic operational scenarios. Data for each client come from the same source, exhibiting authentic federated properties such as skewed label distributions, imbalanced client data volumes, and domain heterogeneity across clients. These characteristics reflect practical challenges in federated RS and support evaluation of FL methods at scale. Based on FedRS, we implement 10 baseline FL algorithms and evaluation metrics to construct the comprehensive FedRS-Bench. The experimental results demonstrate that FL can consistently improve model performance over training on isolated data silos, while revealing performance trade-offs of different methods under varying client heterogeneity and availability conditions. We hope FedRS-Bench will accelerate research on large-scale, realistic FL in RS by providing a standardized, rich testbed and facilitating fair comparisons across future works. The source codes and dataset are available at https://fedrs-bench.github.io/.
- Abstract(参考訳): リモートセンシング(RS)画像は通常前例のない規模で生成されるが、地理的かつ制度的に分散しており、データ共有の制限やプライバシー上の懸念により集中的なモデルトレーニングが困難である。
フェデレートラーニング(FL)は、生データを公開せずに分散RSデータソース間で協調的なモデルトレーニングを可能にするソリューションを提供する。
しかし、RSには現実的なフェデレーションデータセットとベンチマークが欠けている。
従来の作業は通常、手動で分割された単一データセットに依存しており、現実世界のRSデータの異質性とスケールを捉えず、しばしば一貫性のない実験的なセットアップを使用して、公正な比較を妨げている。
このギャップに対処するため、我々はFedRSと呼ばれる現実的なフェデレーションRSデータセットを提案する。
FedRSは、さまざまなセンサーと解像度をカバーする8つのデータセットで構成され、現実的な運用シナリオを表す135のクライアントを構築している。
各クライアントのデータは同じソースから取得され、スキューラベルの配布、不均衡なクライアントデータボリューム、クライアント間のドメインの不均一性といった、真のフェデレーション特性を示す。
これらの特徴は、連合RSにおける実践的な課題と大規模FL法のサポート評価を反映している。
FedRSに基づいて,総合的なFedRS-Benchを構築するために,10のベースラインFLアルゴリズムと評価指標を実装した。
実験により、FLは、クライアントの不均一性と可用性条件の異なる異なるメソッドのパフォーマンストレードオフを明らかにしながら、孤立したデータサイロのトレーニングよりもモデル性能を一貫して改善できることを示した。
我々は、FedRS-Benchが標準化されたリッチなテストベッドを提供し、将来の作業における公正な比較を促進することで、RSの大規模で現実的なFLの研究を加速することを期待している。
ソースコードとデータセットはhttps://fedrs-bench.github.io/.com/で公開されている。
関連論文リスト
- A Framework for testing Federated Learning algorithms using an edge-like environment [0.0]
フェデレーテッド・ラーニング(FL)は、多くのクライアントが、データをプライベートかつ分散化しながら、単一の集中型モデルを協調的にトレーニングする機械学習パラダイムである。
グローバル集中型モデルアグリゲーションにおける局所モデルの貢献を正確に評価するのは簡単ではない。
これはFLにおける大きな挑戦の例であり、一般にデータ不均衡またはクラス不均衡として知られている。
本研究では,FLアルゴリズムをより容易かつスケーラブルに評価するためのフレームワークを提案し,実装した。
論文 参考訳(メタデータ) (2024-07-17T19:52:53Z) - StatAvg: Mitigating Data Heterogeneity in Federated Learning for Intrusion Detection Systems [22.259297167311964]
フェデレートラーニング(FL)は、デバイスが生データを第三者に公開することなく、共同で機械学習(ML)またはディープラーニング(DL)モデルを構築することができる分散学習技術である。
プライバシー保護の性質から、FLはサイバーセキュリティの領域内で侵入検知システム(IDS)を構築するために広く注目を集めている。
FLにおけるローカルクライアントのデータ間で,非独立かつ同一の(非ID)分散機能を緩和する,統計的平均化(StatAvg)と呼ばれる有効な手法を提案する。
論文 参考訳(メタデータ) (2024-05-20T14:41:59Z) - Towards Fairness in Provably Communication-Efficient Federated Recommender Systems [8.215115151660958]
本研究では,通信効率の向上に必要なクライアントの理想的な数を決定するサンプル境界を確立する。
本研究では,RS-FairFRSが通信コストを削減できることを実証的に示す。
ランダムサンプリングにより通信効率は向上するが,本研究では,トレーニングに参加するアクティブクライアントの保護属性を明らかにすることなく,公平性を実現するために,新しい二相二相更新手法を提案する。
論文 参考訳(メタデータ) (2024-05-03T01:53:17Z) - An Aggregation-Free Federated Learning for Tackling Data Heterogeneity [50.44021981013037]
フェデレートラーニング(FL)は、分散データセットからの知識を活用する効果に頼っている。
従来のFLメソッドでは、クライアントが前回のトレーニングラウンドからサーバが集約したグローバルモデルに基づいてローカルモデルを更新するアグリゲート-then-adaptフレームワークを採用している。
我々は,新しいアグリゲーションフリーFLアルゴリズムであるFedAFを紹介する。
論文 参考訳(メタデータ) (2024-04-29T05:55:23Z) - FLASH: Federated Learning Across Simultaneous Heterogeneities [54.80435317208111]
FLASH (Federated Learning Across Simultaneous Heterogeneities) は軽量かつ柔軟なクライアント選択アルゴリズムである。
ヘテロジニティの幅広い情報源の下で、最先端のFLフレームワークよりも優れています。
最先端のベースラインよりも大幅に、一貫性のある改善を実現している。
論文 参考訳(メタデータ) (2024-02-13T20:04:39Z) - Soft Random Sampling: A Theoretical and Empirical Analysis [59.719035355483875]
ソフトランダムサンプリング(SRS)は、大量のデータを扱う際に、効率的なディープニューラルネットワークに対して単純だが効果的なアプローチである。
それは、各エポックに設定された各データセットから、ランダムに置換された均一な速度を選択する。
実世界の産業規模で重要な競争力を持つ、強力で競争力のある戦略であることが示されている。
論文 参考訳(メタデータ) (2023-11-21T17:03:21Z) - Towards Instance-adaptive Inference for Federated Learning [80.38701896056828]
Federated Learning(FL)は、複数のクライアントがローカルトレーニングを集約することで、強力なグローバルモデルを学ぶことができる分散学習パラダイムである。
本稿では,FedInsという新しいFLアルゴリズムを提案する。
我々のFedInsは、Tiny-ImageNet上での通信コストが15%未満で、トップパフォーマンスの手法に対して6.64%の改善など、最先端のFLアルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-11T09:58:47Z) - FedScale: Benchmarking Model and System Performance of Federated
Learning [4.1617240682257925]
FedScaleは、連邦学習(FL)研究のための、挑戦的で現実的なベンチマークデータセットのセットである。
FedScaleはオープンソースで、寛容なライセンスを持ち、積極的にメンテナンスされている。
論文 参考訳(メタデータ) (2021-05-24T15:55:27Z) - Federated Visual Classification with Real-World Data Distribution [9.564468846277366]
我々は,FedAvg(Federated Averaging)アルゴリズムのベンチマークを用いて,実世界のデータ分布が分散学習に与える影響を特徴付ける。
種別とランドマーク分類のための2つの新しい大規模データセットを導入し,ユーザ毎のデータ分割を現実的に行う。
また、2つの新しいアルゴリズム(FedVC、FedIR)も開発しています。
論文 参考訳(メタデータ) (2020-03-18T07:55:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。