論文の概要: D3FL: Data Distribution and Detrending for Robust Federated Learning in Non-linear Time-series Data
- arxiv url: http://arxiv.org/abs/2507.11471v1
- Date: Tue, 15 Jul 2025 16:41:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-16 19:46:03.190401
- Title: D3FL: Data Distribution and Detrending for Robust Federated Learning in Non-linear Time-series Data
- Title(参考訳): D3FL:非線形時系列データにおけるロバスト・フェデレーション学習のためのデータ分布と遅延
- Authors: Harsha Varun Marisetty, Manik Gupta, Yogesh Simmhan,
- Abstract要約: IoTデバイスは通常、温度、湿度、エネルギーメーターなど、さまざまなセンサーからデータを収集する。
従来、IoTデバイスからのデータは分析のために中央集権化されていたが、このアプローチは遅延と通信コストの増加をもたらす。
フェデレートラーニング(FL)は、分散デバイス間のモデルトレーニングを可能にする効果的な代替手段として登場した。
- 参考スコア(独自算出の注目度): 3.554161433683966
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With advancements in computing and communication technologies, the Internet of Things (IoT) has seen significant growth. IoT devices typically collect data from various sensors, such as temperature, humidity, and energy meters. Much of this data is temporal in nature. Traditionally, data from IoT devices is centralized for analysis, but this approach introduces delays and increased communication costs. Federated learning (FL) has emerged as an effective alternative, allowing for model training across distributed devices without the need to centralize data. In many applications, such as smart home energy and environmental monitoring, the data collected by IoT devices across different locations can exhibit significant variation in trends and seasonal patterns. Accurately forecasting such non-stationary, non-linear time-series data is crucial for applications like energy consumption estimation and weather forecasting. However, these data variations can severely impact prediction accuracy. The key contributions of this paper are: (1) Investigating how non-linear, non-stationary time-series data distributions, like generalized extreme value (gen-extreme) and log norm distributions, affect FL performance. (2) Analyzing how different detrending techniques for non-linear time-series data influence the forecasting model's performance in a FL setup. We generated several synthetic time-series datasets using non-linear data distributions and trained an LSTM-based forecasting model using both centralized and FL approaches. Additionally, we evaluated the impact of detrending on real-world datasets with non-linear time-series data distributions. Our experimental results show that: (1) FL performs worse than centralized approaches when dealing with non-linear data distributions. (2) The use of appropriate detrending techniques improves FL performance, reducing loss across different data distributions.
- Abstract(参考訳): コンピューティングと通信技術の進歩により、IoT(Internet of Things)は大きな成長を遂げた。
IoTデバイスは通常、温度、湿度、エネルギーメーターなど、さまざまなセンサーからデータを収集する。
これらのデータの多くは、本質的に一時的なものである。
従来、IoTデバイスからのデータは分析のために中央集権化されていたが、このアプローチは遅延と通信コストの増加をもたらす。
フェデレートラーニング(FL)は効果的な代替手段として現れており、データを集中化することなく、分散デバイス間のモデルトレーニングを可能にしている。
スマートホームエネルギーや環境モニタリングなど、多くのアプリケーションにおいて、IoTデバイスによって異なる場所にわたって収集されたデータは、トレンドや季節的なパターンに大きな変化をもたらす可能性がある。
エネルギー消費推定や天気予報といった応用には,非定常・非線形時系列データの正確な予測が不可欠である。
しかし、これらのデータバリエーションは予測精度に深刻な影響を及ぼす可能性がある。
本論文の主な貢献は次のとおりである。 1) 一般化された極値 (gen-extreme) やログノルム分布のような非線形で非定常な時系列データ分布がFL性能にどのように影響するかを検討する。
2) FLセットアップにおける予測モデルの性能に及ぼす非線形時系列データの違いの影響について分析した。
我々は、非線形データ分布を用いた合成時系列データセットを複数生成し、集中的およびFLアプローチの両方を用いてLSTMに基づく予測モデルを訓練した。
さらに,非線形時系列データ分布を持つ実世界のデータセットに対する抑止の影響を評価した。
実験の結果, 1) FLは非線形データ分布を扱う場合, 集中型アプローチよりも悪い結果が得られた。
2) 適切な復調技術を用いることでFL性能が向上し, 異なるデータ分布間の損失が低減される。
関連論文リスト
- Federated Learning for Traffic Flow Prediction with Synthetic Data Augmentation [10.751702067716804]
この研究はFedTPSと呼ばれるFLフレームワークを導入し、FLを介して軌道生成モデルをトレーニングすることで、各クライアントのローカルデータセットを増大させる合成データを生成する。
提案手法は,様々なFL手法と交通流予測モデルを用いて,大規模現実のライドシェアリングデータセットを用いて評価する。
論文 参考訳(メタデータ) (2024-12-11T15:25:38Z) - Tackling Data Heterogeneity in Federated Time Series Forecasting [61.021413959988216]
時系列予測は、エネルギー消費予測、病気の伝染モニタリング、天気予報など、様々な実世界の応用において重要な役割を果たす。
既存のほとんどのメソッドは、分散デバイスから中央クラウドサーバに大量のデータを収集する、集中的なトレーニングパラダイムに依存しています。
本稿では,情報合成データを補助的知識キャリアとして生成することにより,データの均一性に対処する新しいフレームワークであるFed-TRENDを提案する。
論文 参考訳(メタデータ) (2024-11-24T04:56:45Z) - Physics-guided Active Sample Reweighting for Urban Flow Prediction [75.24539704456791]
都市フロー予測は、バス、タクシー、ライド駆動モデルといった交通サービスのスループットを見積もる、微妙な時間的モデリングである。
最近の予測解は、物理学誘導機械学習(PGML)の概念による改善をもたらす。
我々は、PN(atized Physics-guided Network)を開発し、P-GASR(Physical-guided Active Sample Reweighting)を提案する。
論文 参考訳(メタデータ) (2024-07-18T15:44:23Z) - Adaptive Model Pruning and Personalization for Federated Learning over
Wireless Networks [72.59891661768177]
フェデレーション学習(FL)は、データプライバシを保護しながら、エッジデバイス間での分散学習を可能にする。
これらの課題を克服するために、部分的なモデルプルーニングとパーソナライズを備えたFLフレームワークを検討する。
このフレームワークは、学習モデルを、データ表現を学ぶためにすべてのデバイスと共有されるモデルプルーニングと、特定のデバイスのために微調整されるパーソナライズされた部分とで、グローバルな部分に分割する。
論文 参考訳(メタデータ) (2023-09-04T21:10:45Z) - Analysis and Optimization of Wireless Federated Learning with Data
Heterogeneity [72.85248553787538]
本稿では、データの不均一性を考慮した無線FLの性能解析と最適化と、無線リソース割り当てについて述べる。
ロス関数の最小化問題を、長期エネルギー消費と遅延の制約の下で定式化し、クライアントスケジューリング、リソース割り当て、ローカルトレーニングエポック数(CRE)を共同で最適化する。
実世界のデータセットの実験により、提案アルゴリズムは学習精度とエネルギー消費の点で他のベンチマークよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-08-04T04:18:01Z) - DeepVol: Volatility Forecasting from High-Frequency Data with Dilated Causal Convolutions [53.37679435230207]
本稿では,Dilated Causal Convolutionsに基づくDeepVolモデルを提案する。
実験結果から,提案手法は高頻度データからグローバルな特徴を効果的に学習できることが示唆された。
論文 参考訳(メタデータ) (2022-09-23T16:13:47Z) - Online Data Selection for Federated Learning with Limited Storage [53.46789303416799]
ネットワークデバイス間での分散機械学習を実現するために、フェデレートラーニング(FL)が提案されている。
デバイス上のストレージがFLの性能に与える影響はまだ調査されていない。
本研究では,デバイス上のストレージを限定したFLのオンラインデータ選択について検討する。
論文 参考訳(メタデータ) (2022-09-01T03:27:33Z) - A data filling methodology for time series based on CNN and (Bi)LSTM
neural networks [0.0]
イタリア・ボルツァーノの監視アパートから得られた時系列データギャップを埋めるための2つのDeep Learningモデルを開発した。
提案手法は, 変動するデータの性質を把握し, 対象時系列の再構成に優れた精度を示す。
論文 参考訳(メタデータ) (2022-04-21T09:40:30Z) - Towards Fast and Accurate Federated Learning with non-IID Data for
Cloud-Based IoT Applications [22.107854601448906]
フェデレートラーニング(FL)はモノのインターネット(IoT)設計で人気を博している。
IoTデバイスによって収集されたデータが非独立かつ同一に分散された(非IID)方法でスキューされると、バニラFL法の精度が保証されない。
本稿では,非IIDデータのトレーニングにおいて,重み分散のデメリットを効果的に低減できる新しいデータベースデバイスグループ化手法を提案する。
論文 参考訳(メタデータ) (2022-01-29T06:49:08Z) - Towards Synthetic Multivariate Time Series Generation for Flare
Forecasting [5.098461305284216]
データ駆動・レアイベント予測アルゴリズムのトレーニングにおける制限要因の1つは、関心のあるイベントの不足である。
本研究では,データインフォームド・オーバーサンプリングを行う手段として,条件付き生成逆数ネットワーク(CGAN)の有用性を検討する。
論文 参考訳(メタデータ) (2021-05-16T22:23:23Z) - Predicting traffic signals on transportation networks using
spatio-temporal correlations on graphs [56.48498624951417]
本稿では,複数の熱拡散カーネルをデータ駆動予測モデルにマージして交通信号を予測する交通伝搬モデルを提案する。
予測誤差を最小限に抑えるためにベイズ推定を用いてモデルパラメータを最適化し,2つの手法の混合率を決定する。
提案モデルでは,計算労力の少ない最先端のディープニューラルネットワークに匹敵する予測精度を示す。
論文 参考訳(メタデータ) (2021-04-27T18:17:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。