論文の概要: Data augmentation through multivariate scenario forecasting in Data
Centers using Generative Adversarial Networks
- arxiv url: http://arxiv.org/abs/2201.06147v1
- Date: Wed, 12 Jan 2022 15:09:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-23 19:56:38.882308
- Title: Data augmentation through multivariate scenario forecasting in Data
Centers using Generative Adversarial Networks
- Title(参考訳): Generative Adversarial Networks を用いたデータセンターにおける多変量予測によるデータ拡張
- Authors: Jaime P\'erez, Patricia Arroba and Jos\'e M. Moya
- Abstract要約: 人工知能に基づくグローバルなエネルギー効率戦略を実現する上での大きな課題は、アルゴリズムを供給するために大量のデータが必要であることです。
本稿では,データセンタ内の合成シナリオ予測に基づく時系列データ拡張手法を提案する。
我々の研究は、データセンターで消費されるエネルギーを最適化するのに役立ちます。
- 参考スコア(独自算出の注目度): 0.18416014644193063
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Cloud paradigm is at a critical point in which the existing
energy-efficiency techniques are reaching a plateau, while the computing
resources demand at Data Center facilities continues to increase exponentially.
The main challenge in achieving a global energy efficiency strategy based on
Artificial Intelligence is that we need massive amounts of data to feed the
algorithms. Nowadays, any optimization strategy must begin with data. However,
companies with access to these large amounts of data decide not to share them
because it could compromise their security. This paper proposes a time-series
data augmentation methodology based on synthetic scenario forecasting within
the Data Center. For this purpose, we will implement a powerful generative
algorithm: Generative Adversarial Networks (GANs). The use of GANs will allow
us to handle multivariate data and data from different natures (e.g.,
categorical). On the other hand, adapting Data Centers' operational management
to the occurrence of sporadic anomalies is complicated due to the reduced
frequency of failures in the system. Therefore, we also propose a methodology
to increase the generated data variability by introducing on-demand anomalies.
We validated our approach using real data collected from an operating Data
Center, successfully obtaining forecasts of random scenarios with several hours
of prediction. Our research will help to optimize the energy consumed in Data
Centers, although the proposed methodology can be employed in any similar
time-series-like problem.
- Abstract(参考訳): クラウドパラダイムは、既存のエネルギー効率技術が高原に達する重要なポイントであり、データセンター施設でのコンピューティングリソースの需要は指数関数的に増加を続けている。
人工知能に基づくグローバルなエネルギー効率戦略を実現する上での大きな課題は、アルゴリズムを供給するために大量のデータが必要であることです。
現在、あらゆる最適化戦略はデータから始まる必要があります。
しかし、大量のデータにアクセスしている企業は、セキュリティを損なう可能性があるため、共有しないことを決めている。
本稿では,データセンター内のシナリオ予測に基づく時系列データ拡張手法を提案する。
そこで我々は,GAN(Generative Adversarial Networks)という強力な生成アルゴリズムを実装する。
GANを使用することで、多変量データと異なる性質(例えばカテゴリ)のデータを扱うことができます。
一方,データセンタの運用管理を散発的異常の発生に適応させることは,システム内の障害の発生頻度が減少するため複雑である。
そこで本研究では,オンデマンド・アノマリーを導入することで,生成データの変動性を高める手法を提案する。
運用中のデータセンタから収集した実データを用いて検証を行い,数時間の予測でランダムシナリオの予測を成功させた。
私たちの研究は、データセンターで消費されるエネルギーを最適化するのに役立ちます。
関連論文リスト
- Tackling Data Heterogeneity in Federated Time Series Forecasting [61.021413959988216]
時系列予測は、エネルギー消費予測、病気の伝染モニタリング、天気予報など、様々な実世界の応用において重要な役割を果たす。
既存のほとんどのメソッドは、分散デバイスから中央クラウドサーバに大量のデータを収集する、集中的なトレーニングパラダイムに依存しています。
本稿では,情報合成データを補助的知識キャリアとして生成することにより,データの均一性に対処する新しいフレームワークであるFed-TRENDを提案する。
論文 参考訳(メタデータ) (2024-11-24T04:56:45Z) - A Distribution-Aware Flow-Matching for Generating Unstructured Data for Few-Shot Reinforcement Learning [1.0709300917082865]
組込みプロセッサ上の数ショット強化学習(RL)に適した合成非構造化データを生成するために設計された分散型フローマッチングを提案する。
我々はランダムフォレストを通した特徴重み付けを重要データ面の優先順位付けに適用し,生成した合成データの精度を向上させる。
本手法は,最初期の第1タイムスタンプにおいて,フレームレートを30%向上しながら,最大Q値に基づく安定収束を提供する。
論文 参考訳(メタデータ) (2024-09-21T15:50:59Z) - PeFAD: A Parameter-Efficient Federated Framework for Time Series Anomaly Detection [51.20479454379662]
私たちはaを提案します。
フェデレートされた異常検出フレームワークであるPeFADは、プライバシーの懸念が高まっている。
我々は、4つの実際のデータセットに対して広範な評価を行い、PeFADは既存の最先端ベースラインを最大28.74%上回っている。
論文 参考訳(メタデータ) (2024-06-04T13:51:08Z) - Multi-Source Conformal Inference Under Distribution Shift [41.701790856201036]
複数のバイアスのあるデータソースを活用することにより,対象個体数の分布自由な予測区間を得るという課題を考察する。
対象集団および源集団における未観測結果の定量値に対する効率的な影響関数を導出する。
本稿では、効率向上のための重み付き情報ソースとバイアス低減のための重み付き非情報ソースに対するデータ適応戦略を提案する。
論文 参考訳(メタデータ) (2024-05-15T13:33:09Z) - Analysis and Optimization of Wireless Federated Learning with Data
Heterogeneity [72.85248553787538]
本稿では、データの不均一性を考慮した無線FLの性能解析と最適化と、無線リソース割り当てについて述べる。
ロス関数の最小化問題を、長期エネルギー消費と遅延の制約の下で定式化し、クライアントスケジューリング、リソース割り当て、ローカルトレーニングエポック数(CRE)を共同で最適化する。
実世界のデータセットの実験により、提案アルゴリズムは学習精度とエネルギー消費の点で他のベンチマークよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-08-04T04:18:01Z) - A Dataset Fusion Algorithm for Generalised Anomaly Detection in
Homogeneous Periodic Time Series Datasets [0.0]
データセットフュージョン(Dataset Fusion)とは、複数の同種データセットからの周期的な信号を単一のデータセットに融合するアルゴリズムである。
提案手法は,平均F1スコア0.879で従来の訓練方法よりも有意に優れていた。
その結果、トレーニングデータの6.25%しか使用せず、計算能力の93.7%削減に換算すると、パフォーマンスは4.04%低下することがわかった。
論文 参考訳(メタデータ) (2023-05-14T16:24:09Z) - Balancing Performance and Energy Consumption of Bagging Ensembles for
the Classification of Data Streams in Edge Computing [9.801387036837871]
エッジコンピューティング(EC)は、IoT(Internet of Things)や5Gネットワークといったテクノロジを開発する上で可能な要素として登場した。
本研究は,データストリームの分類において,バッグアンサンブルの性能とエネルギー消費を最適化するための戦略を検討する。
論文 参考訳(メタデータ) (2022-01-17T04:12:18Z) - Convolutional generative adversarial imputation networks for
spatio-temporal missing data in storm surge simulations [86.5302150777089]
GAN(Generative Adversarial Imputation Nets)とGANベースの技術は、教師なし機械学習手法として注目されている。
提案手法を Con Conval Generative Adversarial Imputation Nets (Conv-GAIN) と呼ぶ。
論文 参考訳(メタデータ) (2021-11-03T03:50:48Z) - Reinforcement Learning for Datacenter Congestion Control [50.225885814524304]
渋滞制御アルゴリズムの成功は、レイテンシとネットワーク全体のスループットを劇的に改善する。
今日まで、このような学習ベースのアルゴリズムはこの領域で実用的な可能性を示さなかった。
実世界のデータセンターネットワークの様々な構成に一般化することを目的としたRLに基づくアルゴリズムを考案する。
本稿では,この手法が他のRL手法よりも優れており,トレーニング中に見られなかったシナリオに一般化可能であることを示す。
論文 参考訳(メタデータ) (2021-02-18T13:49:28Z) - A Federated Data-Driven Evolutionary Algorithm [10.609815608017065]
既存のデータ駆動進化最適化アルゴリズムでは、すべてのデータが中央に格納される必要がある。
本論文では,複数のデバイスに分散してデータ駆動型最適化を行うフェデレーションデータ駆動型進化型最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-16T17:18:54Z) - Quasi-Global Momentum: Accelerating Decentralized Deep Learning on
Heterogeneous Data [77.88594632644347]
ディープラーニングモデルの分散トレーニングは、ネットワーク上でデータプライバシとデバイス上での学習を可能にする重要な要素である。
現実的な学習シナリオでは、異なるクライアントのローカルデータセットに異質性が存在することが最適化の課題となる。
本稿では,この分散学習の難しさを軽減するために,運動量に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2021-02-09T11:27:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。