論文の概要: Creating synthetic energy meter data using conditional diffusion and building metadata
- arxiv url: http://arxiv.org/abs/2404.00525v1
- Date: Sun, 31 Mar 2024 01:58:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-04 03:10:31.597726
- Title: Creating synthetic energy meter data using conditional diffusion and building metadata
- Title(参考訳): 条件拡散と構築メタデータを用いた合成エネルギーメーターデータの作成
- Authors: Chun Fu, Hussain Kazmi, Matias Quintana, Clayton Miller,
- Abstract要約: 本研究では,関連メタデータを用いて高品質な合成エネルギーデータを生成する条件拡散モデルを提案する。
様々な建物や国から1,828個のパワーメーターからなるデータセットを用いて、従来の手法と比較する。
その結果,FID(Frechet Inception Distance)スコアは36%,KL(Kulback-Leibler divergence)は13%低下した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Advances in machine learning and increased computational power have driven progress in energy-related research. However, limited access to private energy data from buildings hinders traditional regression models relying on historical data. While generative models offer a solution, previous studies have primarily focused on short-term generation periods (e.g., daily profiles) and a limited number of meters. Thus, the study proposes a conditional diffusion model for generating high-quality synthetic energy data using relevant metadata. Using a dataset comprising 1,828 power meters from various buildings and countries, this model is compared with traditional methods like Conditional Generative Adversarial Networks (CGAN) and Conditional Variational Auto-Encoders (CVAE). It explicitly handles long-term annual consumption profiles, harnessing metadata such as location, weather, building, and meter type to produce coherent synthetic data that closely resembles real-world energy consumption patterns. The results demonstrate the proposed diffusion model's superior performance, with a 36% reduction in Frechet Inception Distance (FID) score and a 13% decrease in Kullback-Leibler divergence (KL divergence) compared to the following best method. The proposed method successfully generates high-quality energy data through metadata, and its code will be open-sourced, establishing a foundation for a broader array of energy data generation models in the future.
- Abstract(参考訳): 機械学習の進歩と計算能力の増大は、エネルギー関連研究の進展を促している。
しかし、建物からのプライベートエネルギーデータへのアクセスは、歴史的データに依存する従来の回帰モデルを妨げる。
生成モデルは解決策を提供するが、以前の研究では主に短期世代(例えば、日々のプロファイル)と限られた数メートルに焦点が当てられていた。
そこで本研究では,関連メタデータを用いて高品質な合成エネルギーデータを生成する条件拡散モデルを提案する。
様々な建物や国から1,828個のパワーメータからなるデータセットを用いて、このモデルを、条件生成適応ネットワーク(CGAN)や条件変動自動エンコーダ(CVAE)といった従来の手法と比較する。
長期の消費プロファイルを明示的に扱い、位置、天気、建築、メートルタイプといったメタデータを利用して、実世界のエネルギー消費パターンによく似た一貫性のある合成データを生成する。
その結果,拡散モデルの優れた性能を示し,Frechet Inception Distance (FID) スコアは36%,Kullback-Leibler divergence (KL divergence) は13%低下した。
提案手法はメタデータによる高品質なエネルギーデータの生成に成功し,そのコードはオープンソース化され,将来,より広範なエネルギーデータ生成モデルの基礎が確立される。
関連論文リスト
- Synthetic Face Datasets Generation via Latent Space Exploration from Brownian Identity Diffusion [20.352548473293993]
顔認識(FR)モデルは、プライバシと倫理的懸念のある大規模データセットでトレーニングされている。
近年,FRモデルのトレーニングのために,合成データを用いて真のデータを補完あるいは置き換えることが提案されている。
ブラウン力を受ける軟質粒子の物理運動にインスパイアされた新しい手法を導入し, 様々な制約の下で潜在空間の正体をサンプリングする。
これを使って、いくつかの顔データセットを生成し、FRモデルをトレーニングすることでそれらをベンチマークし、我々のメソッドで生成されたデータは、以前のGANベースのデータセットのパフォーマンスを超え、現状と競合するパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2024-04-30T22:32:02Z) - Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)はこの文脈で際立っているのは、深層生成モデルのトレーニングにシミュレーションのデータセットを必要とすることである。
本研究では,複数の観測値が利用可能であり,それらの共有情報を活用してモデルのパラメータをよりよく推測することのできる,背の高いデータ拡張について考察する。
提案手法は,近年盛んに行われているスコアベース拡散文学の成果に基づいて構築され,個々の観測に基づいて学習したスコアネットワークの情報を用いて,高度データ後部分布を推定することができる。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - Towards Theoretical Understandings of Self-Consuming Generative Models [60.98692028151328]
本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。
我々は,この学習規則が将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。
我々は拡散モデルに一般結果を特化し、自己消費ループ内での最適な早期停止の有効性などの微妙な洞察を提供する。
論文 参考訳(メタデータ) (2024-02-19T02:08:09Z) - Reimagining Synthetic Tabular Data Generation through Data-Centric AI: A
Comprehensive Benchmark [56.8042116967334]
合成データは、機械学習モデルのトレーニングの代替となる。
合成データが現実世界データの複雑なニュアンスを反映することを保証することは、難しい作業です。
本稿では,データ中心型AI技術の統合による合成データ生成プロセスのガイドの可能性について検討する。
論文 参考訳(メタデータ) (2023-10-25T20:32:02Z) - Grid Frequency Forecasting in University Campuses using Convolutional
LSTM [0.0]
本稿では,畳み込みニューラルネットワーク(CNN)とLong Short-Term Memory(LSTM)を用いて,グリッド周波数の堅牢な時間予測モデルを確立する。
個々のConvLSTMモデルは、各キャンパスビルの電力消費データに基づいて訓練され、歴史的傾向に基づいてグリッド周波数を予測する。
アンサンブルモデル(英: Ensemble Model)は、建物固有のモデルから洞察を収集し、キャンパス全体の総合的な予測を提供する。
論文 参考訳(メタデータ) (2023-10-24T13:53:51Z) - On the Stability of Iterative Retraining of Generative Models on their own Data [56.153542044045224]
混合データセットに対する生成モデルの訓練が与える影響について検討する。
まず、初期生成モデルがデータ分布を十分に近似する条件下で反復学習の安定性を実証する。
我々は、正規化フローと最先端拡散モデルを繰り返し訓練することにより、合成画像と自然画像の両方に関する我々の理論を実証的に検証する。
論文 参考訳(メタデータ) (2023-09-30T16:41:04Z) - FedWOA: A Federated Learning Model that uses the Whale Optimization
Algorithm for Renewable Energy Prediction [0.0]
本稿では,フェデレート学習モデルについて紹介する。フェデレーション学習モデルは,プロシューマーエネルギーデータに基づいて訓練された局所ニューラルネットワークモデルの重みから,グローバル予測モデルを集約する。
その結果,FedAVGと比較して,MSEでは25%,MAEでは16%の精度でエネルギー予測モデルの精度を効果的に向上できることがわかった。
論文 参考訳(メタデータ) (2023-09-19T05:44:18Z) - Synthetic data, real errors: how (not) to publish and use synthetic data [86.65594304109567]
生成過程が下流MLタスクにどのように影響するかを示す。
本稿では、生成プロセスモデルパラメータの後方分布を近似するために、Deep Generative Ensemble (DGE)を導入する。
論文 参考訳(メタデータ) (2023-05-16T07:30:29Z) - Your Autoregressive Generative Model Can be Better If You Treat It as an
Energy-Based One [83.5162421521224]
本稿では,自己回帰生成モデルの学習のための独自のE-ARM法を提案する。
E-ARMは、よく設計されたエネルギーベースの学習目標を活用する。
我々は、E-ARMを効率的に訓練でき、露光バイアス問題を緩和できることを示した。
論文 参考訳(メタデータ) (2022-06-26T10:58:41Z) - A Comparative Study on Energy Consumption Models for Drones [4.660172505713055]
我々は、その物理的挙動から派生したドローンの5つの最も人気のあるエネルギー消費モデルをベンチマークする。
本稿では,Long Short-Term Memory (LSTM) に基づくディープラーニングアーキテクチャを用いた新しいデータ駆動型エネルギーモデルを提案する。
実験の結果,LSTMに基づくアプローチは,研究中のデータセットに対して,他の数学的モデルよりも容易に優れていることがわかった。
論文 参考訳(メタデータ) (2022-05-30T23:05:32Z) - Variational Autoencoder Generative Adversarial Network for Synthetic
Data Generation in Smart Home [15.995891934245334]
本稿では,変動型自動エンコーダ生成適応ネットワーク(VAE-GAN)をスマートグリッドデータ生成モデルとして提案する。
VAE-GANは、様々な種類のデータ分布を学習し、同じ分布から可塑性サンプルを生成することができる。
実験により,提案した合成データ生成モデルは,バニラGANネットワークより優れていることが示された。
論文 参考訳(メタデータ) (2022-01-19T02:30:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。