論文の概要: SmartMeterFM: Unifying Smart Meter Data Generative Tasks Using Flow Matching Models
- arxiv url: http://arxiv.org/abs/2601.21706v1
- Date: Thu, 29 Jan 2026 13:35:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-30 16:22:49.853518
- Title: SmartMeterFM: Unifying Smart Meter Data Generative Tasks Using Flow Matching Models
- Title(参考訳): SmartMeterFM:フローマッチングモデルを用いたスマートメーターデータ生成タスクの統合
- Authors: Nan Lin, Yanbo Wang, Jacco Heres, Peter Palensky, Pedro P. Vergara,
- Abstract要約: 本研究では,多種多様なスマートメーターデータ生成タスクを条件生成のために訓練された単一モデルで統一する手法を提案する。
異なる生成タスクを別の部分的データ観測形式として見ることにより、インパルス化や超解像化といったタスクを単一モデルで統一する。
- 参考スコア(独自算出の注目度): 5.581165920380358
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Smart meter data is the foundation for planning and operating the distribution network. Unfortunately, such data are not always available due to privacy regulations. Meanwhile, the collected data may be corrupted due to sensor or transmission failure, or it may not have sufficient resolution for downstream tasks. A wide range of generative tasks is formulated to address these issues, including synthetic data generation, missing data imputation, and super-resolution. Despite the success of machine learning models on these tasks, dedicated models need to be designed and trained for each task, leading to redundancy and inefficiency. In this paper, by recognizing the powerful modeling capability of flow matching models, we propose a new approach to unify diverse smart meter data generative tasks with a single model trained for conditional generation. The proposed flow matching models are trained to generate challenging, high-dimensional time series data, specifically monthly smart meter data at a 15 min resolution. By viewing different generative tasks as distinct forms of partial data observations and injecting them into the generation process, we unify tasks such as imputation and super-resolution with a single model, eliminating the need for re-training. The data generated by our model not only are consistent with the given observations but also remain realistic, showing better performance against interpolation and other machine learning based baselines dedicated to the tasks.
- Abstract(参考訳): スマートメーターデータは、配信ネットワークの計画と運用の基礎となる。
残念ながら、プライバシー規制のため、このようなデータは必ずしも利用できない。
一方、収集されたデータは、センサーや送信障害によって破損する可能性があるし、下流のタスクに十分な解像度を持っていないかもしれない。
合成データ生成、欠落データ計算、超解像など、これらの問題に対処するために、幅広い生成タスクが定式化されている。
これらのタスクにおける機械学習モデルの成功にもかかわらず、各タスクのために専用のモデルを設計、訓練する必要があるため、冗長性と非効率性につながる。
本稿では,フローマッチングモデルの強力なモデリング能力を認識することにより,多種多様なスマートメーターデータ生成タスクを条件生成のために訓練された単一モデルで統一する手法を提案する。
提案したフローマッチングモデルを用いて,挑戦的で高次元の時系列データ,特に月毎のスマートメーターデータを15分間の解像度で生成する。
異なる生成タスクを部分的なデータ観察の異なる形態と見なして生成プロセスに注入することにより、インパルス化や超解像化といったタスクを単一モデルに統合し、再学習の必要性をなくす。
我々のモデルが生成したデータは、与えられた観測結果と一致しているだけでなく、リアルなままであり、補間やその他のタスク専用の機械学習ベースのベースラインに対するより良いパフォーマンスを示している。
関連論文リスト
- SDQM: Synthetic Data Quality Metric for Object Detection Dataset Evaluation [3.2150327776278576]
本稿では,オブジェクト検出タスクのデータ品質を評価するために,Synthetic dataset Quality Metric (SDQM)を提案する。
実験の結果,SDQMは,主物体検出モデルYOLOv11の平均精度 (mAP) と強い相関を示した。
データセットの品質向上のための実用的な洞察を提供し、コストのかかる反復的なトレーニングの必要性を最小限にする。
論文 参考訳(メタデータ) (2025-10-08T03:01:26Z) - Data Fusion of Deep Learned Molecular Embeddings for Property Prediction [41.99844472131922]
ディープラーニングのようなデータ駆動型アプローチは、極めて精度と効率のよい材料特性の予測モデルをもたらす可能性がある。
予測を改善するために、トランスファーラーニングやマルチタスクラーニングといった技術が用いられている。
標準マルチタスクモデルは、弱い相関特性を持つスパースデータセットで訓練された場合、性能が劣る傾向にある。
本手法は、小分子の量子化学データのベンチマークデータセットと、文献および我々の量子化学および熱化学計算から収集した実験データのスパースデータセットに広く用いられている。
論文 参考訳(メタデータ) (2025-04-09T21:40:15Z) - Forewarned is Forearmed: Leveraging LLMs for Data Synthesis through Failure-Inducing Exploration [90.41908331897639]
大規模言語モデル(LLM)は、多種多様な高品質なタスク特化データのトレーニングの恩恵を受けている。
本稿では,効果的なトレーニングサンプルを自動生成する新しい手法であるReverseGenを提案する。
論文 参考訳(メタデータ) (2024-10-22T06:43:28Z) - Certain and Approximately Certain Models for Statistical Learning [4.318959672085627]
特定のトレーニングデータや対象モデルに対して,不足値を持つデータから,正確なモデルを直接学習することが可能であることを示す。
我々は、理論的に保証された効率的なアルゴリズムを構築し、この必要条件を確認し、計算が不要な場合に正確なモデルを返す。
論文 参考訳(メタデータ) (2024-02-27T22:49:33Z) - Task-Distributionally Robust Data-Free Meta-Learning [99.56612787882334]
Data-Free Meta-Learning (DFML)は、複数の事前学習モデルを活用することで、独自のトレーニングデータを必要とせずに、新しいタスクを効率的に学習することを目的としている。
TDS(Task-Distribution Shift)とTDC(Task-Distribution Corruption)の2つの大きな課題を初めて明らかにした。
論文 参考訳(メタデータ) (2023-11-23T15:46:54Z) - Learning Defect Prediction from Unrealistic Data [57.53586547895278]
事前訓練されたコードのモデルは、コード理解と生成タスクに人気がある。
このようなモデルは大きい傾向があり、訓練データの総量を必要とする。
人工的に注入されたバグのある関数など、はるかに大きくてもより現実的なデータセットを持つモデルをトレーニングすることが一般的になった。
このようなデータで訓練されたモデルは、実際のプログラムでは性能が劣りながら、同様のデータでのみうまく機能する傾向にある。
論文 参考訳(メタデータ) (2023-11-02T01:51:43Z) - Diffusion Model is an Effective Planner and Data Synthesizer for
Multi-Task Reinforcement Learning [101.66860222415512]
Multi-Task Diffusion Model (textscMTDiff) は、トランスフォーマーのバックボーンを組み込んだ拡散に基づく手法であり、生成計画とデータ合成のための素早い学習を行う。
生成計画において、textscMTDiffはMeta-World上の50のタスクとMaze2D上の8のマップで最先端のアルゴリズムより優れています。
論文 参考訳(メタデータ) (2023-05-29T05:20:38Z) - Synthetic Model Combination: An Instance-wise Approach to Unsupervised
Ensemble Learning [92.89846887298852]
ラベル付きデータのトレーニングセットから学ぶ機会のない、新しいテストデータに対する予測を検討する。
専門家モデルのセットと予測へのアクセスと、トレーニングに使用するデータセットに関する制限された情報を提供すること。
論文 参考訳(メタデータ) (2022-10-11T10:20:31Z) - Deep convolutional generative adversarial networks for traffic data
imputation encoding time series as images [7.053891669775769]
我々は,GAN(Generative Adversarial Network)に基づく交通センサデータ計算フレームワーク(TGAN)を開発した。
本研究では,GASF(Gramian Angular Summation Field)と呼ばれる新しい時間依存符号化手法を開発した。
本研究は,提案モデルにより,平均絶対誤差 (MAE) とルート平均正方形誤差 (RMSE) をベンチマークデータセットの最先端モデルと比較することにより,トラフィックデータ計算精度を著しく向上させることができることを示す。
論文 参考訳(メタデータ) (2020-05-05T19:14:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。