論文の概要: Clustering Enabled Few-Shot Load Forecasting
- arxiv url: http://arxiv.org/abs/2202.07939v1
- Date: Wed, 16 Feb 2022 09:09:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-17 16:20:37.654651
- Title: Clustering Enabled Few-Shot Load Forecasting
- Title(参考訳): Few-Shot負荷予測を可能にするクラスタリング
- Authors: Qiyuan Wang, Zhihui Chen, Chenye Wu
- Abstract要約: エネルギー消費のわずかなショット(データポイント)を観察することで,新規利用者の負荷予測を考察する。
限られたサンプルが時間特性を利用するには不十分であるため、この作業は困難である。
本稿では,既存ユーザの履歴負荷プロファイルデータを有効クラスタリングに利用することを提案する。
- 参考スコア(独自算出の注目度): 2.0810096547938164
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While the advanced machine learning algorithms are effective in load
forecasting, they often suffer from low data utilization, and hence their
superior performance relies on massive datasets. This motivates us to design
machine learning algorithms with improved data utilization. Specifically, we
consider the load forecasting for a new user in the system by observing only
few shots (data points) of its energy consumption. This task is challenging
since the limited samples are insufficient to exploit the temporal
characteristics, essential for load forecasting. Nonetheless, we notice that
there are not too many temporal characteristics for residential loads due to
the limited kinds of human lifestyle. Hence, we propose to utilize the
historical load profile data from existing users to conduct effective
clustering, which mitigates the challenges brought by the limited samples.
Specifically, we first design a feature extraction clustering method for
categorizing historical data. Then, inheriting the prior knowledge from the
clustering results, we propose a two-phase Long Short Term Memory (LSTM) model
to conduct load forecasting for new users. The proposed method outperforms the
traditional LSTM model, especially when the training sample size fails to cover
a whole period (i.e., 24 hours in our task). Extensive case studies on two
real-world datasets and one synthetic dataset verify the effectiveness and
efficiency of our method.
- Abstract(参考訳): 高度な機械学習アルゴリズムは負荷予測に有効であるが、しばしばデータ利用の低さに悩まされるため、その優れたパフォーマンスは大量のデータセットに依存する。
これは、データ利用を改善する機械学習アルゴリズムの設計を動機付けます。
具体的には、エネルギー消費のわずかなショット(データポイント)を観測することで、システム内の新規利用者の負荷予測を考察する。
限られたサンプルでは,負荷予測に不可欠な時間特性を活用できないため,この課題は困難である。
しかし, 生活習慣が限られているため, 生活負荷の時間的特性がそれほど多くないことが判明した。
そこで本研究では,既存のユーザからの履歴的負荷プロファイルデータを有効クラスタリングに利用し,限られたサンプルによる課題を軽減することを提案する。
具体的には,まず履歴データを分類する特徴抽出クラスタリング手法を考案する。
そして,クラスタリング結果から先行知識を継承し,新たなユーザに対する負荷予測を行うための2相長短期メモリ(LSTM)モデルを提案する。
提案手法は従来のLSTMモデルよりも優れており、特にトレーニングサンプルサイズが全期間(例えばタスクの24時間)をカバーできない場合には特に優れる。
2つの実世界のデータセットと1つの合成データセットに関する広範なケーススタディにより、本手法の有効性と効率が検証された。
関連論文リスト
- Beyond Data Scarcity: A Frequency-Driven Framework for Zero-Shot Forecasting [15.431513584239047]
時系列予測は多くの現実世界の応用において重要である。
従来の予測技術は、データが不足しているか、全く利用できない場合に苦労する。
近年の進歩は、このようなタスクに大規模な基礎モデルを活用することが多い。
論文 参考訳(メタデータ) (2024-11-24T07:44:39Z) - A CLIP-Powered Framework for Robust and Generalizable Data Selection [51.46695086779598]
実世界のデータセットは、しばしば冗長でノイズの多いデータを含み、トレーニング効率とモデルパフォーマンスに悪影響を及ぼす。
データ選択は、データセット全体から最も代表的なサンプルを特定することを約束している。
より堅牢で一般化可能なサンプル選択にマルチモーダル情報を活用するCLIPを利用した新しいデータ選択フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-15T03:00:58Z) - Few-Shot Load Forecasting Under Data Scarcity in Smart Grids: A Meta-Learning Approach [0.18641315013048293]
本稿では,短期負荷予測のためのモデルに依存しないメタ学習アルゴリズムを提案する。
提案手法は,任意の長さの未知の負荷時間列に迅速に適応し,一般化することができる。
提案手法は,実世界の消費者の歴史的負荷消費データのデータセットを用いて評価する。
論文 参考訳(メタデータ) (2024-06-09T18:59:08Z) - Applying Fine-Tuned LLMs for Reducing Data Needs in Load Profile Analysis [9.679453060210978]
本稿では、負荷プロファイル解析におけるデータ要求を最小限に抑えるために、LLM(en: Fine-tuned Large Language Models)を利用する新しい手法を提案する。
2段階の微調整戦略が提案され、データ復元作業の欠如に対して事前訓練されたLLMを適用する。
BERT-PIN などの最先端モデルに匹敵する性能を達成し,その精度向上のための微調整モデルの有効性を実証する。
論文 参考訳(メタデータ) (2024-06-02T23:18:11Z) - Computationally and Memory-Efficient Robust Predictive Analytics Using Big Data [0.0]
本研究では、データ不確実性、ストレージ制限、ビッグデータを用いた予測データ駆動モデリングの課題をナビゲートする。
本稿では,ロバスト主成分分析(RPCA)を有効ノイズ低減と外乱除去に利用し,最適センサ配置(OSP)を効率的なデータ圧縮・記憶に活用する。
論文 参考訳(メタデータ) (2024-03-27T22:39:08Z) - Pushing the Limits of Pre-training for Time Series Forecasting in the
CloudOps Domain [54.67888148566323]
クラウドオペレーションドメインから,大規模時系列予測データセットを3つ導入する。
強力なゼロショットベースラインであり、モデルとデータセットサイズの両方において、さらなるスケーリングの恩恵を受けています。
これらのデータセットと結果を取得することは、古典的および深層学習のベースラインを事前訓練された方法と比較した総合的なベンチマーク結果の集合である。
論文 参考訳(メタデータ) (2023-10-08T08:09:51Z) - Continual Learning in Predictive Autoscaling [17.438074717702726]
予測オートスケーリングは、動的クラウド環境におけるサービスレベルの目標(SLO)を保証するために、サーバのワークロードを予測し、事前にリソースを準備するために使用される。
本稿では,リプレイに基づく連続学習手法,すなわち密度ベースのメモリ選択とHintベースのネットワーク学習モデルを提案する。
提案手法は、メモリ容量と予測精度の観点から、最先端の連続学習法より優れている。
論文 参考訳(メタデータ) (2023-07-29T09:29:09Z) - To Repeat or Not To Repeat: Insights from Scaling LLM under Token-Crisis [50.31589712761807]
大規模言語モデル(LLM)は、事前トレーニング中にトークンに悩まされていることで知られており、Web上の高品質なテキストデータは、LSMのスケーリング制限に近づいている。
本研究では,事前学習データの再学習の結果について検討し,モデルが過度に適合する可能性が示唆された。
第2に, マルチエポック劣化の原因となる要因について検討し, データセットのサイズ, モデルパラメータ, トレーニング目標など, 重要な要因について検討した。
論文 参考訳(メタデータ) (2023-05-22T17:02:15Z) - Re-thinking Data Availablity Attacks Against Deep Neural Networks [53.64624167867274]
本稿では、未学習例の概念を再検討し、既存のロバストな誤り最小化ノイズが不正確な最適化目標であることを示す。
本稿では,計算時間要件の低減による保護性能の向上を図った新しい最適化パラダイムを提案する。
論文 参考訳(メタデータ) (2023-05-18T04:03:51Z) - Prediction-Oriented Bayesian Active Learning [51.426960808684655]
予測情報ゲイン(EPIG)は、パラメータではなく予測空間における情報ゲインを測定する。
EPIGは、さまざまなデータセットやモデルにわたるBALDと比較して、予測パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-04-17T10:59:57Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。