論文の概要: A Meta-Learning Approach for Multi-Objective Reinforcement Learning in Sustainable Home Environments
- arxiv url: http://arxiv.org/abs/2407.11489v1
- Date: Tue, 16 Jul 2024 08:23:20 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-17 16:02:34.107821
- Title: A Meta-Learning Approach for Multi-Objective Reinforcement Learning in Sustainable Home Environments
- Title(参考訳): 持続可能な家庭環境における多目的強化学習のためのメタラーニングアプローチ
- Authors: Junlin Lu, Patrick Mannion, Karl Mason,
- Abstract要約: 我々はメタラーニングパラダイムを用いて最先端のMORLアルゴリズムを拡張した。
環境環境変化を検出するために,自動エンコーダ(AE)に基づく教師なしの手法を用いる。
本研究は,住宅機器スケジューリングにおけるMORLの適用性を評価し,エネルギー管理におけるメタラーニングの有効性を裏付けるものである。
- 参考スコア(独自算出の注目度): 2.9845592719739127
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Effective residential appliance scheduling is crucial for sustainable living. While multi-objective reinforcement learning (MORL) has proven effective in balancing user preferences in appliance scheduling, traditional MORL struggles with limited data in non-stationary residential settings characterized by renewable generation variations. Significant context shifts that can invalidate previously learned policies. To address these challenges, we extend state-of-the-art MORL algorithms with the meta-learning paradigm, enabling rapid, few-shot adaptation to shifting contexts. Additionally, we employ an auto-encoder (AE)-based unsupervised method to detect environment context changes. We have also developed a residential energy environment to evaluate our method using real-world data from London residential settings. This study not only assesses the application of MORL in residential appliance scheduling but also underscores the effectiveness of meta-learning in energy management. Our top-performing method significantly surpasses the best baseline, while the trained model saves 3.28% on electricity bills, a 2.74% increase in user comfort, and a 5.9% improvement in expected utility. Additionally, it reduces the sparsity of solutions by 62.44%. Remarkably, these gains were accomplished using 96.71% less training data and 61.1% fewer training steps.
- Abstract(参考訳): 効果的な家電機器のスケジューリングは、持続可能な生活に不可欠である。
多目的強化学習(MORL)は、アプライアンススケジューリングにおいてユーザの嗜好のバランスをとるのに有効であることが証明されているが、従来のMORLは、再生可能生成のバリエーションを特徴とする非定常住宅環境において、限られたデータを扱う。
学習済みのポリシーを無効にできる重要なコンテキストシフト。
これらの課題に対処するため、我々はメタラーニングパラダイムを用いて最先端のMORLアルゴリズムを拡張し、シフトするコンテキストへの高速で少数ショットの適応を可能にする。
さらに,環境環境変化を検出するために,自動エンコーダ(AE)に基づく教師なしの手法を用いる。
また,ロンドンの住宅環境から得られた実世界データを用いて,住宅エネルギー環境の評価を行った。
本研究は,住宅機器スケジューリングにおけるMORLの適用性を評価するだけでなく,エネルギー管理におけるメタラーニングの有効性を裏付けるものである。
我々のトップパフォーマンス手法は最高のベースラインをはるかに上回り、訓練されたモデルは電気料金の3.28%を節約し、2.74%のユーザー快適化と5.9%の実用性向上を実現している。
さらに、ソリューションの幅を62.44%削減する。
注目すべきは、これらのゲインは96.71%のトレーニングデータと61.1%のトレーニングステップを使用して達成されたことである。
関連論文リスト
- Unlearning with Control: Assessing Real-world Utility for Large Language Model Unlearning [97.2995389188179]
最近の研究は、勾配上昇(GA)を通した大規模言語モデル(LLM)の未学習にアプローチし始めている。
その単純さと効率性にもかかわらず、我々はGAベースの手法が過剰な未学習の傾向に直面することを示唆している。
過剰な未学習の度合いを制御できるいくつかの制御手法を提案する。
論文 参考訳(メタデータ) (2024-06-13T14:41:00Z) - Green AI in Action: Strategic Model Selection for Ensembles in Production [2.464194460689648]
複数のモデルからの予測を1つの予測に組み合わせたアンサンブル学習は、累積エネルギー消費によってこの問題を強化する。
本稿では,AI アンサンブルシステムにおいて,AI モデルの精度とエネルギー消費のバランスをとることの課題に対処する,モデル選択のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2024-05-21T18:57:43Z) - Sparse Low-rank Adaptation of Pre-trained Language Models [79.74094517030035]
本稿では,適応過程における固有ランクの動的調整を可能にする疎低ランク適応(SoRA)を提案する。
提案手法は,LoRAを高いランクで初期化すると同時に,一時的に増大するパラメータを効率的に利用することにより,LoRAの表現力を向上する。
実験の結果,SoRAは70%の保持パラメータと70%のトレーニング時間でも,他のベースラインよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-11-20T11:56:25Z) - Adaptive Resource Allocation for Virtualized Base Stations in O-RAN with
Online Learning [60.17407932691429]
基地局(vBS)を備えたオープンラジオアクセスネットワークシステムは、柔軟性の向上、コスト削減、ベンダーの多様性、相互運用性のメリットを提供する。
本研究では,予期せぬ「混み合う」環境下であっても,効率的なスループットとvBSエネルギー消費のバランスをとるオンライン学習アルゴリズムを提案する。
提案手法は, 課題のある環境においても, 平均最適性ギャップをゼロにすることで, サブ線形後悔を実現する。
論文 参考訳(メタデータ) (2023-09-04T17:30:21Z) - Energy Efficient Deep Multi-Label ON/OFF Classification of Low Frequency Metered Home Appliances [0.16777183511743468]
非侵入負荷監視(Non-Inrusive Load Monitoring、NILM)は、単一計測点からアプライアンスレベルのデータを取得するプロセスである。
本稿では,NILMのマルチラベル分類を改良した新しいDLモデルを提案する。
最先端モデルと比較して、提案モデルではエネルギー消費を23%以上削減している。
論文 参考訳(メタデータ) (2023-07-18T13:23:23Z) - Continually learning out-of-distribution spatiotemporal data for robust
energy forecasting [10.47725405370935]
エネルギー利用は持続可能性の向上と廃棄物の削減に不可欠である。
異常期間におけるエネルギー利用予測は、占有パターンの変化とエネルギー利用行動のために困難である。
オンライン学習はこの課題に対する有望な解決策として浮上した。
提案手法の有効性を検証するために, 6棟の建物からのデータを用いて実験を行った。
論文 参考訳(メタデータ) (2023-06-10T09:12:10Z) - Towards Sustainable Deep Learning for Wireless Fingerprinting
Localization [0.541530201129053]
位置情報ベースのサービスは、新しい無線インフラや新しいビジネスプロセスの一部になっている。
深層学習(DL)人工知能手法は, 広範囲な屋内無線計測データに基づいて, 無線指紋認証のローカライゼーションにおいて極めてよく機能する。
複雑さが増すにつれて、これらの手法は計算的に非常に集中的になり、エネルギーは空腹になる。
そこで本研究では,室内のローカライゼーションのための新しいDLベースのアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-01-22T15:13:44Z) - Learning to Continuously Optimize Wireless Resource in a Dynamic
Environment: A Bilevel Optimization Perspective [52.497514255040514]
この研究は、データ駆動メソッドが動的環境でリソース割り当て戦略を継続的に学び、最適化することを可能にする新しいアプローチを開発しています。
学習モデルが新たなエピソードに段階的に適応できるように、連続学習の概念を無線システム設計に組み込むことを提案する。
我々の設計は、異なるデータサンプルにまたがる公平性を保証する、新しい二段階最適化定式化に基づいている。
論文 参考訳(メタデータ) (2021-05-03T07:23:39Z) - Learning to Continuously Optimize Wireless Resource In Episodically
Dynamic Environment [55.91291559442884]
この研究は、データ駆動型手法が動的環境で継続的に学習し、最適化できる方法論を開発する。
本稿では,無線システム学習のモデリングプロセスに連続学習の概念を構築することを提案する。
我々の設計は、異なるデータサンプル間で「一定の公正性を保証する」新しいmin-maxの定式化に基づいている。
論文 参考訳(メタデータ) (2020-11-16T08:24:34Z) - A Relearning Approach to Reinforcement Learning for Control of Smart
Buildings [1.8799681615947088]
本稿では、漸進的深層学習(RL)を用いた制御方針の連続的再学習が、非定常過程におけるポリシー学習を改善することを実証する。
我々は,全体の快適さを犠牲にすることなく,建築エネルギーを同時に削減するインクリメンタルRL技術を開発した。
論文 参考訳(メタデータ) (2020-08-04T23:31:05Z) - How to Train Your Energy-Based Model for Regression [107.54411649704194]
近年,コンピュータビジョンにおいてエネルギーベースモデル (EBM) が普及している。
近年の作業では、回帰タスクにもESMを適用し、オブジェクト検出と視覚的トラッキングにおける最先端のパフォーマンスを実現している。
最高のレグレッションパフォーマンスのためにEBMをどのようにトレーニングするかは、十分に研究された問題ではありません。
論文 参考訳(メタデータ) (2020-05-04T17:55:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。