論文の概要: Inferring Preferences from Demonstrations in Multi-Objective Residential
Energy Management
- arxiv url: http://arxiv.org/abs/2401.07722v1
- Date: Mon, 15 Jan 2024 14:36:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-17 17:03:15.156937
- Title: Inferring Preferences from Demonstrations in Multi-Objective Residential
Energy Management
- Title(参考訳): 多目的住宅エネルギー管理における実演から選好を推測する
- Authors: Junlin Lu, Patrick Mannion, Karl Mason
- Abstract要約: DemoPI(Demonstration-based preference inference)は、この問題を軽減するための有望なアプローチである。
エネルギー顧客の振る舞いと価値を理解することは、選好推論が使えるシナリオの例です。
本研究では,多目的住宅エネルギー消費設定において,動的重みに基づく選好推定法(DWPI)を適用した。
- 参考スコア(独自算出の注目度): 3.354345524478023
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: It is often challenging for a user to articulate their preferences accurately
in multi-objective decision-making problems. Demonstration-based preference
inference (DemoPI) is a promising approach to mitigate this problem.
Understanding the behaviours and values of energy customers is an example of a
scenario where preference inference can be used to gain insights into the
values of energy customers with multiple objectives, e.g. cost and comfort. In
this work, we applied the state-of-art DemoPI method, i.e., the dynamic
weight-based preference inference (DWPI) algorithm in a multi-objective
residential energy consumption setting to infer preferences from energy
consumption demonstrations by simulated users following a rule-based approach.
According to our experimental results, the DWPI model achieves accurate
demonstration-based preference inferring in three scenarios. These advancements
enhance the usability and effectiveness of multi-objective reinforcement
learning (MORL) in energy management, enabling more intuitive and user-friendly
preference specifications, and opening the door for DWPI to be applied in
real-world settings.
- Abstract(参考訳): 多目的意思決定問題において、ユーザが自分の好みを正確に表現することはしばしば困難である。
DemoPI(Demonstration-based preference inference)はこの問題を緩和する有望なアプローチである。
エネルギー顧客の行動と価値を理解することは、例えばコストや快適さなど、複数の目的を持つエネルギー顧客の価値についての洞察を得るために、選好推論を使用するシナリオの例である。
本研究では,多目的住宅エネルギー消費設定における動的重みに基づく選好推定(DWPI)アルゴリズムを,ルールベースアプローチによるシミュレーションユーザによるエネルギー消費実証から選好を推測するために,最先端のDemoPI手法を適用した。
実験結果によると,dwpiモデルは3つのシナリオで正確な実演に基づく選好を実現する。
これらの進歩は、エネルギー管理における多目的強化学習(MORL)の有用性と有効性を高め、より直感的でユーザフレンドリな嗜好仕様を可能にし、DWPIを現実世界の環境に適用するための扉を開く。
関連論文リスト
- Enhancing User Intent for Recommendation Systems via Large Language Models [0.0]
DUIPはLSTMネットワークとLLM(Large Language Models)を組み合わせた新しいフレームワークで、ユーザの意図を動的に把握し、パーソナライズされたアイテムレコメンデーションを生成する。
この結果から,DUIPは次世代レコメンデーションシステムにとって有望なアプローチであり,クロスモーダルレコメンデーションとスケーラビリティのさらなる向上の可能性が示唆された。
論文 参考訳(メタデータ) (2025-01-18T20:35:03Z) - Few-shot Steerable Alignment: Adapting Rewards and LLM Policies with Neural Processes [50.544186914115045]
大きな言語モデル(LLM)は、日々のアプリケーションにますます組み込まれています。
個人ユーザの多様な嗜好との整合性を確保することは、重要な課題となっている。
数発のステアライメントのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-18T16:14:59Z) - Normalizing Energy Consumption for Hardware-Independent Evaluation [9.658615045493734]
本稿では,異なるハードウェアプラットフォーム間でのエネルギー消費の正規化手法を提案する。
提案手法は,基準点数,回帰値の種類,および計算量を含めることが正規化過程に大きく影響を与えることを示す。
論文 参考訳(メタデータ) (2024-09-09T13:38:00Z) - Intuition-aware Mixture-of-Rank-1-Experts for Parameter Efficient Finetuning [50.73666458313015]
大規模言語モデル(LLM)はマルチメディアアプリケーションで複数のタスクを実行する上で大きな可能性を証明している。
MoEは、効率的なタスクデカップリングのためのスパースアーキテクチャによる有望なソリューションとして登場した。
Intuition-MoR1Eは14のパブリックデータセットで優れた効率と2.15%の全体的な精度向上を実現している。
論文 参考訳(メタデータ) (2024-04-13T12:14:58Z) - Large Language Models for Intent-Driven Session Recommendations [34.64421003286209]
大規模言語モデル(LLM)の高度な推論機能を活用した新しいISR手法を提案する。
本稿では,プロンプトを反復的に自己表現し,調整するイノベーティブなプロンプト最適化機構を提案する。
この新たなパラダイムは、LLMに対して、さまざまなユーザ意図をセマンティックレベルで識別する権限を与え、より正確で解釈可能なセッションレコメンデーションをもたらす。
論文 参考訳(メタデータ) (2023-12-07T02:25:14Z) - Interactive Hyperparameter Optimization in Multi-Objective Problems via
Preference Learning [65.51668094117802]
我々は多目的機械学習(ML)に適した人間中心型対話型HPO手法を提案する。
ユーザが自分のニーズに最も適した指標を推測する代わりに、私たちのアプローチは自動的に適切な指標を学習します。
論文 参考訳(メタデータ) (2023-09-07T09:22:05Z) - Multi-objective Deep Reinforcement Learning for Mobile Edge Computing [11.966938107719903]
モバイルエッジコンピューティング(MEC)は、遅延やエネルギー消費など、さまざまなパフォーマンス指標を優先する次世代のモバイルネットワークアプリケーションに不可欠である。
本研究では,複数のエッジを持つMECにおいて,長期エネルギー消費と送信遅延を最小限に抑えるために,多目的オフロード問題を定式化する。
我々は,MECシステムにおいて,複数のエッジの機能を構築するためのよく設計された状態符号化手法を導入し,遅延とエネルギー消費のユーティリティを正確に計算する洗練された報酬関数を提案する。
論文 参考訳(メタデータ) (2023-07-05T16:36:42Z) - Inferring Preferences from Demonstrations in Multi-objective
Reinforcement Learning: A Dynamic Weight-based Approach [0.0]
多目的意思決定において、選好推論は、異なる目的のために意思決定者の選好を推測する過程である。
本研究では,多目的意思決定問題に作用するエージェントの選好を推測する動的重みに基づく選好推論アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-27T11:55:07Z) - Latent User Intent Modeling for Sequential Recommenders [92.66888409973495]
逐次リコメンデータモデルは、プラットフォーム上での氏のインタラクション履歴に基づいて、ユーザが次に対話する可能性のあるアイテムを予測することを学習する。
しかし、ほとんどのシーケンシャルなレコメンデータは、ユーザの意図に対する高いレベルの理解を欠いている。
したがって、インテントモデリングはユーザー理解と長期ユーザーエクスペリエンスの最適化に不可欠である。
論文 参考訳(メタデータ) (2022-11-17T19:00:24Z) - Probabilistic and Variational Recommendation Denoising [56.879165033014026]
暗黙のフィードバックから学ぶことは、推奨システムの適用において最も一般的なケースの1つである。
本稿では,暗黙のフィードバックに対する確率的・変動的推薦を提案する。
提案したDPIとDVAEを4つの最先端レコメンデーションモデルに適用し、3つのデータセットで実験を行う。
論文 参考訳(メタデータ) (2021-05-20T08:59:44Z) - Learning to Continuously Optimize Wireless Resource In Episodically
Dynamic Environment [55.91291559442884]
この研究は、データ駆動型手法が動的環境で継続的に学習し、最適化できる方法論を開発する。
本稿では,無線システム学習のモデリングプロセスに連続学習の概念を構築することを提案する。
我々の設計は、異なるデータサンプル間で「一定の公正性を保証する」新しいmin-maxの定式化に基づいている。
論文 参考訳(メタデータ) (2020-11-16T08:24:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。