Fugu-MT 論文翻訳(概要): Inferring Preferences from Demonstrations in Multi-Objective Residential Energy Management

論文の概要: Inferring Preferences from Demonstrations in Multi-Objective Residential Energy Management

arxiv url: http://arxiv.org/abs/2401.07722v1
Date: Mon, 15 Jan 2024 14:36:59 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-17 17:03:15.156937
Title: Inferring Preferences from Demonstrations in Multi-Objective Residential Energy Management
Title（参考訳）: 多目的住宅エネルギー管理における実演から選好を推測する
Authors: Junlin Lu, Patrick Mannion, Karl Mason
Abstract要約: DemoPI(Demonstration-based preference inference)は、この問題を軽減するための有望なアプローチである。エネルギー顧客の振る舞いと価値を理解することは、選好推論が使えるシナリオの例です。本研究では,多目的住宅エネルギー消費設定において,動的重みに基づく選好推定法(DWPI)を適用した。
参考スコア（独自算出の注目度）: 3.354345524478023
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: It is often challenging for a user to articulate their preferences accurately in multi-objective decision-making problems. Demonstration-based preference inference (DemoPI) is a promising approach to mitigate this problem. Understanding the behaviours and values of energy customers is an example of a scenario where preference inference can be used to gain insights into the values of energy customers with multiple objectives, e.g. cost and comfort. In this work, we applied the state-of-art DemoPI method, i.e., the dynamic weight-based preference inference (DWPI) algorithm in a multi-objective residential energy consumption setting to infer preferences from energy consumption demonstrations by simulated users following a rule-based approach. According to our experimental results, the DWPI model achieves accurate demonstration-based preference inferring in three scenarios. These advancements enhance the usability and effectiveness of multi-objective reinforcement learning (MORL) in energy management, enabling more intuitive and user-friendly preference specifications, and opening the door for DWPI to be applied in real-world settings.
Abstract（参考訳）: 多目的意思決定問題において、ユーザが自分の好みを正確に表現することはしばしば困難である。 DemoPI(Demonstration-based preference inference)はこの問題を緩和する有望なアプローチである。エネルギー顧客の行動と価値を理解することは、例えばコストや快適さなど、複数の目的を持つエネルギー顧客の価値についての洞察を得るために、選好推論を使用するシナリオの例である。本研究では,多目的住宅エネルギー消費設定における動的重みに基づく選好推定(DWPI)アルゴリズムを,ルールベースアプローチによるシミュレーションユーザによるエネルギー消費実証から選好を推測するために,最先端のDemoPI手法を適用した。実験結果によると,dwpiモデルは3つのシナリオで正確な実演に基づく選好を実現する。これらの進歩は、エネルギー管理における多目的強化学習(MORL)の有用性と有効性を高め、より直感的でユーザフレンドリな嗜好仕様を可能にし、DWPIを現実世界の環境に適用するための扉を開く。

関連論文リスト

Pimp My LLM: Leveraging Variability Modeling to Tune Inference Hyperparameters [0.3186130813218338]
大規模言語モデル(LLM)は、幅広いタスクでますます使われています。彼らの相当な計算要求は、トレーニングと推論の両方のエネルギー効率と持続可能性に関する懸念を提起する。最近の研究は、最適化手法を探求し、構成選択がエネルギー消費にどのように影響するかを分析している。
論文参考訳（メタデータ） (2026-02-06T16:18:22Z)
Why Steering Works: Toward a Unified View of Language Model Parameter Dynamics [81.80010043113445]
局所的な微調整、LoRAに基づく適応、およびアクティベーションに基づく介入を分離して研究する。制御信号によって誘導される動的ウェイト更新として、これらの介入をフレーム化する統一的な視点を示す。提案手法では,選択と効用との間に一貫したトレードオフが観測される。
論文参考訳（メタデータ） (2026-02-02T17:04:36Z)
Improving Multimodal Sentiment Analysis via Modality Optimization and Dynamic Primary Modality Selection [54.10252086842123]
マルチモーダル・センティメント・アナリティクス(MSA)は、ビデオにおける言語、音響、視覚データから感情を予測することを目的としている。本稿では,モーダリティ最適化と動的一次モーダリティ選択フレームワーク(MODS)を提案する。 4つのベンチマークデータセットの実験では、MODSが最先端の手法より優れていることが示されている。
論文参考訳（メタデータ） (2025-11-09T11:13:32Z)
PersonaAgent: When Large Language Model Agents Meet Personalization at Test Time [87.99027488664282]
PersonaAgentは、汎用的なパーソナライゼーションタスクに対処するために設計されたフレームワークである。パーソナライズされたメモリモジュールとパーソナライズされたアクションモジュールを統合する。テストタイムのユーザ嗜好アライメント戦略は、リアルタイムのユーザの嗜好アライメントを保証する。
論文参考訳（メタデータ） (2025-06-06T17:29:49Z)
Integration of Multi-Mode Preference into Home Energy Management System Using Deep Reinforcement Learning [0.0]
Home Energy Management Systems(HEMS)は、スマートホームエコシステムにおいて重要なツールとして登場した。本稿では,動的でコンシューマ定義の嗜好に基づいた最適化を念頭に設計した多モードDeep Reinforcement LearningベースのHEMSフレームワークを提案する。提案手法は,異なる選好モードにおけるエネルギー消費を最適化する上で,優れた性能を発揮することを示す。
論文参考訳（メタデータ） (2025-05-02T15:05:29Z)
Multi-agents based User Values Mining for Recommendation [52.26100802380767]
効率的なユーザ値抽出のためのゼロショットマルチLLM協調フレームワークを提案する。本研究は,本質的な意味を保ちながら,項目内容のコンデンスにテキスト要約手法を適用した。幻覚を緩和するために,評価役と監督役の2つの特殊エージェントの役割を導入する。
論文参考訳（メタデータ） (2025-05-02T04:01:31Z)
Large Language Model Empowered Recommendation Meets All-domain Continual Pre-Training [60.38082979765664]
CPRecは、レコメンデーションのための全ドメイン連続事前トレーニングフレームワークである。 LLMを連続的な事前学習パラダイムを通じて、普遍的なユーザ行動と整合させる。 2つの異なるプラットフォームから5つの実世界のデータセットを実験する。
論文参考訳（メタデータ） (2025-04-11T20:01:25Z)
Review, Refine, Repeat: Understanding Iterative Decoding of AI Agents with Dynamic Evaluation and Selection [71.92083784393418]
Best-of-N (BON) サンプリングのような推論時間法は、パフォーマンスを改善するための単純で効果的な代替手段を提供する。本稿では,反復的改良と動的候補評価,検証器による選択を併用した反復的エージェント復号(IAD)を提案する。
論文参考訳（メタデータ） (2025-04-02T17:40:47Z)
Enhancing User Intent for Recommendation Systems via Large Language Models [0.0]
DUIPはLSTMネットワークとLLM(Large Language Models)を組み合わせた新しいフレームワークで、ユーザの意図を動的に把握し、パーソナライズされたアイテムレコメンデーションを生成する。この結果から,DUIPは次世代レコメンデーションシステムにとって有望なアプローチであり,クロスモーダルレコメンデーションとスケーラビリティのさらなる向上の可能性が示唆された。
論文参考訳（メタデータ） (2025-01-18T20:35:03Z)
Few-shot Steerable Alignment: Adapting Rewards and LLM Policies with Neural Processes [50.544186914115045]
大きな言語モデル(LLM)は、日々のアプリケーションにますます組み込まれています。個人ユーザの多様な嗜好との整合性を確保することは、重要な課題となっている。数発のステアライメントのための新しいフレームワークを提案する。
論文参考訳（メタデータ） (2024-12-18T16:14:59Z)
Active Preference-based Learning for Multi-dimensional Personalization [7.349038301460469]
大規模言語モデル(LLM)はタスク間で顕著な汎用性を示しているが、個々の人間の好みに合わせることは依然として困難である。複数の目的にまたがるユーザの嗜好を推定するためにバイナリフィードバックを用いた能動的嗜好学習フレームワークを提案する。モデル応答をパーソナライズする上で,言語生成タスクに関する理論的解析と実験を行い,そのフィードバック効率と有効性を示す。
論文参考訳（メタデータ） (2024-11-01T11:49:33Z)
Normalizing Energy Consumption for Hardware-Independent Evaluation [9.658615045493734]
本稿では,異なるハードウェアプラットフォーム間でのエネルギー消費の正規化手法を提案する。提案手法は,基準点数,回帰値の種類,および計算量を含めることが正規化過程に大きく影響を与えることを示す。
論文参考訳（メタデータ） (2024-09-09T13:38:00Z)
Intuition-aware Mixture-of-Rank-1-Experts for Parameter Efficient Finetuning [50.73666458313015]
大規模言語モデル(LLM)はマルチメディアアプリケーションで複数のタスクを実行する上で大きな可能性を証明している。 MoEは、効率的なタスクデカップリングのためのスパースアーキテクチャによる有望なソリューションとして登場した。 Intuition-MoR1Eは14のパブリックデータセットで優れた効率と2.15%の全体的な精度向上を実現している。
論文参考訳（メタデータ） (2024-04-13T12:14:58Z)
Large Language Models for Intent-Driven Session Recommendations [34.64421003286209]
大規模言語モデル(LLM)の高度な推論機能を活用した新しいISR手法を提案する。本稿では,プロンプトを反復的に自己表現し,調整するイノベーティブなプロンプト最適化機構を提案する。この新たなパラダイムは、LLMに対して、さまざまなユーザ意図をセマンティックレベルで識別する権限を与え、より正確で解釈可能なセッションレコメンデーションをもたらす。
論文参考訳（メタデータ） (2023-12-07T02:25:14Z)
Interactive Hyperparameter Optimization in Multi-Objective Problems via Preference Learning [65.51668094117802]
我々は多目的機械学習(ML)に適した人間中心型対話型HPO手法を提案する。ユーザが自分のニーズに最も適した指標を推測する代わりに、私たちのアプローチは自動的に適切な指標を学習します。
論文参考訳（メタデータ） (2023-09-07T09:22:05Z)
Multi-objective Deep Reinforcement Learning for Mobile Edge Computing [11.966938107719903]
モバイルエッジコンピューティング(MEC)は、遅延やエネルギー消費など、さまざまなパフォーマンス指標を優先する次世代のモバイルネットワークアプリケーションに不可欠である。本研究では,複数のエッジを持つMECにおいて,長期エネルギー消費と送信遅延を最小限に抑えるために,多目的オフロード問題を定式化する。我々は,MECシステムにおいて,複数のエッジの機能を構築するためのよく設計された状態符号化手法を導入し,遅延とエネルギー消費のユーティリティを正確に計算する洗練された報酬関数を提案する。
論文参考訳（メタデータ） (2023-07-05T16:36:42Z)
Inferring Preferences from Demonstrations in Multi-objective Reinforcement Learning: A Dynamic Weight-based Approach [0.0]
多目的意思決定において、選好推論は、異なる目的のために意思決定者の選好を推測する過程である。本研究では,多目的意思決定問題に作用するエージェントの選好を推測する動的重みに基づく選好推論アルゴリズムを提案する。
論文参考訳（メタデータ） (2023-04-27T11:55:07Z)
Latent User Intent Modeling for Sequential Recommenders [92.66888409973495]
逐次リコメンデータモデルは、プラットフォーム上での氏のインタラクション履歴に基づいて、ユーザが次に対話する可能性のあるアイテムを予測することを学習する。しかし、ほとんどのシーケンシャルなレコメンデータは、ユーザの意図に対する高いレベルの理解を欠いている。したがって、インテントモデリングはユーザー理解と長期ユーザーエクスペリエンスの最適化に不可欠である。
論文参考訳（メタデータ） (2022-11-17T19:00:24Z)
Probabilistic and Variational Recommendation Denoising [56.879165033014026]
暗黙のフィードバックから学ぶことは、推奨システムの適用において最も一般的なケースの1つである。本稿では,暗黙のフィードバックに対する確率的・変動的推薦を提案する。提案したDPIとDVAEを4つの最先端レコメンデーションモデルに適用し、3つのデータセットで実験を行う。
論文参考訳（メタデータ） (2021-05-20T08:59:44Z)
Learning to Continuously Optimize Wireless Resource In Episodically Dynamic Environment [55.91291559442884]
この研究は、データ駆動型手法が動的環境で継続的に学習し、最適化できる方法論を開発する。本稿では,無線システム学習のモデリングプロセスに連続学習の概念を構築することを提案する。我々の設計は、異なるデータサンプル間で「一定の公正性を保証する」新しいmin-maxの定式化に基づいている。
論文参考訳（メタデータ） (2020-11-16T08:24:34Z)
Learning Discrete Energy-based Models via Auxiliary-variable Local Exploration [130.89746032163106]
離散構造データに対する条件付きおよび非条件付きEMMを学習するための新しいアルゴリズムであるALOEを提案する。エネルギー関数とサンプリング器は、新しい変分型電力繰り返しにより効率よく訓練できることを示す。本稿では、ソフトウェアテストのためのエネルギーモデルガイド付ファジィザについて、libfuzzerのようなよく設計されたファジィエンジンに匹敵する性能を実現する。
論文参考訳（メタデータ） (2020-11-10T19:31:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。