論文の概要: Context-aware LLM-based AI Agents for Human-centered Energy Management Systems in Smart Buildings
- arxiv url: http://arxiv.org/abs/2512.25055v1
- Date: Wed, 31 Dec 2025 18:51:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-01 23:27:28.745255
- Title: Context-aware LLM-based AI Agents for Human-centered Energy Management Systems in Smart Buildings
- Title(参考訳): スマートビルにおける人間中心型エネルギー管理システムのための文脈認識型LLM型AIエージェント
- Authors: Tianzhi He, Farrokh Jazizadeh,
- Abstract要約: 本研究では,大規模言語モデル(LLM)に基づくビルディングエネルギー管理システム(BEMS)AIエージェントのコンセプトフレームワークとプロトタイプアセスメントを提案する。
提案フレームワークは,知覚(知覚),中枢制御(脳),行動(動作とユーザインタラクション)の3つのモジュールから構成される。
プロトタイプの性能は、4つの異なる実世界のエネルギーデータセットにわたる120のユーザクエリを用いて評価された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study presents a conceptual framework and a prototype assessment for Large Language Model (LLM)-based Building Energy Management System (BEMS) AI agents to facilitate context-aware energy management in smart buildings through natural language interaction. The proposed framework comprises three modules: perception (sensing), central control (brain), and action (actuation and user interaction), forming a closed feedback loop that captures, analyzes, and interprets energy data to respond intelligently to user queries and manage connected appliances. By leveraging the autonomous data analytics capabilities of LLMs, the BEMS AI agent seeks to offer context-aware insights into energy consumption, cost prediction, and device scheduling, thereby addressing limitations in existing energy management systems. The prototype's performance was evaluated using 120 user queries across four distinct real-world residential energy datasets and different evaluation metrics, including latency, functionality, capability, accuracy, and cost-effectiveness. The generalizability of the framework was demonstrated using ANOVA tests. The results revealed promising performance, measured by response accuracy in device control (86%), memory-related tasks (97%), scheduling and automation (74%), and energy analysis (77%), while more complex cost estimation tasks highlighted areas for improvement with an accuracy of 49%. This benchmarking study moves toward formalizing the assessment of LLM-based BEMS AI agents and identifying future research directions, emphasizing the trade-off between response accuracy and computational efficiency.
- Abstract(参考訳): 本研究では,Large Language Model (LLM) をベースとしたビルディングエネルギー管理システム (BEMS) AIエージェントのコンセプトフレームワークとプロトタイプアセスメントについて,自然言語インタラクションによるスマートな建物におけるコンテキスト認識エネルギー管理を容易にする。
提案フレームワークは、知覚(センシング)、中枢制御(脳)、行動(アクチュエータとユーザインタラクション)の3つのモジュールから構成され、クローズドなフィードバックループを形成し、ユーザクエリにインテリジェントに応答し、接続されたアプライアンスを管理するためのエネルギーデータをキャプチャ、分析、解釈する。
LLMの自律的データ分析機能を活用することで、BEMS AIエージェントは、エネルギー消費、コスト予測、デバイススケジューリングに関するコンテキスト対応の洞察を提供し、既存のエネルギー管理システムの制限に対処する。
プロトタイプのパフォーマンスは、4つの異なる現実の住宅エネルギーデータセットにわたる120のユーザクエリと、レイテンシ、機能、能力、正確性、コスト効率など、さまざまな評価指標を使用して評価された。
フレームワークの一般化性はANOVAテストを用いて実証された。
その結果、デバイス制御における応答精度(86%)、メモリ関連タスク(97%)、スケジューリングと自動化(74%)、エネルギー分析(77%)、より複雑なコスト推定タスクは49%の精度で改善すべき領域を強調した。
このベンチマーク研究は、LCMベースのBEMSAIエージェントの評価を形式化し、応答精度と計算効率のトレードオフを強調し、今後の研究方向を特定することを目的としている。
関連論文リスト
- Pareto Optimal Benchmarking of AI Models on ARM Cortex Processors for Sustainable Embedded Systems [2.584048323685663]
この研究は、浮動小数点演算(FLOP)と推論時間とのほぼ直線的相関を強調し、計算要求を推定するための信頼性のある指標を提供する。
エネルギー消費とモデル精度のトレードオフのバランスをとる方法を示し、持続可能性の損なうことなく、AIアプリケーションがパフォーマンス要件を満たすことを保証する。
この作業は開発者に対して洞察を提供し、現実のアプリケーションで高いパフォーマンスを提供するエネルギー効率のよいAIシステムの設計を指導する。
論文 参考訳(メタデータ) (2026-02-19T16:21:47Z) - Human-AI Collaboration in Large Language Model-Integrated Building Energy Management Systems: The Role of User Domain Knowledge and AI Literacy [0.0]
本研究では,ユーザドメイン知識と人工知能(AI)リテラシーがヒューマン・AI対話型建築エネルギー管理システム(BEMS)の有効利用に与える影響を理解することを目的とする。
我々は系統的なロールプレイング実験を行い、85人の被験者が高度な生成前訓練トランス(OpenAI GPT-4o)と相互作用した。
参加者は、LCM統合BEMSとして機能するGPTモデルを用いて、家庭のエネルギー消費を減少させる5つの行動変化を識別する任務を負った。
論文 参考訳(メタデータ) (2026-02-18T02:18:35Z) - SelfAI: Building a Self-Training AI System with LLM Agents [79.10991818561907]
SelfAIは、高レベルの研究目的を標準化された実験構成に変換するためのUser Agentを組み合わせた、一般的なマルチエージェントプラットフォームである。
実験マネージャは、連続的なフィードバックのための構造化知識ベースを維持しながら、異種ハードウェアをまたいだ並列かつフォールトトレラントなトレーニングを編成する。
回帰、コンピュータビジョン、科学計算、医用画像、薬物発見ベンチマークなどを通じて、SelfAIは一貫して高いパフォーマンスを達成し、冗長な試行を減らしている。
論文 参考訳(メタデータ) (2025-11-29T09:18:39Z) - GridMind: LLMs-Powered Agents for Power System Analysis and Operations [3.7568206336846663]
本稿では,大規模言語モデル(LLM)を決定論的工学的解法と統合し,対話型科学計算による電力系統解析を実現する多エージェントAIシステムを提案する。
GridMindはワークフローの統合、知識アクセシビリティ、コンテキスト保存、専門家による意思決定支援強化に対処する。
この研究は、エージェントAIを科学計算の実行可能なパラダイムとして確立し、会話インターフェースがアクセシビリティを向上し、重要なエンジニアリングアプリケーションに不可欠な数値的な厳密さを保っていることを実証する。
論文 参考訳(メタデータ) (2025-09-02T16:42:18Z) - OmniEAR: Benchmarking Agent Reasoning in Embodied Tasks [52.87238755666243]
OmniEARは,言語モデルが身体的相互作用やツールの使用,マルチエージェントの協調にどう影響するかを評価するためのフレームワークである。
我々は、家庭と工業領域にまたがる1500のシナリオにおける連続的な物理的特性と複雑な空間的関係をモデル化する。
我々の体系的な評価は、モデルが制約から推論しなければならない場合、厳しい性能劣化を示す。
論文 参考訳(メタデータ) (2025-08-07T17:54:15Z) - The Cost of Dynamic Reasoning: Demystifying AI Agents and Test-Time Scaling from an AI Infrastructure Perspective [3.0868637098088403]
大規模言語モデル(LLM)ベースのAIエージェントは最近、動的推論を採用することで、印象的な汎用性を示した。
本稿では,AIエージェントを包括的に分析し,リソース使用量,遅延動作,エネルギー消費,テストタイムスケーリング戦略を定量化する。
その結果,エージェントは計算量の増加によって精度が向上する一方で,急速に低下するリターン,レイテンシのばらつきの拡大,持続不可能なインフラストラクチャコストに悩まされていることがわかった。
論文 参考訳(メタデータ) (2025-06-04T14:37:54Z) - MLE-Dojo: Interactive Environments for Empowering LLM Agents in Machine Learning Engineering [57.156093929365255]
自律型大規模言語モデル(LLM)エージェントを体系的に強化し、評価し、改善するためのガイムスタイルのフレームワーク。
MLE-Dojoは、現実的なエンジニアリングシナリオを反映した、多様でオープンなMLEタスクを慎重にキュレートする。
完全に実行可能な環境は、教師付き微調整と強化学習の両方を通して包括的なエージェントトレーニングをサポートする。
論文 参考訳(メタデータ) (2025-05-12T17:35:43Z) - Edge-Cloud Collaborative Computing on Distributed Intelligence and Model Optimization: A Survey [58.50944604905037]
エッジクラウドコラボレーティブコンピューティング(ECCC)は、現代のインテリジェントアプリケーションの計算要求に対処するための重要なパラダイムとして登場した。
AIの最近の進歩、特にディープラーニングと大規模言語モデル(LLM)は、これらの分散システムの能力を劇的に向上させてきた。
この調査は、基本的なアーキテクチャ、技術の実現、新しいアプリケーションに関する構造化されたチュートリアルを提供する。
論文 参考訳(メタデータ) (2025-05-03T13:55:38Z) - TMIQ: Quantifying Test and Measurement Domain Intelligence in Large Language Models [0.0]
大規模言語モデル(LLM)を定量的に評価するベンチマークであるTMIQ(Test and Measurement Intelligence Quotient)を導入する。
TMIQは、SCPIコマンドマッチング精度、ランク付けされた応答評価、Chain-of-Thought Reasoning (CoT)など、詳細な評価のための包括的なシナリオとメトリクスを提供する。
各種LSMの試験では, SCPIコマンドマッチング精度は56%から73%, 一致した第1位スコアは約33%であった。
論文 参考訳(メタデータ) (2025-03-03T23:12:49Z) - AI-in-the-Loop Sensing and Communication Joint Design for Edge Intelligence [65.29835430845893]
本稿では,AI-in-the-loopジョイントセンシングと通信によるエッジインテリジェンス向上のためのフレームワークを提案する。
私たちの研究の重要な貢献は、バリデーション損失とシステムのチューニング可能なパラメータとの間に明確な関係を確立することです。
提案手法は, 通信エネルギー消費を最大77%削減し, 試料数で測定した検知コストを最大52%削減する。
論文 参考訳(メタデータ) (2025-02-14T14:56:58Z) - BiTSA: Leveraging Time Series Foundation Model for Building Energy Analytics [15.525789412274587]
本稿では対話型可視化ツールBiTSAの設計について述べる。
このツールは、マネージャが複雑なエネルギーデータを素早く解釈し、リアルタイムの洞察に基づいて、即座にデータ駆動のアクションを取ることを可能にする。
論文 参考訳(メタデータ) (2024-11-20T23:49:06Z) - A Comprehensive Review on the NILM Algorithms for Energy Disaggregation [0.0]
非侵入負荷モニタリング(NILM)またはエネルギー分散は、集合レベルで測定された家庭用エネルギーを構成機器に分離することを目的としている。
本稿では、効果的なNILMシステムフレームワークの調査を行い、ベンチマークアルゴリズムのパフォーマンスをレビューする。
論文 参考訳(メタデータ) (2021-02-20T23:53:57Z) - Multi-Agent Meta-Reinforcement Learning for Self-Powered and Sustainable
Edge Computing Systems [87.4519172058185]
エッジコンピューティング機能を有するセルフパワー無線ネットワークの効率的なエネルギー分配機構について検討した。
定式化問題を解くために,新しいマルチエージェントメタ強化学習(MAMRL)フレームワークを提案する。
実験の結果、提案されたMAMRLモデルは、再生不可能なエネルギー使用量を最大11%削減し、エネルギーコストを22.4%削減できることが示された。
論文 参考訳(メタデータ) (2020-02-20T04:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。